Alex Acero, le Directeur du projet Siri chez Apple, sait qu’il a du pain sur la planche; le cadre d’Apple remonte désormais toutes les informations à Craig Federighi, ce qui prouve par ailleurs que Siri est maintenant au même niveau d’importance qu’iOS, dont Federighi est le grand organisateur. Critiqué depuis quelques années pour le manque de pertinence de certaines de ses réponses et son « inculture » sur des évènements de société récents, Siri est pourtant en passe de faire sa mue; en fait, celle-ci a déjà commencé.

La transformation de Siri passe par une révélation: lorsqu’Alex Acero récupère la gestion de l’assistant, ce dernier re-visionne le film Her de Spike Jonze, où une IA vocale (interprétée par l’actrice Scarlett Johansson) fait littéralement tourner la tête à un célibataire encore meurtri par une séparation récente. Acero prend alors une décision qui va à l’encontre du mantra habituel d’Apple concernant les synthèses vocales : le prochain Siri devra parler de façon naturelle, et sans aucun timbre robotique, alors que depuis la démo historique du premier Mac Apple a toujours souhaité que les voix numériques connotent leur origine artificielle avec un timbre légèrement robotisé. Sous iOS 11, dans sa version américaine, Siri parle en effet de façon bien plus naturelle et humaine, observant des temps de pause et modulant son intonation en fonction des types de phrases (interrogatives, exclamatives etc…).

Mais ce n’est qu’une première étape, et Acero explique au site Wired que le plus dur a presque déjà été fait, qui consistait à se débarrasser de la dépendance au logiciel de reconnaissance vocale de Nuance. Car c’est à cause de la clause de contrat signée avec Nuance que longtemps Siri n’a pas pu s’ouvrir aux développeurs. Contrairement à ce que beaucoup imaginaient alors, cette « fermeture » ne venait pas d’Apple mais des contraintes rattachées à la technologie d’un tiers.  Greg Joswiak, VP du marketing produit chez Apple,  expliquera plus tard que c’était comme « participer à une course pendant que quelqu’un vous tirait vers l’arrière« . Comme souvent, Apple est sorti de cette situation par le haut, en développant sa propre technologie de reconnaissance vocale.

Libéré de sa tutelle avec Nuance, Apple a pu travailler dans son coin sa propre solution basée cette fois sur le Deep-Learning et l’Intelligence artificielle, la vraie, et c’est encore une fois sous iOS 11 que l’on devrait le mieux mesurer les résultats de ces efforts (qui sont déjà à l’oeuvre pour la reconnaissance de formes dans Photos). Apple a même mis en place un super-calculateur semblable à ceux utilisés par Google pour gérer son propre assistant vocal (Google Assistant). Siri est donc en train de passer à l’âge adulte au moment où l’IA d’Apple continue de dominer les débats en volume : 375 millions d’utilisateurs iOS utilisent quotidiennement Siri, un score bien plus élevé que le nombre cumulé d’utilisateurs se servant d’Alexa ou de Google Assistant. Il faut dire que Siri est déjà disponible en 24 langues réparties sur 36 pays, un atout réel qui peinait pourtant à cacher les faiblesses technologiques de l’IA d’Apple. Les efforts du californien commencent cependant à payer : une étude récente dévoile que la reconnaissance vocale de Siri (celle développée cette fois par Apple) parvient à déchiffrer 95% des messages vocaux reçus, pourcentage supérieur à ceux de la concurrence. Ne reste plus qu’à rendre Siri beaucoup plus pertinent dans ses réponses, et à convaincre 625 millions d’utilisateurs iOS que cela vaut vraiment la peine de l’utiliser… Siri 2.0 sera t-il prêt à temps pour iOS 11 ?