Avec le rachat de VocalIQ, Apple continue à priori d’affiner les performances de Siri, l’assistant d’iOS. Sur le papier, VocalIQ n’est « que » l’acquisition d’un start-up de plus, spécialisée cette fois dans des interfaces homme-machine plus « naturelles »; l’air est déjà connu semble t-il : Siri n’était-il pas issu à l’origine des recherches menées sur le projet CALO du DARPA, recherches qui avaient déjà pour objectif d’aboutir à un langage naturel et contextualisé ?

Pourtant, en y regardant de plus près, on s’aperçoit rapidement que l’ambition est bien plus élevée chez les chercheurs de VocalIQ, tous issus de Cambridge (là même où ont enseigné des légendes comme Wittgenstein ou Stephen Hawking). Les scientifiques qui gravitent autour des travaux de VocalIQ ont en effet une ambition déclarée : révolutionner les interfaces homme-machine par l’utilisation de la voix autant que ce qu’avait pu faire Apple avec l’interface graphique du Mac.

Siri iOS 9 iPhone 6

Le blog de VocalIQ affiche d’ailleurs clairement les intentions de la start-up ainsi que des points de vue plutôt très critiques sur les assistants vocaux actuels. : « La bataille pour les interfaces graphiques est terminée. Apple a gagné. Le reste, Android, Windows Phone ainsi que d’autres plateformes basées sur Linux sont, au mieux, de pâles copies. A moins d’un bouleversement tectonique dans le développement des UI, les positions actuelles du marché mobile (et la répartition des bénéfices) devraient perdurer dans le futur.[…]. La prochaine grande bataille des interfaces homme-machine se déroulera sur le terrain des interfaces vocales.[…] Toutes les principales entreprises de technologie ont dépensé des milliards de dollars pour mettre sur pied des services comme Siri, Google Now, Cortana ou Alexa. Tous (ces services, Ndlr) ont été lancés en grande pompe et ont promis de grandes choses pour au final échouer à atteindre les attentes des consommateurs. Certaines d’entre-elles finissent par être utilisées comme des jouets, à l’instar de Siri. Le reste a été oublié. Sans surprise. »

ex-machina-meeting-ava-680x380

Ex-Machina : avant de discuter avec une androïde, nous parlerons sans doute « banalement » à notre smartphone 

Et VocalIQ d’énumérer les faiblesses principales des assistants actuels, dont l’incapacité à se rendre compte quand une action demandée n’a aucun sens dans le contexte, ce qui empêche aussi ces assistants de demander toute clarification de la question posée (comme on le ferait pourtant dans une véritable discussion). Pour VocalIQ, le principal responsable des réactions incohérentes des « IA » actuelles tient justement au fait que ce ne sont pas du tout de vraies IA, capables d’analyser le contexte d’un dialogue avec un interlocuteur « Elles ne savent pas qu’elles ne savent pas » conclut abruptement ce papier sans concessions. Pour VocalIQ, Apple, Google et Microsoft auraient confondu la reconnaissance vocale (qui s’est en effet considérablement améliorée) avec la capacité à soutenir une véritable conversation et à apprendre des conversations passées, qui sont au final les seules compétences réelles qui pourraient pousser les utilisateurs à utiliser en masse ces interfaces vocales.

vocaliq-800x389

VocalIQ promet de changer « la façon dont nous parlons avec les machines »

Pour VocalIQ, et sans doute avec raison, il ne fait aucun doute que la première entreprise de technologie qui se dotera d’un vrai système conversationnel – plus proche de celui du film Her que des synthèses primitives actuelles – tiendra le marché technologique dans sa main. Mais plus important encore pour Apple, VocalIQ possèderait déjà certaines des technologies logicielles permettant d’obtenir de tels résultats. Un Siri-Jarvis ultra-efficace et capable de discuter avec l’utilisateur comme le ferait un collègue de bureau serait aussi pour Apple un autre moyen de couper l’herbe sous les pieds à Google; qui en effet voudra encore passer par un champ de recherche sur une page Google s’il n’y a qu’à en faire simplement la demande à son IA-compagnon ? Dans le domaine des voitures électriques, visiblement le nouveau cheval de bataille d’Apple, une interface vocale ultra-évoluée pourrait s’intégrer parfaitement dans un habitacle où les mains se doivent de rester sur le volant; même dans un véhicule 100% autonome à la Google Car, l’IA vocale peut encore servir à indiquer la destination, lancer des fonctions simples ou tout simplement « faire la conversation » avec la personne durant le trajet.

Her_loading_helix

La dernière animation de Siri rappelle étrangement celle de Her; un indice pour un assistant vraiment conversationnel ?

Pendant que Google travaille pour affiner la pertinence des réponses grâce aux technos du big datas, Apple s’orienterait donc dans la voie qui lui a toujours réussi : l’interface la plus intuitive possible, la plus simple pour l’utilisateur (même la fonction logicielle la plus riche et la plus pertinente s’avère inutile si l’on ne s’en sert pas). Et quoi de plus « simple » que de parler à une machine comme on  le ferait avec un vrai compagnon virtuel ? Une telle évolution de Siri placerait l’assistant numérique en position centrale, au coeur même d’iOS, et surtout, pourrait permettre à Apple de reprendre une grosse longueur d’avance sur la concurrence…