Lors de sa dernière Google I/O, c’est un Sundar Pichai particulièrement fringuant qui a dévoilé devant un public ébahi l’une des démos technologiques les plus spectaculaires de ces dernières années. Sur un écran géant, Google fait la démonstration de Duplex, un système d’IA capable de reproduire à la quasi perfection la voix humaine. Les quelques exemples servant à illustrer les capacités de l’IA ont de quoi ravir les amateurs de S.F; ainsi, Duplex « appelle » un salon de coiffure afin de réserver une coupe; la discussion s’enchaine et la personne à l’autre bout du « fil » réagit comme si elle avait bien affaire à un être humain et non pas à une intelligence artificielle. La confusion est cette fois totale, tout comme l’impression d’assister enfin à la naissance de la toute première véritable intelligence artificielle.

Les esprits s’enflamment (légitimement) à la suite de cette démonstration de force de Google, et comme on pouvait s’y attendre, certains commentateurs ont jugé bon de faire une (cruelle) comparaison avec Siri, l’assistant mobile d’Apple. La vidéo parodique ci-dessous est certes hilarante, mais sur le fond, elle établit une comparaison entre deux technologies qui n’ont pas grand chose en commun; tout d’abord, Duplex est un prototype, le proof-of-concept de ce qu’il est possible de faire pour une utilisation bien ciblée de l’IA; difficile de s’en rendre compte immédiatement puisque Google a choisi de montrer le fonctionnement de Duplex au travers de l’interface habituelle de Google Assistant. C’est logique : à terme, Google Assistant bénéficiera certainement d’une IA aux capacités conversationnelles aussi poussées; à terme; car aujourd’hui ce n’est pas encore le cas, et l’on oublie un peu vite que l’on compare ici un prototype de logiciel d’IA à un assistant déjà opérationnel sur des centaines de millions d’appareils.

La seconde erreur de jugement est d’ordre technologique. Duplex est extrêmement doué pour réserver des services au téléphone, et pour cause : il a été spécifiquement entrainé pour cela, grâce à des technologies logicielles de machine learning empruntées à Deepmind; tout comme AlphaGo, Duplex est pratiquement sans failles dans son domaine de prédilection, mais ne peut rien faire en dehors de son hyper spécialisation; demandez donc la météo à AlphaGo, et il vous répondra par un silence (même pas) gêné. Le fait que Duplex imite parfaitement la voix humaine dans une situation donnée ne signifie pas que le système de Google serait réellement capable de tenir une conversation à bâtons rompus, mais un anthropomorphisme « instinctif » nous donne l’illusion inverse.

C’est ce même anthropomorphisme qui a fait dire à nombre d’analystes après la keynote que l’on se dirigeait vers un monde terrifiant où le « faux » pourrait prendre l’apparence du « vrai », où la transparence serait mise à mal par des IA « truqueuses ». Google a réagi en jurant que Duplex s’identifierait avant tout début de conversation, mais la crainte de voir surgir une IA de type Hal a largement dominé les débats outre-atlantique, ce qui a renforcé l’illusion, vraiment fausse elle, qu’on était déjà arrivé au stade de l’IA parfaite. Pourtant, on en est encore loin, ce qu’a d’ailleurs pris soin de préciser un porte parole de Google au journal The Verge. Dans les grandes lignes, l’état de l’art est actuellement celui-ci : des IA hyper spécialisées et extrêmement efficaces dans un domaine restreint (ici les réservations au téléphone, le jeu de Go pour AlphaGo ou le Jeopardy pour Watson par exemple) ou des IA « pluri-disciplinaires » mais incapables d’approfondissement (comme tous les assistants mobiles actuels, qui parlent souvent de tout… mais surtout de rien). Google ne le sait que trop bien et précise déjà qu’il devra recevoir de très nombreux feedbacks des utilisateurs avant de pouvoir transformer Duplex en un logiciel réellement exploitable pour le grand public.

Le projet Ara : une démonstration de la capacité d’innovation de Google, mais aussi au final, un projet avorté

L’autre erreur de jugement est plus « classique », et a pour origine les modes de communication d’Apple et de Google. Cupertino ne montre jamais ce qui se trame dans ses labos, même s’il s’est récemment ouvert aux standards de la communication scientifique en publiant des textes de recherche (plutôt pointus par ailleurs); Google fait tout l’inverse, et médiatise les moindres avancées de ses ingénieurs-chercheurs; cela vaut aussi pour les produits en préparation; Google dévoile le projet de smartphone Ara modulaire… avant de l’abandonner en rase campagne; idem concernant les SmartGlass, qui n’ont jamais été vendues dans une version finale à destination du grand public. Malgré ces échecs, Google donne toujours l’impression d’être à la pointe de la technologie en sur-communicant sur ses différents projets internes. A contrario, Apple garde l’art de la surprise : l’iPhone de 2007, l’annonce de Siri, le premier processeur mobile 64 bits, le premier GPU Apple avec l’iPhone X, toutes ces nouveautés sont annoncées quasi en même temps que leur date de commercialisation; entre chacune de ces annonces, Apple donne l’impression de doucement ronronner, puisque rien ne sort des labos de la firme…

Au premier plan et devant l' »anneau », le nouveau centre de recherche d’Apple, qui englouti désormais plus de 12 milliards de dollars par an 

Pourtant, et concernant l’IA, ce n’est pas parce qu’Apple ne montre rien de ce qu’il fait en coulisse… que rien ne se fait en coulisses ; les centaines d’embauche dans le domaine de l’IA, de la psychologie cognitive ou des sciences du langage sont les signes au contraire d’un vaste remue ménage au sein de l’entreprise, qui aurait pris conscience de l’importance de l’IA au point d’y consacrer d’énorme ressources internes. Apple travaillerait depuis deux ans sur une immense ferme de serveurs consacrée au Machine Learning, mais Siri ne bénéficierait encore qu’à la toute petite marge de ces évolutions. Sur le fond, on ne sait donc rien de l’écart technologique réel qui sépare Google d’Apple dans le domaine de l’IA, même si la réaction tardive d’Apple et la vague récente d’embauches laissent clairement comprendre que Google a pris la pôle dans ce secteur. De là à mettre un bonnet d’âne sur la tête de Siri, c’est sans doute aller un peu vite en besogne…