Reconnaissance faciale : Face ID n’alimente pas les bases de données informelles
Les recherches sur la reconnaissance faciale s’intensifient, menées par quelques uns des GAFA et des sociétés spécialisées. Les débouchés sont nombreux, de la surveillance au marketing ciblé, et poussent nombre d’entreprises à constituer des bases de données gigantesques et informelles afin d’améliorer les algorithmes et les IA spécialisés dans la détection des visages. Une étude fait le point sur l’évolution rapide d’un secteur qui navigue en eau profonde et en marge souvent de la légalité la plus stricte.
Les conclusions du rapport sont claires : Facebook et Google auraient constitué les plus importantes bases de données faciales disponibles dans le monde, mais Microsoft n’est pas en reste avec sa base de données MS Celeb constituée des millions d’images de près de 100 000 individus; la plupart des personnes recensées dans cette base sont des célébrités (du cinéma, de la chanson, etc.), mais l’on y trouve aussi des activistes… qui travaillent notamment dans le domaine de la sécurité informatique ! Microsoft disposerait aussi d’une énorme base de donnée en partage avec l’Université de Standford; des dizaines de millions de clichés y seraient recensés. Sous la pression d’associations et de groupes de citoyens, Microsoft et Standford avaient arrêté de distribuer ces bases de données à des sociétés tierces.
Plus petite mais tout aussi consommatrice de datas, la startup Clarifai a pioché dans les bases de données du site de rencontre OKCupid pour alimenter et perfectionner ses logiciels de reconnaissance; les photos récupérées sont ensuite ingurgitées dans un système de Deep Learning, l’objectif étant de pouvoir identifier le sexe ou l’origine ethnique des individus (les américains parlent même de « races »). Par la suite, Clarifai avait tenté de récupérer les images d’Insecam (regroupant les données de caméras de surveillance privées ou publiques), mais a du renoncer à son « projet », là encore sous la pression du public.
Et Apple dans tout ça ? La firme de Cupertino reçoit ici un satisfecit; Face ID traite en effet les données faciales en local, et n’envoie rien sur des serveurs distants. De plus, le californien ne vit pas de la collecte et du traitement des données personnelles. En conséquence, Apple est totalement absent de ce nouveau marché de la reconnaissance faciale de masse, et s’appuie principalement sur la puissance de ses processeurs mobiles pour faire le travail d’analyse; mais comment affiner des algorithmes de reconnaissance sans l’utilisation de base de données massives ? Une tentative d’explications: à partir du moment où il s’agit non pas de catégoriser les visages (origine, sexe) mais de se limiter à la seule reconnaissance (« match » entre le visage de l’utilisateur et le nuage de points 3D stockés dans l’iPhone), Apple peut sans doute se passer de ces bases de données monumentales…
Cela semble cohérent avec le discours « tout se passe dans votre iPhone » au moins pour FaceiD et TouchiD
Comme Apple s’oriente de plus en plus sur le service, j’ai des doutes si ils vont bien continuer dans cette voie.
Le service vidéo à venir sera comme les autres : ils revendront nos profils de spectateur aux partenaires.
EN tant qu’expert du domaine, non, le fait de se limiter à une fonction d’authentification (vérifier l’identité, et non trouver l’identité parmi des millions de personnes) ne vous permet pas de vous passer de bases de données de taille très significative, en particulier lorsqu’on prétend atteindre des niveaux de faux positifs (FAR pour les initiés) de l’ordre de 1 pour 1 million.
Par ailleurs cette base de données doit avoir été constituée avec un capteur type FaceID, donc ils n’ont pas pu la récupérer ailleurs, ils ont du la collecter eux-même. Quand, auprès de qui, mystère, mais clairement, cette base existait avant la commercialisation de l’iPhone X.