Pour entraîner Apple Intelligence, Apple a utilisé les contenus de plusieurs plateformes, dont YouTube. Le problème est que les YouTubeurs n’ont pas donné leurs accords pour cette utilisation de leurs données. Il se trouve qu’Apple n’est pas le seul groupe sachant que Nvidia, Salesforce, Anthropic et d’autres sont dans la même situation.

Apple Intelligence Fonctionnalites Logo

Un problème de droits pour entraîner l’IA d’Apple et d’autres

Selon Wired, Apple et les autres ont entraîné leur IA respective à l’aide des sous-titres disponibles sur les vidéos YouTube. Cela a concerné plus de 170 000 (173 536 pour être précis) vidéos, dont des contenus technologiques comme ceux de Marques Brownlee (MKBHD). Mais les créateurs n’ont pas été informés et ont encore moins donné leur feu vert.

Le problème ne vient en réalité pas d’Apple directement. En effet, les téléchargements ont été effectués par une organisation à but non lucratif appelée EleutherAI, qui affirme aider les développeurs à former des modèles d’intelligence artificielle. Bien que l’objectif semble avoir été de fournir du matériel de formation aux petits développeurs et aux universitaires, l’ensemble de données a également été utilisé par plusieurs géants de la technologie, dont Apple.

L’ensemble de données fait partie d’une compilation que l’organisation à but non lucratif publie sous le nom de Pile. Apple, Nvidia et les autres décrivent dans leurs documents de recherche comment ils ont utilisé Pile pour entraîner l’IA. Des documents montrent également qu’Apple a utilisé Pile pour entraîner OpenELM, un modèle publié en avril, quelques semaines avant que l’entreprise ne révèle qu’elle allait ajouter de nouvelles capacités d’IA aux iPhone et aux Mac.

La collecte de données sur YouTube ne vient donc pas d’Apple directement, mais d’EleutherAI. C’est ce groupe qui n’a pas respecté les conditions d’utilisation du service de vidéo.

Wired a contacté Apple pour avoir un commentaire, mais la société n’a pas réagi pour le moment.