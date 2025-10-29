Malgré les (nombreux) obstacles, Apple poursuit son offensive dans le domaine de l’intelligence artificielle : le géant de Cupertino vient de rendre public Pico-Banana-400K, un vaste jeu de données composé de 400 000 images destiné à la recherche sur l’édition d’images guidée par texte. Ce projet, développé par l’équipe Apple Research, s’appuie sur les modèles Gemini 2.5 de Google pour générer et valider les images, une collaboration technologique pour le moins inattendue entre les deux rivaux américains.

Disponible sous licence non commerciale, le jeu de données est ouvert à la communauté scientifique pour nourrir la recherche en IA, à condition de ne pas être exploité à des fins commerciales. L’objectif affiché d’Apple est de pallier le manque de jeux de données de qualité dans le domaine, un obstacle qui freine le développement de modèles d’édition d’images réellement performants.

Une base d’apprentissage inédite pour les modèles visuels

Pour concevoir Pico-Banana-400K, Apple a sélectionné des photos issues d’OpenImages, couvrant humains, objets et scènes textuelles. Les chercheurs ont ensuite défini 35 types de transformations — ajout de filtres, modification des conditions météo, déplacement d’objets, ou encore zooms localisés — regroupées en huit catégories. Chaque image a ensuite été traitée par le modèle de Google, puis évaluée automatiquement pour garantir la cohérence et la qualité finale de la génération.

Apple espère sans doute que Pico-Banana-400K servira de référence pour entraîner les futurs modèles d’édition visuelle capables de comprendre et d’exécuter des instructions complexes avec précision. Reste à voir si et surtout quand la firme de Cupertino entrainera sa propre IA avec cette énorme base de données. On imagine mal en effet Apple se satisfaire longtemps d’appuyer ses recherches en IA sur un générateur tiers…