L’équipe de recherche en intelligence artificielle d’Apple serait sur le point de réaliser une avancée majeure qui permettrait d’ intégrer des modèles de langage massifs (LLMs) tels que ChatGPT dans les iPhones et autres devices Apple, et ce malgré les limitations de mémoire et de stockage de ces appareils. Cette percée, décrite dans l’article de recherche « LLM in a flash: Efficient Large Language Model Inference with Limited Memory« , repose sur une utilisation novatrice de la mémoire flash, utilisée cette fois pour la conservation des données nécessaires à l’IA.

Pour contextualiser l’exploit que pourrait avoir réalisé les équipes d’Apple, il faut rappeler que les LLMs sont réputés pour leur (très) forte consommation de données et de mémoire, ce qui pose un défi considérable lorsqu’il s’agit de déployer ces mêmes modèles de langage en local, sur des appareils à mémoire limitée comme les iPhones. La technique innovante d’Apple tire parti de la mémoire flash, et permet de dépasser les limitations de la RAM. Cette méthode repose sur deux stratégies clés : le « windowing » et le regroupement en lignes et colonnes. Le « windowing » permet au modèle d’IA de recycler et de réutiliser les données déjà traitées, réduisant le besoin de solliciter constamment la mémoire. En parallèle, le regroupement en lignes et colonnes organise les données de manière plus efficace, permettant une lecture plus rapide depuis la mémoire flash et accélérant ainsi la capacité de traitement linguistique de l’IA. La conjonction de ces deux méthodes permet aux modèles d’IA de fonctionner efficacement sur les appareils, et double virtuellement la taille de la mémoire disponible (de l’iPhone, iPad, du Mac, etc.). Les améliorations de performance sont significatives, avec une accélération de 4 à 5 fois sur les processeurs standards et de 20 à 25 fois avec des processeurs graphiques.

Cette avancée ouvre possiblement une nouvelle ère pour l’iPhone. Siri devrait ainsi s’améliorer de façon plus que substantielle, avec peut-être des applications de traduction en temps réel, ou des fonctionnalités sophistiquées pilotées par l’IA, notamment en photographie ou pour tout ce qui touche à la réalité augmentée. L’objectif principal d’Apple serait toujours de finaliser une IA générative (« AJAX » ou « Apple GPT ») avec pas moins de avec 200 milliards de paramètres, qui pourrait rivaliser avec le chatGPT 4 d’OpenAI. Cette IA intègrerait iOS 18 et serait donc l’une des fonctionnalités principales des iPhone 16 et 16 Pro.