Alex Cheema est le fondateur d’EXO Labs, une entreprise spécialisée dans l’IA et axée sur le développement de systèmes d’IA fonctionnant localement sur des appareils que les utilisateurs possèdent et contrôlent. Apple a fourni au startupper deux Mac Studio M3 Ultra, chacun équipé de 512 Go de mémoire unifiée. En moins d’une journée, Alex Cheema a connecté ces deux machines via Thunderbolt 5 et a réussi à faire tourner l’intégralité du modèle DeepSeek R1 directement en local ! L’IA chinoise n’est certes pas la plus gourmande en ressources, mais la prouesse technologique est réelle.

On pourrait arguer que l’équipement en Mac nécessaire à ce portage en local coûte environ 20 000 dollars, mais il n’existe à ce jour aucune autre solution permettant d’exécuter DeepSeek R1 pour un tarif aussi bas. Cet avantage exclusif aux Mac est évidemment rendu possible grâce aux performances de la puce Apple Silicon et à l’architecture de mémoire unifiée d’Apple, qui permet aux cœurs GPU et CPU d’accéder à la même RAM. Ces excellents résultats pourraient donner au Mac un atout de poids dans la bataille des IA, et ce malgré le retard assez honteux d’Apple Intelligence.