L’équipe de recherche en intelligence artificielle d’Apple vient de dévoiler Depth Pro, un modèle avancé capable de générer des cartes de profondeur 3D à partir d’images 2D en seulement 0,3 seconde ! Ce outil d’estimation de la profondeur « monoculaire » élimine la nécessité de récupérer des données vidéo traditionnelles pour produire des cartes 3D précises et en haute résolution, avec même des détails tels que les cheveux et la végétation. La capacité du modèle à estimer à la fois la profondeur relative et absolue en fait un atout majeur pour des industries comme la réalité augmentée (AR) et les véhicules autonomes, où la perception spatiale en temps réel est cruciale.

L’une des caractéristiques clés de Depth Pro est sa capacité d’apprentissage « zero-shot learning », lui permettant de fonctionner sur un large éventail d’images sans nécessiter de métadonnées spécifiques. Cette polyvalence le rend adapté à de nombreuses applications, de l’amélioration des expériences e-commerce à l’optimisation des systèmes de navigation pour les voitures autonomes. En générant des cartes de profondeur métriques fournissant des mesures réelles, Depth Pro pourrait réduire considérablement le temps et les coûts associés à la formation des modèles d’IA traditionnels. Son impact potentiel couvre plusieurs secteurs, notamment la robotique, les soins de santé et la reconstruction 3D.

Apple a rendu Depth Pro open-source, permettant ainsi aux développeurs et chercheurs d’explorer et de perfectionner davantage le modèle. Grâce à sa rapidité, sa précision et sa capacité à gérer des défis complexes en matière d’estimation de la profondeur, comme les « pixels flottants », Depth Pro établit une nouvelle norme dans le domaine. Alors que les industries se tournent de plus en plus vers l’IA pour la prise de décision et l’innovation, les applications concrètes de Depth Pro pourraient transformer la manière dont les machines et les humains interagissent avec les environnements 3D, en le positionnant comme un outil clé pour l’avenir de la technologie pilotée par l’IA.