Google lance un modèle d'IA qui permet aux robots de chercher sur le web avant d'agir

Google DeepMind vient de franchir une étape majeure dans l’évolution de la robotique autonome en dévoilant deux modèles innovants : Gemini Robotics 1.5 et Gemini Robotics‑ER 1.5. Ces systèmes confèrent aux robots une capacité inédite : raisonner, planifier et exploiter le Web pour collecter des informations pertinentes avant d’agir dans le monde physique.
Le modèle Gemini Robotics‑ER 1.5 joue le rôle de cerveau numérique. Il structure ses actions en étapes logiques, utilise des outils numériques comme la recherche web, et génère des plans multipas pour répondre à des consignes complexes. En complément, Gemini Robotics 1.5, un modèle "vision-langage-action" (VLA), permet aux robots de traduire des instructions textuelles et visuelles en gestes concrets, exécutés dans leur environnement.
Cette approche transforme les robots en véritables agents intelligents. Contrairement aux anciens systèmes réactifs, ces modèles peuvent désormais penser avant d’agir, anticipant les conséquences de leurs actions et recherchant des informations externes en temps réel. Par exemple, un robot peut consulter les règles locales de tri des déchets ou vérifier la météo avant de préparer une valise adaptée.
Autre force de la technologie : sa polyvalence. Les modèles sont conçus pour s’adapter à une grande variété de formes robotiques (robots humanoïdes, bras automatisés…), et leurs connaissances peuvent être transférées d’un robot à un autre. De plus, cette solution est partiellement accessible : Gemini‑ER 1.5 est déjà disponible via l’API Gemini dans Google AI Studio, tandis que Gemini Robotics 1.5 reste pour le moment réservé à des partenaires sélectionnés.
Cette nouvelle génération de robots pose les bases d’une robotique plus flexible, transparente et évolutive. En permettant une prise de décision explicable en langage naturel, elle renforce la confiance et l’adaptabilité des machines dans des environnements complexes et dynamiques. Google marque ainsi une avancée stratégique dans la course à l’intelligence artificielle incarnée.
Pour aller plus loin sur le sujet, voici une sélection d’articles et de sources à consulter :
Image de https://unsplash.com/fr/photos/le-logo-google-est-affiche-devant-un-fond-noir-V8F_kUzqk0w