A Google DeepMind está revolucionando o treinamento de robôs com dois novos modelos de inteligência artificial baseados no Gemini 2.0. Esses sistemas, chamados Gemini Robotics e Gemini Robotics-ER, prometem capacitar robôs para realizar tarefas complexas, como fazer origami e manipular objetos com precisão, além de se adaptarem a novos ambientes e instruções.
Para ser eficaz, a IA robótica precisa atender a três requisitos principais: adaptabilidade, interatividade e destreza. O Gemini Robotics avança significativamente nessas áreas, utilizando as capacidades do Gemini para generalizar situações e executar tarefas mesmo sem treinamento específico. Ele permite que robôs lidem com novos objetos, ambientes e instruções em linguagem natural, ajustando-se a mudanças no entorno.
Um dos destaques do modelo é sua capacidade de realizar tarefas complexas e de múltiplos passos, como manipulação precisa de objetos. Treinado com dados da plataforma ALOHA 2, o Gemini Robotics já demonstrou eficácia em robôs de dois braços e pode ser adaptado para sistemas mais avançados, como o Apollo, da Apptronik.
A DeepMind afirma que o Gemini Robotics-ER complementa o modelo principal, oferecendo suporte adicional para tarefas que exigem maior interação e precisão. Juntos, esses sistemas representam um avanço significativo na robótica, abrindo caminho para assistentes robóticos mais inteligentes e versáteis.