vendredi, août 29, 2025
AccueilTechnologiesUn robot apprend à retourner un œuf en observant une vidéo :...

Un robot apprend à retourner un œuf en observant une vidéo : L’intelligence artificielle franchit un cap majeur en robotique

La fascination pour les robots ne s’est jamais démentie, mais leur efficacité dans des environnements quotidiens reste limitée. Pourtant, une avancée significative pourrait transformer notre perception de ces machines. Alors, comment un robot peut-il apprendre à cuisiner un œuf ou à clouer un objet simplement en observant des vidéos ?

Les robots ont longtemps été perçus comme des machines exécutant des tâches avec une précision redoutable, notamment dans les usines. Cependant, leur performance en dehors de ces environnements contrôlés est souvent limitée. En effet, la plupart d’entre eux peinent à s’adapter à des situations imprévues, comme un changement de position de la caméra ou la présence d’objets supplémentaires. En revanche, un être humain, face à un défi culinaire, utilise intuitivement les outils à sa disposition, adaptant ses gestes et ses actions en fonction du contexte. Cette flexibilité, que nous avons développée par l’apprentissage par l’observation, a inspiré une équipe de chercheurs de l’Université de l’Illinois à Urbana-Champaign et de l’Université de Columbia.

L’usine la plus productive au monde fabrique une voiture toutes les 10 secondes : Ce géant indien détrône la Chine et l’Europe

Dans leurs travaux, ils ont démontré qu’un robot pouvait accomplir des tâches variées, telles que retourner un œuf dans une poêle ou clouer un clou, simplement en observant des vidéos d’humains réalisant ces actions. Contrairement aux méthodes traditionnelles qui nécessitent une programmation minutieuse, ce système d’apprentissage par imitation laisse place à une plus grande autonomie. Les implications de cette découverte sont vastes, non seulement pour la robotique, mais aussi pour les applications domestiques et industrielles. Pourra-t-on bientôt voir des robots cuisiner dans nos cuisines, aidant à préparer nos plats favoris ?

Une approche novatrice : « Outil comme interface »

Les chercheurs ont nommé leur méthode « Outil comme interface » (Tool-as-Interface), qui met l’accent sur l’instrument utilisé plutôt que sur la main qui l’actionne. Ce principe est fondamental : au lieu de tenter de reproduire les gestes humains, le robot apprend à comprendre comment interagir avec l’outil et l’objet. En d’autres termes, la clé réside dans la capacité à apprendre la trajectoire et l’orientation des objets manipulés, indépendamment des différences morphologiques entre l’homme et la machine.

Pour entraîner le robot, il suffit de filmer l’action à partir de deux caméras. Ces deux angles permettent de recréer une scène en 3D à l’aide d’un modèle de vision appelé MASt3R. De plus, une technique nommée « 3D Gaussian splatting » génère des perspectives supplémentaires, permettant ainsi au robot de visualiser la tâche sous différents angles. Ce système est conçu pour fonctionner même lorsque la caméra bouge, garantissant ainsi une certaine stabilité dans l’apprentissage. Contrairement aux systèmes traditionnels qui nécessitent des capteurs coûteux ou des environnements rigides, cette méthode est à la fois plus accessible et moins onéreuse.

Un aspect marquant de cette approche est l’élimination de la main humaine des vidéos. Grâce au modèle Grounded-SAM, les chercheurs segmentent et masquent tout ce qui est lié à la morphologie humaine. Ce qui reste visible est l’outil en interaction avec les objets. Ainsi, le robot peut apprendre non pas en observant les gestes humains, mais en comprenant comment un ustensile comme une poêle ou un marteau interagit avec son environnement. Ce processus réduit la dépendance morphologique, permettant une généralisation entre différents types de bras robotiques.

Des résultats impressionnants face aux défis quotidiens

Les expériences menées par l’équipe de recherche ont impliqué cinq tâches différentes qui nécessitent rapidité, précision et adaptabilité. Parmi ces tâches figurent le martelage d’un clou en plastique, le retrait d’une albóndiga d’une poêle à l’aide d’une cuillère et le retournement d’un œuf. Ce qui est fascinant, c’est que beaucoup de ces actions ne peuvent pas être réalisées par les méthodes classiques de téléopération, car elles sont trop rapides ou imprévisibles. Par exemple, lors du test de retournement d’œuf, le robot a réussi à effectuer l’action en seulement 1,5 seconde, tout en continuant d’agir efficacement même lorsqu’un humain ajoutait plus d’objets dans la poêle.

Le système a démontré une robuste capacité d’adaptation, se montrant capable de réaliser des tâches qui auparavant étaient considérées comme inaccessibles aux robots. En comparaison avec des méthodes traditionnelles, comme la téléopération avec joystick ou l’utilisation de pinces manuelles, le taux de succès des robots utilisant l’approche « Outil comme interface » a augmenté de 71 %, tandis que le temps nécessaire pour collecter des données a été réduit de 77 %. Lors de l’essai de martelage, les méthodes classiques ont échoué dans tous les 13 essais, alors que la nouvelle approche a réussi toutes les tentatives de clouage.

Ces résultats soulignent non seulement une avancée dans la robotique, mais aussi un changement de paradigme dans la manière dont les robots peuvent être formés pour interagir avec le monde qui les entoure. En permettant aux machines d’apprendre par imitation plutôt que par programmation, nous ouvrons la voie à une plus grande autonomie et flexibilité.

Des perspectives d’avenir prometteuses

Les implications de cette recherche vont bien au-delà des laboratoires. Ce progrès ouvre la voie à l’utilisation de vidéos amateurs, enregistrées avec des téléphones mobiles, pour former des robots. Aujourd’hui, il y a plus de 7 milliards de caméras de ce type dans le monde, transformant chaque cuisine, atelier ou entrepôt en un potentiel lieu d’apprentissage pour les robots. Si les algorithmes continuent à se perfectionner, les robots pourraient bientôt apprendre à réaliser des tâches courantes, telles que couper des légumes ou plier des vêtements, simplement en regardant des vidéos réalisées par des utilisateurs ordinaires.

En effet, cette approche pourrait réduire considérablement les coûts associés à la collecte de données, rendant la robotique plus accessible et inclusive. Comme l’affirment les chercheurs, « notre méthode élimine la nécessité de concevoir, imprimer ou fabriquer du matériel supplémentaire au cours de la collecte de données ». Cette accessibilité est un facteur clé qui distingue l’approche « Outil comme interface » des méthodes plus coûteuses et exclusives.

Cependant, il est important de noter que le système présente encore des limitations. Par exemple, il suppose que l’outil est fermement maintenu à l’extrémité du bras robotique, ce qui n’est pas toujours le cas dans des situations réelles. De plus, le modèle d’estimation de pose utilisé peut introduire des erreurs, et les angles de caméra générés synthétiquement peuvent parfois manquer de réalisme. Pour l’instant, la méthode fonctionne principalement avec des outils rigides, et il serait nécessaire d’étendre la technique pour inclure des objets flexibles ou malléables.

Un changement de paradigme dans l’apprentissage robotique

Bien qu’il reste beaucoup à faire, cette étude démontre un changement fondamental dans la manière dont les robots peuvent apprendre à interagir avec leur environnement. En s’inspirant des méthodes d’apprentissage des enfants, qui imitent les adultes, cette approche pourrait révolutionner la robotique. Comme l’a souligné Haonan Chen, principal auteur de l’étude, « notre méthode s’inspire de la façon dont les enfants apprennent, en observant les adultes ». Si un enfant peut observer comment retourner un œuf et ensuite essayer par lui-même, alors un robot peut également apprendre de cette manière.

Cette révolution pourrait conduire à des machines beaucoup plus polyvalentes, capables de naviguer dans des scénarios réels avec la même aisance que les humains. Les applications potentielles sont nombreuses, allant de l’assistance dans les foyers à des tâches plus complexes dans des environnements industriels. En fin de compte, cette avancée pourrait transformer non seulement notre façon de concevoir les robots, mais aussi la manière dont nous interagissons avec eux au quotidien.

Navigation

Top Infos

Coups de cœur