Un cadre d’apprentissage permet aux robots humanoïdes de se relever rapidement

Un cadre d’apprentissage permet aux robots humanoïdes de se relever rapidement

Les robots humanoïdes, conçus pour ressembler au corps humain, deviennent de plus en plus capables d’exécuter efficacement diverses tâches dans des environnements réels. Les avancées dans leurs algorithmes de contrôle ont permis des améliorations significatives, leur permettant de se déplacer plus rapidement et d’imiter plus efficacement les mouvements humains.

Étant donné que ces robots marchent et courent sur deux jambes comme les humains, ils peuvent parfois entrer en collision avec des objets ou trébucher sur des surfaces irrégulières, entraînant des chutes. Contrairement aux humains, qui peuvent rapidement se relever, ces robots ont parfois du mal à se remettre debout et nécessitent une assistance extérieure.

Un cadre d’apprentissage automatique pour une récupération autonome

Pour résoudre ce problème, des chercheurs de l’Université de l’Illinois à Urbana-Champaign ont mis au point un cadre d’apprentissage automatique permettant aux robots humanoïdes de se relever de manière autonome après une chute. Décrit dans un article publié sur la plateforme de préimpression arXiv, ce cadre pourrait améliorer l’autonomie des robots et faciliter leur déploiement à grande échelle.

« Concevoir des contrôleurs de récupération est un défi en raison des nombreuses positions qu’un robot humanoïde peut adopter après une chute et des terrains complexes qu’il doit traverser », expliquent Xialin He, Runpei Dong et leurs collègues dans leur article. « Cette étude introduit un cadre d’apprentissage qui génère des contrôleurs, permettant aux robots humanoïdes de se relever à partir de différentes positions et sur divers terrains. »

Résultats en conditions réelles
Nous évaluons HumanUP (notre méthode) dans plusieurs environnements réels qui couvrent diverses propriétés de surface, y compris des surfaces artificielles et naturelles, et englobent une large gamme de rugosité (du béton rugueux à la neige glissante), d’irrégularité (du béton plat aux carreaux), de souplesse du sol (du béton totalement ferme à l’herbe boueuse marécageuse) et de pente (de plat à environ 10°).
Nous comparons HumanUP avec le contrôleur de redressement intégré du G1 et notre version de HumanUP sans randomisation posturale (PR). HumanUP réussit plus régulièrement (78,3 % contre 41,7 %) et peut gérer des terrains que le contrôleur du G1 ne peut pas surmonter.
Crédit : arXiv (2025). DOI : 10.48550/arxiv.2502.12152

L’équipe de recherche a développé un cadre appelé HUMANUP, qui utilise une approche d’apprentissage par renforcement (RL). Cette méthode améliore la capacité des robots humanoïdes à se relever, quelle que soit leur position après une chute.

« Contrairement aux précédentes réussites dans l’apprentissage de la locomotion des humanoïdes, la tâche de redressement implique des schémas de contact complexes, nécessitant une modélisation précise des collisions et une distribution plus rare des récompenses », écrivent He, Dong et leurs collègues. « Nous abordons ces défis à l’aide d’une approche en deux phases, basée sur un apprentissage progressif. »

Apprentissage en deux étapes pour une récupération efficace

Le cadre HUMANUP RL fonctionne en deux étapes. Dans la première étape, il privilégie la découverte de trajectoires efficaces des membres permettant au robot de se relever, tout en imposant des contraintes minimales sur la fluidité du mouvement ou la vitesse d’exécution.

Visualisation des résultats du redressement depuis la position couchée
Le mouvement généré par la méthode de Tao et al. [65] est très instable et dangereux, avec des tremblements et des sauts répétés pendant la phase de redressement.
Crédit : arXiv (2025). DOI : 10.48550/arxiv.2502.12152

Affinement des mouvements pour un contrôle optimal

Dans la deuxième phase, le cadre affine les mouvements identifiés lors de la première étape, les transformant en gestes fluides et contrôlés que le robot peut exécuter. Ces mouvements optimisés doivent rester efficaces quelle que soit la position du robot ou le type de terrain sur lequel il est tombé.

Tests en conditions réelles sur le robot Unitree G1

Les chercheurs ont évalué leur cadre à la fois en simulation et dans des scénarios réels, en l’implémentant sur le robot humanoïde Unitree G1, un système avancé développé par la société chinoise Unitree Robotics. Leurs résultats se sont révélés très prometteurs, démontrant que cette approche permettait au robot de se redresser de manière autonome, indépendamment de sa position ou de la surface sur laquelle il était tombé.

« Nous avons découvert que ces innovations permettent à un robot humanoïde G1 dans le monde réel de se relever à partir de deux positions clés : (a) allongé sur le dos et (b) allongé sur le ventre. Les deux scénarios ont été testés sur diverses surfaces, y compris des terrains plats, déformables, glissants et des pentes comme des pentes herbeuses et des champs de neige », ont écrit He, Dong et leurs collègues. « À notre connaissance, il s’agit de la première démonstration réussie dans le monde réel de politiques d’apprentissage pour se relever pour des robots humanoïdes de taille humaine. »

Le cadre prometteur développé par He, Dong et leur équipe pourrait bientôt être affiné et appliqué à d’autres robots humanoïdes, leur permettant de se redresser de manière autonome après une chute. Ces avancées pourraient accélérer le développement des robots humanoïdes, favorisant leur adoption à grande échelle dans des applications réelles.


Lire l’article original sur : TechXplore

Lire plus : Premier robot humanoïde à faire un salto avant

Partager cette publication