Vision 3D utilise un seul pixel pour vitesse et efficacité coût

Vision 3D utilise un seul pixel pour vitesse et efficacité coût

Le suivi 3D et la vision par machine, comme représenté par cette image rendue, sont à la base de la capacité des véhicules autonomes et d’autres robots à comprendre et à réagir à leur environnement. La nouvelle technologie promet un énorme bond en termes de vitesse, avec d’importantes économies en termes de coût, de stockage des données et de temps de traitement.
Crédit : Depositphotos

Les voitures autonomes reposent sur des capteurs avancés et une puissance de calcul significative. Cependant, une équipe de recherche dirigée par l’Université Tsinghua en Chine a développé un système de suivi qui réduit les exigences de calcul à seulement un pixel.

Initialement, les systèmes de vision par ordinateur nécessaires pour les véhicules autonomes et la sécurité intelligente semblaient simples : connecter une caméra à un processeur, ajouter quelques algorithmes, et le tour est joué. Les humains gèrent le traitement d’image complexe sans effort avec leurs systèmes biologiques, alors à quel point cela pourrait-il être difficile ?

Les défis de l’émulation de la vision humaine et des réponses réflexes

Il s’avère que cela est extrêmement difficile. Alors que l’œil humain est optiquement plus simple (bien que complexe), le traitement sous-jacent est incroyablement complexe. De plus, les humains utilisent ces informations et y répondent de manière réflexe, ce qui rend quasiment impossible son émulation.

L’équipe de recherche de Tsinghua a réalisé une percée en créant une méthode de suivi 3D pour les objets en mouvement rapide à des vitesses exceptionnelles, tout en réduisant les exigences en termes de calcul. L’innovation réside dans le fait d’atteindre cela non pas avec une image complète, mais en utilisant seulement un seul pixel.

Plateforme expérimentale pour la méthode de suivi 3D à un seul pixel
Zihan Geng, Université Tsinghua

Suivi efficace des objets sans reconstruction d’image

« Notre méthode ne nécessite pas la reconstruction de l’image de l’objet pour déterminer sa position, ce qui réduit considérablement les coûts de stockage des données et de calcul », explique Zihan Geng, chef de la recherche.

« Plus précisément, le calcul d’une coordonnée 3D nécessite seulement six octets de stockage et 2,4 microsecondes de temps de calcul. En réduisant les dépenses computationnelles et en améliorant l’efficacité, cela pourrait diminuer le coût de l’équipement pour le suivi à haute vitesse, rendant la technologie plus abordable et ouvrant de nouvelles applications. »

L’équipe affirme que leur technique peut suivre les objets 200 fois plus rapidement que les méthodes traditionnelles basées sur la vidéo en utilisant simplement un détecteur, sans information préalable et avec une puissance de calcul minimale.

Elle y parvient en projetant des motifs géométriques de lumière sur l’objet et en mesurant l’intensité sur un seul pixel. À travers des calculs mathématiques complexes, la position et la trajectoire de l’objet sont déterminées.

Utilisation d’un laser et de données d’un seul pixel pour le suivi d’objets

Initialement, l’équipe utilisait des simulations, mais elle est rapidement passée à l’utilisation d’un laser et d’un dispositif à micro-miroirs numériques (DMD) pour illuminer une sphère métallique se déplaçant le long d’un fil spiralé courbé. Le système effectuait des calculs basés sur les données provenant d’un seul pixel.

Actuellement, cette méthode permet de suivre un seul objet, l’objectif suivant étant de suivre simultanément plusieurs objets.

« Cette technologie pourrait améliorer la perception dans les voitures autonomes, renforcer les systèmes de surveillance de la sécurité, et offrir une surveillance et un contrôle de qualité plus efficaces dans les inspections industrielles », a déclaré Geng. « De plus, cette technique de localisation à haute vitesse peut être appliquée dans la recherche scientifique, comme l’étude des trajectoires de vol des insectes. »


Lisez l’article original sur :  New Atlas

Pour en savoir plus : New Research Analyzes an AI’s Mind and Starts Altering its Thinking

Share this post