Une introduction à l'annotation de données dans les voitures autonomes
Les capacités des véhicules semi-autonomes ou autonomes sont rendues possibles grâce aux annotations. L'annotation fait référence au processus d'identification de la zone d'intérêt ou de l'objet d'intérêt dans une vidéo ou une image avec des cadres de délimitation, ainsi qu'à la spécification d'autres attributs qui aident les modèles ML à reconnaître et à comprendre les objets détectés par les capteurs du véhicule.
Les voitures autonomes et semi-autonomes disposent de technologies qui jouent un rôle important dans l'amélioration de l'expérience de conduite. C'est par la présence de nombreux capteurs caméras, capteurs, ainsi que d'autres dispositifs. Chacun de ces composants génère beaucoup d'informations. Un exemple pourrait être celui du dispositif ADAS, qui est basé sur la vision par ordinateur. Il utilise un ordinateur pour acquérir une compréhension approfondie des images et, en analysant différents scénarios, alerter le conducteur pour qu'il prenne sa décision plus efficacement.
Comment définir une annotation ?
Les fonctions des véhicules semi-autonomes et autonomes sont enrichies grâce aux annotations. L'annotation fait référence à l'étiquetage de la zone d'intérêt ou de l'objet qui présente un intérêt dans la vidéo ou l'image à l'aide de boîtes de délimitation ainsi qu'à la définition d'autres caractéristiques pour aider les modèles ML à reconnaître et à comprendre les objets détectés par les capteurs à l'intérieur du véhicule. Des analyses telles que la reconnaissance faciale, la détection de mouvement, etc. nécessitent des données de haute qualité correctement annotées.
S'il n'y a pas une annotation appropriée des informations, la conduite autonome pourrait ne pas être efficace au point d'être presque impossible à réaliser. La précision des données garantit que l'expérience sans conducteur est fluide.
Pourquoi l'annotation existe-t-elle ?
Les véhicules modernes génèrent de grandes quantités de données en raison de l'existence de plusieurs caméras et capteurs. Si ces ensembles de données ne sont pas correctement étiquetés pour être traités, ils ne peuvent pas être utilisés à leur plein potentiel. Les ensembles de données doivent être utilisés dans le cadre d'une suite d'évaluations pour créer des modèles de formation pour les véhicules autonomes. Différents outils d'automatisation peuvent aider à étiqueter les données car les étiqueter manuellement prendrait beaucoup de temps.
Quel est le processus d'annotation ?
Pour permettre à un véhicule autonome de se déplacer de A à B, il doit être capable d'appréhender parfaitement l'environnement qui l'entoure. Un scénario idéal pour les fonctions de conduite que vous souhaitez intégrer dans un véhicule pourrait nécessiter deux ensembles de capteurs identiques. Un ensemble sera l'ensemble de capteurs en cours de test tandis que le second ensemble de capteurs est utilisé comme indicateur.
Supposons qu'une voiture parcourt 3 000 milles à une vitesse moyenne de 45 kilomètres à l'heure dans des conditions de conduite variables. Avec ces chiffres, nous pouvons déterminer que la voiture a mis 6700 heures pour parcourir la distance. Il pourrait également avoir plusieurs caméras et LIDAR (Light Detection and Ranging) et Si nous supposons qu'ils ont enregistré à un rythme minimum de 10 images par minute pendant une durée de 6700 heures, 240 millions d'images de données pourraient être générées. En supposant que chaque cadre puisse contenir, sur une base typique, quinze objets, y compris d'autres véhicules et piétons, des feux de circulation ainsi que d'autres objets, nous aurons alors plus de 3,5 milliards d'éléments. Chaque objet doit être étiqueté.
Le simple fait de noter ne suffit pas. Il doit être précis aussi. En l'absence de cela, il est impossible d'établir des comparaisons significatives entre les différents ensembles de capteurs pour l'automobile. Et si nous devions marquer manuellement chaque objet ?
Essayons de comprendre comment fonctionne l'annotation manuelle. La première étape consiste à parcourir les scans LIDAR, puis à afficher les séquences de caméra appropriées. Dans le cas où vous avez un LIDAR qui a une vue à 360 degrés, il s'agirait d'une configuration multi-caméras qui affichera les images conformément à ce que l'on appelle la perspective LIDAR. Une fois que les scans LIDAR et les images de la caméra ont été rassemblés, l'étape suivante consiste à aligner la perspective LIDAR avec la caméra. Si vous savez quels objets se trouvent dans la zone La deuxième étape consiste à effectuer la détection d'objets et à placer des limites 3D autour d'eux.
Le simple fait de placer des boîtes englobantes ainsi que des annotations généralisées telles que des piétons, des voitures ou des panneaux d'arrêt, etc. ne pouvait suffire. Il y a les attributs pour décrire le plus précisément ce que vous regardez. De plus, il est essentiel de connaître la signification des arrêts, des objets en mouvement, des objets stationnaires et des véhicules d'urgence, la classification de l'éclairage ainsi que le type de voyants d'avertissement inclus dans les véhicules d'urgence, etc. Il devrait s'agir d'une liste complète des objets et de leurs attributs. dans lequel chaque attribut doit être considéré à tour de rôle. Cela signifie que nous discutons d'une grande quantité d'informations.
Une fois que vous avez terminé, vous devez vous assurer que vous avez les bonnes annotations. Une autre personne est tenue de vérifier que les données que vous avez annotées sont exactes. Cela garantira qu'il n'y a pas de place pour l'erreur. Si le processus d'annotation est effectué manuellement, avec un temps moyen de 60 secondes par objet, il nous faudrait 60 millions d'heures, soit seulement 6 à 849 années civiles pour marquer l'ensemble des 3,6 milliards d'objets dont nous avons parlé plus tôt. Il est donc impossible d'annoter manuellement des objets.
Comment l'automatisation peut-elle vous aider ?
Dans l'exemple précédent, nous pouvons conclure qu'il est peu probable d'ajouter manuellement des annotations aux données. De nombreux outils open source peuvent vous aider dans cette tâche. Il est possible de détecter automatiquement des objets indépendamment des perspectives, de la faible résolution ou de l'éclairage tamisé. Ceci est possible grâce aux modèles d'apprentissage en profondeur. En ce qui concerne l'automatisation, la première étape consistera à concevoir la tâche d'annotation. Commencez par nommer la tâche, en donnant les étiquettes et les caractéristiques qui lui sont associées. Une fois que vous avez terminé, vous êtes prêt à créer la base de données des données dont vous disposez et qui doivent être annotées.
Au-delà de ce qui précède, il existe de nombreuses autres fonctionnalités qu'il est possible d'ajouter au travail. L'annotation peut être réalisée avec des boîtes, des polygones et des polylignes. Différents types d'annotation incluent le mode d'interpolation ainsi que la segmentation du mode d'annotation d'attribut et autres.
L'automatisation réduit le temps nécessaire pour noter les données. L'automatisation réduira de 65% l'effort et la fatigue mentale.
Fermeture
Pour que cela se produise, les outils d'automatisation discutés précédemment dans ce blog aideront à réaliser des annotations de grande taille. De plus, il est indispensable de disposer d'une équipe experte pour pouvoir faciliter l'annotation des données à grande échelle. eInfochips a été un partenaire d'ingénierie pour de nombreuses entreprises du monde avec une expertise sur l'ensemble du cycle de vie du produit, de la conception du produit à la phase d'ingénierie de la qualité, ainsi que sur toute la chaîne de valeur, de l'appareil au numérique. Labelify est également un expert en IA ainsi qu'en apprentissage automatique. Il a travaillé avec une variété d'entreprises automobiles pour fournir des solutions de qualité supérieure. Pour plus d'informations sur nos annotations de données, nos solutions automobiles et notre expertise IA/ML, contactez nos experts.