Un'introduzione all'annotazione dei dati nelle auto autonome
Le capacità dei veicoli semi-autonomi o autonomi sono rese possibili attraverso annotazioni. L'annotazione si riferisce al processo di identificazione dell'area di interesse o dell'oggetto di interesse in un video o in un'immagine con riquadri di delimitazione, oltre a specificare altri attributi che aiutano i modelli ML a riconoscere e comprendere gli oggetti rilevati dai sensori del veicolo.
Le auto autonome e semi-autonome dispongono di tecnologie che svolgono un ruolo importante nel migliorare l'esperienza di guida. Ciò è dovuto alla presenza di numerosi sensori di fotocamere, sensori e altri dispositivi. Ognuno di questi componenti genera molte informazioni. Un esempio potrebbe essere quello del dispositivo ADAS, che si basa sulla visione artificiale. Utilizza un computer per acquisire una profonda comprensione delle immagini e, analizzando diversi scenari, allerta il conducente affinché prenda la sua decisione in modo più efficace.
Come si definisce un'annotazione?
Le funzioni dei veicoli semi-autonomi e autonomi sono migliorate grazie alle annotazioni. L'annotazione si riferisce all'etichettatura dell'area di interesse o dell'oggetto di interesse nel video o nell'immagine utilizzando riquadri di delimitazione e definendo altre caratteristiche per aiutare i modelli ML a riconoscere e comprendere gli oggetti rilevati dai sensori all'interno del veicolo. Analisi come il riconoscimento facciale, il rilevamento del movimento e altro ancora richiedono dati di alta qualità annotati correttamente.
Se non c'è un'appropriata annotazione delle informazioni, la guida autonoma potrebbe non essere efficace fino al punto in cui è quasi impossibile da raggiungere. L'accuratezza dei dati assicura che l'esperienza senza conducente sia fluida.
Perché esiste l'annotazione?
I veicoli moderni generano grandi quantità di dati a causa dell'esistenza di più telecamere e sensori. Se questi set di dati non sono adeguatamente etichettati per essere elaborati, non possono essere utilizzati al massimo del loro potenziale. I set di dati dovrebbero essere utilizzati come parte di una suite di valutazione per creare modelli di addestramento per veicoli autonomi. Diversi strumenti di automazione possono aiutare a etichettare i dati perché etichettarli manualmente richiederebbe molto tempo.
Qual è il processo di annotazione?
Per consentire a un veicolo autonomo di viaggiare da A a B, deve essere in grado di comprendere perfettamente l'ambiente circostante. Uno scenario ideale per le funzioni di guida che desideri incorporare all'interno di un veicolo potrebbe richiedere due set di sensori identici. Un set sarà il sensore impostato nel processo di test mentre il secondo set di sensori viene utilizzato come indicatore.
Supponiamo che un'auto percorra 3000 miglia a una velocità media di 45 chilometri all'ora in condizioni di guida variabili. Con questi numeri possiamo determinare che l'auto ha impiegato 6700 ore per percorrere la distanza. Potrebbe anche avere diverse fotocamere e LIDAR (Light Detection and Ranging) e se assumiamo che abbiano registrato a una velocità minima di 10 fotogrammi al minuto durante la durata di 6700 ore, potrebbero essere generati 240 milioni di fotogrammi di dati. Supponendo che ogni fotogramma possa contenere, su base tipica, quindici oggetti inclusi altri veicoli e pedoni, semafori e altri oggetti, avremo più di 3,5 miliardi di elementi. Ogni oggetto deve essere etichettato.
Semplicemente annotare non è sufficiente. Deve essere anche preciso. In assenza di ciò è impossibile tracciare confronti significativi tra i diversi set di sensori per l'automobile. E se ci fosse richiesto di contrassegnare manualmente ogni oggetto?
Proviamo a capire come funziona l'annotazione manuale. Il primo passo è sfogliare le scansioni LIDAR e quindi estrarre il filmato della telecamera appropriato. Nel caso in cui tu abbia un LIDAR con una vista a 360 gradi, sarebbe una configurazione multi-cam che mostrerà il filmato secondo quella che è nota come prospettiva LIDAR. Dopo che le scansioni LIDAR e le riprese dalla telecamera sono state raccolte, il passaggio successivo consiste nell'allineare la prospettiva LIDAR con la telecamera. Se sai quali oggetti si trovano nell'area Il secondo passaggio consiste nell'eseguire il rilevamento degli oggetti e posizionare i confini 3D attorno ad essi.
Il semplice atto di posizionare riquadri di delimitazione e annotazioni generiche come pedoni, automobili o segnali di stop, ecc. non potrebbe essere sufficiente. Ci sono attributi per descrivere nel modo più accurato ciò che stai guardando. Inoltre è essenziale conoscere il significato delle fermate, degli oggetti in movimento, degli oggetti fermi e dei veicoli di emergenza, la classificazione dell'illuminazione e il tipo di spie luminose incluse nei veicoli di emergenza, ecc. Questo dovrebbe essere un elenco completo degli oggetti e dei loro attributi in cui ogni attributo deve essere considerato a sua volta. Ciò significa che stiamo discutendo di una grande quantità di informazioni.
Una volta completato questo, devi essere sicuro di avere le annotazioni giuste. Un'altra persona è tenuta a verificare che i dati che hai annotato siano corretti. Ciò assicurerà che non ci sia spazio per errori. Se il processo di annotazione viene eseguito manualmente, con un tempo medio di 60 secondi per oggetto, occorrerebbero 60 milioni di ore, o solo 6-849 anni di calendario, per contrassegnare tutti i 3,6 miliardi di oggetti di cui abbiamo discusso in precedenza. Pertanto, l'annotazione manuale degli oggetti è impossibile.
In che modo l'automazione può aiutare?
Nell'esempio precedente possiamo concludere che non è probabile che si aggiungano manualmente annotazioni ai dati. Numerosi strumenti open source possono aiutare in questo compito. È possibile rilevare automaticamente gli oggetti indipendentemente da prospettive, bassa risoluzione o scarsa illuminazione. Questo è possibile grazie ai modelli di deep learning. Quando si tratta di automazione, il primo passo sarà progettare l'attività di annotazione. Inizia nominando l'attività, assegnando le etichette e le caratteristiche ad essa associate. Dopo aver completato questo, sei pronto per creare il database dei dati che hai che devono essere annotati.
Oltre a quanto sopra, ci sono numerose altre funzionalità che è possibile aggiungere al lavoro. L'annotazione può essere eseguita con caselle, poligoni e polilinee. Diversi tipi di annotazione includono la modalità di interpolazione, la segmentazione della modalità di annotazione degli attributi e altri.
L'automazione riduce la quantità di tempo necessaria per annotare i dati. L'automazione ridurrà del 65% lo sforzo e l'affaticamento mentale.
Chiusura
Affinché ciò accada, gli strumenti di automazione discussi in precedenza in questo blog aiuteranno a ottenere annotazioni di grandi dimensioni. Inoltre, è essenziale disporre di un team di esperti per poter facilitare l'annotazione dei dati su vasta scala. eInfochips è stato un partner di ingegneria per molte delle aziende del mondo con esperienza in tutto il ciclo di vita del prodotto, a partire dalla progettazione del prodotto attraverso la fase di ingegneria della qualità, nonché in tutta la catena del valore, a partire dal dispositivo fino al digitale. Labelify è anche un esperto di intelligenza artificiale e apprendimento automatico. Ha lavorato con una varietà di case automobilistiche per fornire soluzioni di alta qualità. Per ulteriori informazioni sulla nostra annotazione dei dati, sulle soluzioni automobilistiche e sull'esperienza di AI/ML, contatta i nostri esperti.