En introduktion til dataanmærkning i autonome biler
Mulighederne for semi-autonome eller autonome køretøjer er muliggjort gennem annoteringer. Annotering refererer til processen med at identificere interesseområdet eller objektet af interesse i en video eller billede med afgrænsningsbokse, samt specificering af andre attributter, der hjælper ML-modellerne med at genkende og forstå de objekter, der detekteres af køretøjets sensorer.
Autonome og semi-autonome biler har teknologier, der spiller en vigtig rolle i at forbedre køreoplevelsen. Dette er ved tilstedeværelsen af adskillige kamerasensorer, sensorer samt andre enheder. Hver af disse komponenter genererer en masse information. Et eksempel kunne være ADAS-enheden, som er baseret på computersyn. Den bruger en computer til at opnå en dyb forståelse af billeder og ved at analysere forskellige scenarier advare chaufføren om at træffe sin beslutning mere effektivt.
Hvordan definerer du en anmærkning?
Funktionerne af semi-autonome og autonome køretøjer forbedres takket være annoteringer. Annotering refererer til mærkningen af interesseområdet eller objektet, der er af interesse i videoen eller billedet, ved at bruge afgrænsningsbokse samt definere andre karakteristika for at hjælpe ML-modellerne med at genkende og forstå de objekter, der detekteres af sensorer inde i køretøjet. Analyse som ansigtsgenkendelse, bevægelsesdetektion og mere kræver data af høj kvalitet, der er korrekt kommenteret.
Hvis der ikke er en ordentlig annotering af information, kunne autonom kørsel ikke være effektiv til det punkt, hvor det næsten er umuligt at opnå. Nøjagtigheden af dataene sikrer, at den førerløse oplevelse er glat.
Hvorfor findes anmærkning?
Moderne køretøjer genererer store mængder data på grund af eksistensen af flere kameraer og sensorer. Hvis disse datasæt ikke er korrekt mærket til at blive behandlet, kan de ikke bruges til deres fulde potentiale. Datasættene bør bruges som en del af en vurderingspakke til at skabe træningsmodeller for autonome køretøjer. Forskellige automatiseringsværktøjer kan hjælpe med at mærke dataene, fordi det ville tage meget tid at mærke dem manuelt.
Hvad er processen med annotering?
For at gøre det muligt for et autonomt køretøj at rejse fra A til B, skal det være i stand til at forstå det omgivende miljø perfekt. Et ideelt scenarie for kørefunktioner, du gerne vil inkorporere i et køretøj, kunne kræve to sensorsæt, der er identiske. Det ene sæt vil være det sensorsæt, der er i gang med at teste, mens det andet sensorsæt bruges som en indikator.
Lad os antage, at en bil kører 3000 miles med en gennemsnitlig hastighed på 45 kilometer i timen under varierende kørselsforhold. Med disse tal kan vi fastslå, at bilen tog 6700 timer for at tilbagelægge afstanden. Det kunne også have flere kamera og LIDAR (Light Detection and Ranging) systemer og Hvis vi antager, at de optog med en minimumshastighed på 10 billeder i minuttet i løbet af 6700 timer, kunne der genereres 240 millioner frames data. Hvis vi antager, at hver ramme typisk kan indeholde femten genstande, inklusive andre køretøjer og fodgængere, trafiklys såvel som andre genstande, så har vi mere end 3,5 milliarder genstande. Hvert objekt skal være mærket.
Det er ikke nok blot at bemærke. Det skal også være præcist. I mangel af dette er det umuligt at drage nogen meningsfuld sammenligning mellem de forskellige sensorsæt til bilen. Hvad hvis vi blev forpligtet til manuelt at markere hvert objekt?
Lad os prøve at forstå, hvordan manuel annotering fungerer. Det første trin er at gennemse LIDAR-scanningerne og derefter trække de relevante kameraoptagelser op. I tilfælde af at du har en LIDAR, der har en 360-graders udsigt, ville det være en multi-cam-opsætning, som viser optagelserne i overensstemmelse med det, der er kendt som LIDAR-perspektivet. Når LIDAR-scanningerne og optagelserne fra kameraet er blevet indsamlet, er næste trin at justere LIDAR-perspektivet med kameraet. Hvis du ved, hvilke objekter der er i området. Det andet trin er at udføre objektdetektering og placere 3D-grænser omkring dem.
Den simple handling med at placere afgrænsningskasser samt generaliserede anmærkninger såsom fodgængere, biler eller stopskilte osv. kunne ikke være tilstrækkelig. Der er egenskaber for mest præcist at beskrive, hvad du ser på. Derudover er det væsentligt at kende betydningen af stop, bevægelige genstande, stillestående genstande og udrykningskøretøjer, belysningsklassificeringen samt hvilken type advarselslygter, som udrykningskøretøjerne omfatter osv. Dette bør være en omfattende liste over genstandene og deres egenskaber hvor hver egenskab skal overvejes efter tur. Det betyder, at vi diskuterer en stor mængde information.
Når du har gennemført dette, skal du være sikker på, at du har de rigtige annoteringer. En anden person er forpligtet til at bekræfte, at de data, du har kommenteret, er rigtige. Dette sikrer, at der ikke er plads til fejl. Hvis annoteringsprocessen udføres manuelt med en gennemsnitlig tid på 60 sekunder pr. objekt, ville vi kræve 60 millioner timer eller blot 6-849 kalenderår for at markere alle de 3,6 milliarder objekter, som vi har diskuteret tidligere. Så det er umuligt at annotere objekter manuelt.
Hvordan kan automatisering hjælpe?
I det foregående eksempel kan vi konkludere, at det ikke er sandsynligt, at man manuelt tilføjer anmærkninger til dataene. Talrige open source-værktøjer kan hjælpe med denne opgave. Det er muligt at registrere objekter automatisk uanset perspektiver, lav opløsning eller svag belysning. Dette er muligt takket være deep-learning-modellerne. Når det kommer til automatisering, vil det første skridt være at designe opgaven med annotering. Begynd med at navngive opgaven, giv de etiketter og egenskaber, der er knyttet til dem. Når du har fuldført dette, er du klar til at oprette den database med data, du har, som skal kommenteres.
Ud over ovenstående er der adskillige andre funktioner, der er mulige at tilføje på jobbet. Annotering kan udføres med bokse, polygoner og polylinjer. Forskellige typer annotering inkluderer interpolationstilstand såvel som segmentering af attributannoteringstilstand og andre.
Automatisering reducerer den tid, det tager at notere data. Automatisering vil reducere indsatsen og den mentale træthed med 65 procent.
Lukker op
For at få dette til at ske, vil de automatiseringsværktøjer, der blev diskuteret tidligere i denne blog, hjælpe med at opnå annotering i en stor størrelse. Derudover er det essentielt at have et ekspertteam for at kunne facilitere dataannotering i massiv skala. eInfochips har været en ingeniørpartner for mange af verdens virksomheder med ekspertise på tværs af produktlivscyklussen, der starter fra produktdesign til kvalitetsingeniørfasen såvel som på tværs af værdikæden fra enhed op til digital. Labelify er også ekspert i kunstig intelligens samt maskinlæring. Det har arbejdet med en række forskellige bilvirksomheder for at levere løsninger af høj kvalitet. For mere information om vores dataannotering, billøsninger og AI/ML-ekspertise Kontakt vores eksperter.