Konzept

just better DATA wird während der dreijährigen Projektlaufzeit einen Prozess entwickeln und prototypisch implementieren, mit dem in Zukunft „bessere Daten“ für das Training von KI-Modellen für das autonome Fahren zur Verfügung stehen. Im Rahmen von vier Teilprojekten (TP) wird das spezifizierte Datenset von den neun Projektpartnern umgesetzt.

Konzept

just better DATA wird während der dreijährigen Projektlaufzeit einen Prozess entwickeln und prototypisch implementieren, mit dem in Zukunft „bessere Daten“ für das Training von KI-Modellen für das autonome Fahren zur Verfügung stehen. Im Rahmen von vier Teilprojekten (TP) wird das spezifizierte Datenset von den neun Projektpartnern umgesetzt.

Aufgaben der vier Teilprojekte

TP1

Anforderungen

In TP1 werden die Anforderungen für das neuartige System zusammengestellt. Es geht den Fragestellungen nach, welche Datentypen und Metadaten im Projekt adressiert werden, welche charakteristischen und dennoch vielfältigen Szenarien im Fahrzeug erfasst, selektiert und gespeichert werden und welche Anforderungen an das Sensorset im weiteren Projektverlauf gestellt werden.

TP2

Edge-Plattform

TP2 entwickelt das Herzstück des im Projekt prototypisch dargestellten Systems für Smart Data Logging und Processing: die sogenannte Edge-Plattform, welche die Aufzeichnung, Vorverarbeitung und Selektion der Daten im Fahrzeug in Echtzeit ermöglicht.

TP3

Smart Data Loop

In TP3 wird die klassische Datenschleife durch Anwendung smarter Algorithmen so optimiert, dass die Datensätze mehr Vielfalt abdecken und gleichzeitig das Datenvolumen kontrollierbar bleibt.

TP4

Prototyp & Verifizierung

TP4 verantwortet die Vorbereitung einer Fahrzeugausrüstung für die Datenerfassung sowie die Aufzeichnung von realen Daten, die in spezifischen Szenarien ausgewählt wurden, um einen Datensatz zu erzeugen, der eine industrielle Nutzung für alle Partner ermöglicht und den Anforderungen dieses Vorhabens entspricht.

Das „Smart Data Logging“- Konzept

Herausforderung und Lösungsansatz:
Experten gehen davon aus, dass gut 99 Prozent der Daten, die auf einer üblichen Erprobungsfahrt erfasst werden, für die Entwicklung autonomer Fahrfunktionen irrelevant sind und deshalb am besten gar nicht erst aufgezeichnet werden sollten. Es müssen also die Daten identifiziert werden, die wirklich benötigt werden.

1 of 6

Onboard-Vorprozessierung:
Das Herzstück des in jbDATA prototypisch entwickelte Hardware-Systems für Smart Data Logging und Processing: die sogenannte Edge-Plattform. Auf ihr werden die aufgezeichneten Sensordaten analysiert, vorverarbeitet, vorsortiert und reduziert, um die weitere Verarbeitung dieser Daten in der Cloud bzw. im Backend zu beschleunigen und für den Nutzer das Daten-Handling zu vereinfachen und zu vergünstigen.

2 of 6

Um die Datenschleife mit smarten Algorithmen und mit hoher Automatisierung zu optimieren ist ein Kernpunkt der Automatisierung eine verlässliche Übertragungsmethode der Daten aus dem Fahrzeug an ein Backend. Um die Datenmenge der Übertragung zu reduzieren, ohne notwendige Informationen zu verlieren, sollen smarte Algorithmen direkt im Fahrzeug die Daten schon bei der Aufzeichnung verarbeiten bzw. anreichern. Voraussetzung ist, dass derartige Methoden fahrzeugseitig an der Edge arbeiten, das heißt am Übergang vom Fahrzeug zur Cloud. Denn nur so ist es möglich, dass tatsächlich nur die Daten gespeichert werden, die wirklich benötigt werden und nicht Terrabytes von nutzlosen Informationen.

Durch intelligente Online-Verfahren können Corner Cases, also ungewöhnliche Ereignisse, ebenso wie Datenlücken bei der Aufzeichnung erkannt werden. Hier helfen KI-basierte Methoden. Basierend auf Vorgaben identifizieren sie während der Datenaufzeichnung relevante Szenarien und stellen sicher, dass nur diese gespeichert werden. Durch eine Filterfunktion können Elemente eines Datensatzes markiert werden, bei denen Unklarheiten oder Inkonsistenzen vorliegen.

3 of 6

Anforderungsübermittlung:
Um die fehlenden Szenarien mithilfe des synthetischen Datengenerators anzureichern, müssen entsprechende Anforderungen an diesen übermittelt werden. In der Verarbeitung der Daten können durch automatisierte Methoden Corner Cases bzw. Anomalien detektiert werden und die Relevanz verschiedener Szenen bestimmt werden, um somit neue Anforderungen an die Datenerzeugung zu schicken.

4 of 6

Für das Training von KI-basierten Systemen ist insbesondere ein ausgewogener Datensatz wichtig, in dem auch seltene Ereignisse vorkommen. Diese Ereignisse umfassen kritische Verkehrssituationen aber auch Variationen bei Verkehrsteilnehmern wie beispielsweise Geschlecht, Hautfarbe, Alter, Körperbau etc. Dieser Bias ist in heutigen Datensätzen vorhanden und führt bei KI-Systemen zu einer Performance-Reduktion. Um diesem Bias entgegenzuwirken, werden Realdaten mit synthetischen Daten ergänzt und zu hybriden Datensätzen erweitert. So kann effizient ein ausgewogener, charakteristischer und fairer Datensatz erstellt werden. Außerdem werden hier die cloud-seitigen Funktionen mit synthetisch generierten und Realdaten entwickelt und KI-Modelle zwischen Cloud und Edge bzgl. Trainingszyklus optimiert.

5 of 6

Das KI-Modell wird zunächst in der Cloud geupdatet und wieder in das Edge Device zurückgespielt. Die Smart Data Loop wird mit dem Update der Modelle geschlossen, so werden die implementierten KI-Funktionen die Daten für die industrielle Nutzung sammelt, kontinuierlich verbessert.

6 of 6
Nach oben scrollen