Skip to main content
Erschienen in:

01.01.2025 | Entwicklung

Generative KI im Datenlebenszyklus des autonomen Fahrens

verfasst von: Stefan Held, Daniel Burkhart

Erschienen in: ATZ - Automobiltechnische Zeitschrift | Ausgabe 1/2025

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …
Selbstfahrende Fahrzeuge gehören zu den bedeutendsten technischen Herausforderungen in der Automobilindustrie, insbesondere aus der Sicht der datengesteuerten Softwareentwicklung. ITK zeigt auf, wie generative KI in datengetriebenen Softwareprozessen wie dem Big Loop eingesetzt werden kann, um Daten aus großen Fahrzeugflotten für die Software- und Algorithmenentwicklung effizienter zu nutzen.
Das automatisierte Fahren nach SAE-Level 3 und höher ist neben der Antriebselektrifizierung der bedeutendste Megatrend in der Automobilindustrie. Datengetriebene Softwareprozesse wie etwa Big Loop prägen das Bild bei der Einführung fahrerloser Pkw. Dieser Loop ermöglicht es ADAS/AD-Systemen, Daten von Millionen Fahrzeugen in realer Umgebung gleichzeitig zu sammeln und für Entwicklung, Test und Optimierung von Software zu nutzen. Big Loop beschreibt einen kontinuierlichen Datenaustausch zwischen Fahrzeugflotte und cloudbasierter Entwicklungsumgebung, Bild 1. OEMs haben ihre Fahrzeuge um Funktionen wie Datensammler und Shadow Mode erweitert und nutzen Cloudplattformen zur Entwicklung von ADAS/AD-Funktionen, die auf künstlicher Intelligenz (KI) basieren [1].
Funktionen wie Data Loop oder Shadow Mode sind Teil des Daten- und KI-Lebenszyklus. Sie enthalten Systeme, um Daten zu sammeln, zu filtern und zu übertragen, aber auch Systeme für Over-the-Air-Funktions-Updates und zum Überwachen dieser Funktionen. Sie übertragen gesammelte Daten an Datenplattformen, wo diese Felddaten wertvolle Informationen für die fortlaufende Verbesserung der ADAS/AD-Systeme liefern [2].

Aktuelle Herausforderungen

Der Data Loop ist eine etablierte Methode zur Erhebung der für die Entwicklung von ADAS/AD-Funktionen notwendigen Daten. Die Umsetzung dieses Loops ist jedoch ein komplexes Unterfangen, das mit regulatorischen und technischen Herausforderungen verbunden ist.

Regulatorische Anforderungen

Im Rahmen des Programms Digitale Dekade möchte die Europäischen Union den digitalen Wandel stärken - unter anderem mit neuen regulatorischen Anforderungen. Diese von Anfang an in den Entwicklungsprozess zu integrieren, sichert die Erfüllung gesetzlicher Vorgaben und eröffnet neue Chancen. Der Data Act der EU regelt den Umgang mit vernetzten Produkten und Diensten in der EU und legt Rechte und Pflichten für den Datenzugriff fest. Diese Zugriffsrechte machen ein Data Governance Framework für Datenhalter notwendig. Data Loops bilden die technische Grundlage, um diese Anforderungen umzusetzen [3].
Die KI-Verordnung der EU klassifiziert KI-Anwendungen nach Risikokategorien, wobei sicherheitsrelevante KI-Systeme in autonomen Fahrzeugen oft als Hochrisiko gelten. Für diese Verordnung sind umfassendes Risikomanagement, Dokumentation, Transparenz und Cybersicherheit erforderlich. Data Loops sind entscheidend, um die Rückverfolgbarkeit und das Überwachen der KI-Systeme sicherzustellen [4]. Die Cyberresilienz-Verordnung der EU setzt Mindeststandards für die Cybersicherheit, um die Widerstandsfähigkeit von Produkten zu stärken. Hersteller müssen Sicherheit bereits in der Entwicklungsphase berücksichtigen und kontinuierliche Sicherheitsupdates bereitstellen.

Technische Anforderungen

Der Big Loop umfasst verschiedene komplexe technische Aspekte. Die Verarbeitung und Analyse großer Datenmengen in der Cloud muss skalierbar sein, um mit der wachsenden Anzahl an Fahrzeugen und Datenquellen Schritt zu halten. Die Faktoren Genauigkeit und Verlässlichkeit der Daten sind entscheidend für die Leistung der Algorithmen. Dies erfordert für die Datenqualität und -integrität eine strukturierte Erhebung der Daten sowie robuste Datenverarbeitungs- und Bereinigungsverfahren. Die entwickelten Modelle müssen rigoros getestet und validiert werden, um sicherzustellen, dass sie unter allen Bedingungen zuverlässig funktionieren. Dies beinhaltet umfangreiche Hardware-in-the-Loop- und Simulationstests.
Der Schutz sensibler Daten und die Gewährleistung der Cybersicherheit sind von größter Bedeutung, insbesondere angesichts der zunehmenden Vernetzung und Datenübertragung zwischen Fahrzeugen und der Cloud. Eine weitere Herausforderung besteht darin, seltene, aber kritische Situationen zu identifizieren und zu analysieren. Diese Ereignisse erfordern spezielle Daten und besondere Aufmerksamkeit bei der Detaillierung, um die Algorithmen entsprechend zu trainieren und zu optimieren. Um diese technischen Herausforderungen zu bewältigen, sind innovative Lösungen erforderlich, die fortschrittliche KI-Technologien, umfassende Datenmanagementstrategien und hochskalierbare Cloudinfrastrukturen beinhalten.

Generative künstliche Intelligenz

Automatisiertes Labeling nutzt KI-Modelle, um Daten automatisch zu annotieren. Diese Technik kann den Prozess der Datenvorbereitung erheblich beschleunigen und die Genauigkeit der Labels verbessern. Foundation Models wie EVA [5] und SAM [6] sind besonders effektiv, da sie in der Lage sind, komplexe Muster zu erkennen und präzise Labels zu generieren.
Data Augmentation ist eine Methode der automatisierten Datenanreicherung, um Vielfalt und Menge der Trainingsdaten zu erhöhen. Durch die Generierung zusätzlicher Datenvariationen aus vorhandenen Daten wird die Robustheit und Generalisierungsfähigkeit der Modelle verbessert. So werden schon seit Jahren Generative Adversarial Networks (GANs) eingesetzt, um mittels Visual Style Transfer die Umgebungscharakteristik von Bildern auf andere zu übertragen [7]. Neue generative Ansätze wie InfEdit [8] und ControllNet [9] ermöglichen durch Prompting erweiterte Möglichkeiten zur Augmentierung und verbesserten Automatisierung.
In vielen Situationen ist es nicht möglich, alle Daten inklusive Sensordaten zu erheben und zu speichern. Häufig werden Daten wie Positionen und Merkmale relevanter Objekte gespeichert. Zusammen mit vorhandenen hochauflösenden Karten ist es möglich, die fehlenden Sensordaten von Quellen wie beispielsweise Kamera oder Radar zu synthetisieren. Diese synthetischen Daten, Bild 3, können verwendet werden, um Algorithmen zu trainieren und zu testen, insbesondere in seltenen oder gefährlichen Situationen [10]. Generative KI-Modelle sind sehr vielversprechend, um realistische Videosequenzen zu erzeugen. Noch fehlen heutzutage aber Methoden, um weitere Sensordaten mit ausreichender Qualität zu generieren.

Modellvalidierung

Obwohl viele Bildklassifizierer bei der Modellvalidierung im Durchschnitt gut abschneiden, kann ihre Leistungsfähigkeit bei Teildatenmengen, die im Training unterrepräsentiert waren, erheblich nachlassen. Diese systematischen Fehler können zum Beispiel die Fairness gegenüber demografischen Minderheiten oder die Robustheit und Sicherheit bei Domänenveränderungen beeinträchtigen. Eine große Herausforderung besteht darin, solche Untergruppen zu identifizieren, wenn diese nicht annotiert werden und sehr selten sind. Der Ansatz Promptattack [11] nutzt Text-zu-Bild-Modelle. Er dient dazu, Untergruppen von Bilddaten zu suchen, die durch dieselben Prompts erzeugt wurden und bei denen das Zielmodell eine geringe Performance zeigt. Systematische Fehler auf Untergruppen der Operational Design Domain können mit diesem Ansatz mit hoher Genauigkeit identifiziert werden.

Anonymisieren personenbezogener Daten

Insbesondere Bilddaten aus dem Straßenverkehr enthalten oft personenbezogene Daten, die DSGVO-konform zu verarbeiten sind. Sicherheit und Datenschutz erhöhen den Entwicklungsaufwand und schränken die Verwendung der Daten ein. Deshalb sollten Bilder, die personenbezogene Daten wie Gesichter oder Nummernschilder enthalten, möglichst vor der Verwendung anonymisiert werden. Klassische Methoden wie Weichzeichnen oder Zuschneiden können das KI-Training negativ beeinflussen [12]. Hier kann generative KI dabei helfen, diese Elemente durch künstlich generierte Ersatzelemente zu anonymisieren [13].

Annotation seltener und kritischer Ereignisse

Seltene und kritische Ereignisse lassen sich in der erzeugten Datenmenge nur schwer identifizieren. Ein klassischer Ansatz, um dieses Problem zu lösen, ist die Nutzung von Metadaten. Hierfür müssen Merkmale für kritische Ereignisse zum Zeitpunkt der Annotation bereits bekannt sein. Zudem ist dieser Ansatz sehr aufwendig - jedes weitere Metadatum erhöht Aufwand und Kosten für die Annotation. Abhilfe kann hier generative KI mit Modellen wie CLIP [14] schaffen, indem sie eine auf Prompts - also auf Beschreibungen in natürlicher Sprache - basierte Suche von Bildern ermöglicht.
Im späteren Entwicklungs- und Validierungsprozess und im Kundenfahrzeug ist es nicht möglich, alle vorhandenen Daten aufzuzeichnen. Die Menge der zu übertragenden und zu speichernden Daten wäre zu hoch, Bild 4. Hier wird eine Vorfilterung im Fahrzeug benötigt, um kritische Szenarien zu identifizieren, die aufgezeichnet werden sollen. Diese kann auch durch eine Prompt-basierte Suche erfolgen. Der Vorteil gegenüber Alternativen wie speziell trainierten Klassifikatoren ist, dass nur das Prompt ausgetauscht werden muss, wenn andere Szenarien aufgezeichnet werden sollen. Damit dies funktioniert, muss das Grundmodell so optimiert werden, dass es in Echtzeit auf einem im Fahrzeug integrierten eingebetteten System läuft.

Fazit

Die Umsetzung und Einführung des Big Loop zur Entwicklung von ADAS/AD-Systemen ist eine komplexe Herausforderung, die eine enge Zusammenarbeit verschiedener Fachdisziplinen sowie der Einhaltung strenger regulatorischer Anforderungen bedarf. Fortschrittliche KI-Technologien wie Foundation Models, generative KI und multimodale Modelle bieten innovative Lösungen, um Prozesse wie Labeling oder Generierung von Testszenarien zu optimieren. Diese Technologien können entscheidend sein, um einen Wettbewerbsvorteil zu erlangen und die Entwicklung sicherer und leistungsfähiger ADAS/AD-Systeme bedeutend voranzutreiben.

Literaturhinweise

[1]
Ernst & Young (Hrsg.): Big Loop: Wie flottenbasierte Entwicklung zum Erfolg führen kann. Online: https://​www.​ey.​com/​de_​de/​automotive-transportation/​wie-die-big-loop-unternehmen-zu-gewinnern-macht, aufgerufen: 29. August 2024
 
[2]
Porsche (Hrsg.): Big Loop: Künstliche Intelligenz und Machine Learning. Online: https://​newsroom.​porsche.​com/​de/​2021/​innovation/​porsche-engineering-big-data-loop-25144.​html, aufgerufen: 29. August 2024
 
[3]
ITK Engineering (Hrsg.): Data Act: Die EU revolutioniert den Datenmarkt - das müssen Sie wissen. Whitepaper. Online: https://​www.​itk-engineering.​de/​unternehmen/​downloads-whitepaper/​, aufgerufen: 29. August 2024
 
[4]
ITK Engineering (Hrsg.): Künstliche Intelligenz in sicherheitskritischen Automotive-Anwendungen. Whitepaper. Online: https://​www.​itk-engineering.​de/​unternehmen/​downloads-whitepaper/​, aufgerufen: 29. August 2024
 
[5]
Fang, Y. et al.: EVA-02: A Visual Representation for Neon Genesis. Online: https://​arxiv.​org/​abs/​ 2303.​11331, aufgerufen: 29. August 2024
 
[6]
Ravi, N. et al.: SAM 2: Segment Anything in Images and Videos. Online: https://​ai.​meta.​com/​research/​publications/​sam-2-segment-anything-in-images-and-videos/​, aufgerufen: 29. August 2024
 
[7]
Li, Y.; Zhang, D. et al.: Intra-Source Style Augmentation for Improved Domain Generalization. Online: https://​arxiv.​org/​abs/​2210.​10175, aufgerufen: 29. August 2024
 
[8]
Xu, S.; Huang, Y. et al.: Inversion-Free Image Editing with Natural Language. Online: https://​arxiv.​org/​abs/​2312.​04965, aufgerufen: 29. August 2024
 
[9]
Illyasviel: ControlNet. GitHub, 2024. Online: https://​github.​com/​lllyasviel/​ControlNet, aufgerufen: 29. August 2024
 
[10]
Bieshaar, M. et al.: KI Data Tooling - Introducing KI-DT Data Kit Framework for building resilient automotive AI. Online: https://​www.​ki-datatooling.​de/​de/​results#c1826, aufgerufen: 29. August 2024
 
[11]
Metzen, J. H. et al.: Identification of Systematic Errors of Image Classifiers on Rare Subgroups. Online: https://​arxiv.​org/​abs/​2303.​05072, aufgerufen: 29. August 2024
 
[12]
Hukkelås, H.; Lindseth, F.: Does Image Anonymization Impact Computer Vision Training?. Online: https://​arxiv.​org/​abs/​2306.​05135, aufgerufen: 29. August 2024
 
[13]
Klemp, M. et al.: LDFA: Latent Diffusion Face Anonymization for Self-driving Applications. Online: https://​arxiv.​org/​abs/​2302.​08931, aufgerufen: 29. August 2024
 
[14]
Radford, A. et al.: Learning Transferable Visual Models From Natural Language Supervision. Online: https://​arxiv.​org/​abs/​2103.​00020, aufgerufen: 29. August 2024
 

Unsere Produktempfehlungen

ATZ - Automobiltechnische Zeitschrift

Das Fachmagazin für das technikorientierte Management in der Automobilindustrie bietet hochaktuelle Informationen aus Forschung und Entwicklung. 

Lassen Sie sich jetzt unverbindlich 2 kostenlose Ausgabe zusenden.

Metadaten
Titel
Generative KI im Datenlebenszyklus des autonomen Fahrens
verfasst von
Stefan Held
Daniel Burkhart
Publikationsdatum
01.01.2025
Verlag
Springer Fachmedien Wiesbaden
Erschienen in
ATZ - Automobiltechnische Zeitschrift / Ausgabe 1/2025
Print ISSN: 0001-2785
Elektronische ISSN: 2192-8800
DOI
https://doi.org/10.1007/s35148-024-2161-3