Das Projekt KI-DeltaLearning, das vom 1. Januar 2020 bis zum 30. April 2023 durchgeführt wurde, lieferte eine vollständig integrierte Datenverwaltungs- und -verarbeitungsplattform, die den gesamten Arbeitsablauf von der Erfassung der Sensor-Rohdaten bis zur Erzeugung von Ground-Truth-Labels für Machine-Learning-Modelle unterstützt. Die Plattform, die im Arbeitspaket 1.1 entwickelt wurde, besteht aus einer Benutzeroberfläche, die einen umfassenden Überblick über alle verfügbaren Datensätze bietet, einschließlich wichtiger Metadaten wie Länge des Datensatzes, Erstellungsdatum und Status der automatischen und manuellen Verarbeitungsschritte. Benutzer können Datensätze filtern und suchen, Videodaten ansehen und die zeitliche Entwicklung einzelner Attribute untersuchen. Für jeden Datensatz ermöglicht die Schnittstelle die manuelle Freigabe von „Schlüsselbildern“; diese Bilder erzeugen Zeitstempel, die an ein Beschriftungsteam weitergeleitet werden. Das Team kommentiert die entsprechenden Video- und LiDAR-Daten, indem es den Bildregionen Objektklassen zuordnet und so die für das Training der Algorithmen erforderlichen Grundlagen schafft.
Hinter den Kulissen orchestriert die Plattform eine Abfolge von containerisierten Prozessen: Datenvalidierung und -import, Videoerstellung aus Rohdatenströmen, automatische Auswahl von Schlüsselbildern, Extraktion aller Sensordaten für die ausgewählten Schlüsselbilder (einschließlich der Anonymisierung von Gesichtern und Nummernschildern) und die Erstellung einer Sitzung im C.LABEL System für das Beschriftungsteam. Die containerisierte Architektur bietet eine hohe Flexibilität, so dass einzelne Verarbeitungsschritte hinzugefügt oder geändert werden können, ohne den gesamten Arbeitsablauf zu stören. Das Design der Plattform erfüllt die Ziele des Projekts: Datensätze können schnell eingesehen und verarbeitet werden, der Großteil des Arbeitsablaufs ist automatisiert und die Anonymisierung zur Wahrung der Privatsphäre ist integriert. Die Benutzer haben berichtet, dass das System sehr benutzerfreundlich und für ihre Bedürfnisse relevant ist, und die Plattform wird als wiederverwendbare Komponente für zukünftige Kundenprojekte positioniert.
Zusätzlich zu den Kernarbeiten der Datenverarbeitung trug CMORE Automotive zur Evaluierungsphase (TP 5) bei. Im Arbeitspaket 5.1 überprüfte das Konsortium die Ergebnisse früherer Phasen und leitete daraus Änderungen der Anforderungen für die nachfolgenden Phasen ab. Im Arbeitspaket 5.2 entwickelte CMORE Referenzmodelle für Baseline und Training, während in 5.3 die Plattform anderen Partnern als Demonstrator zur Verfügung gestellt wurde. Der finanzielle Aufwand für das Projekt belief sich auf 232.285,35 € für Personalkosten, 377.037,00 € für externe F&E-Dienstleistungen und 27.917,59 € für andere direkte Projektkosten. Dies unterstreicht die beträchtliche Investition, die erforderlich ist, um ein System von Grund auf neu zu entwickeln, anstatt bestehende Lösungen anzupassen.
Der Zeitplan des Projekts wurde um vier Monate verlängert, um Verzögerungen durch die COVID-19-Pandemie und die langwierige Aushandlung von Datenschutzvereinbarungen auszugleichen. Trotz dieser Rückschläge hat das Konsortium alle Meilensteine erreicht, und die containerisierte Cloud-Implementierung der Plattform gewährleistet langfristige Skalierbarkeit und Anpassungsfähigkeit. Das im Rahmen des Projekts entwickelte Anonymisierungsmodell wird als wiederverwendbare Komponente weiter verfeinert, so dass es in zukünftigen Kundenanwendungen eingesetzt werden kann. Durch die Einbeziehung von Erstausrüstern, Tier-1-Zulieferern und anderen Akteuren der automobilen Wertschöpfungskette hat das Konsortium den schnellen Transfer von Spitzenforschung in die industrielle Praxis erleichtert und die Plattform als Referenz für datengesteuerte Automobilforschung und -entwicklung positioniert. Das Projekt wurde von deutschen Forschungseinrichtungen finanziert, was die nationale Unterstützung für die Förderung datenzentrierter Automobiltechnologien widerspiegelt.
