Prädiktion von maschineller Wahrnehmungsleistung beim automatisierten Fahren
Einleitung
Beim hoch- und vollautomatisierten Fahren ist es aufgrund der dem Fahrer zugebilligten Nebenaufgaben notwendig, dass das Fahrzeug Einschränkungen seiner maschinellen Wahrnehmung sowie Funktionseinschränkungen darauf aufbauender Verarbeitungsmodule selbst erkennt und darauf adäquat reagiert. Während man aufgrund von Simulatorstudien beim hochautomatisierten Fahren von realistischen Übergabezeiten an den Fahrer von fünf bis zehn Sekunden ausgeht [1], [2], bevor dieser die Fahraufgabe wieder sicher übernehmen kann, wäre beim vollautomatisierten Fahren der Mensch überhaupt keine Rückfallebene mehr. Das Fahrzeug müsste bei Funktionseinschränkungen vollständig selbst einen eigensicheren Zustand erreichen können. Aber auch mögliche Übergabezeiten von fünf Sekunden und mehr erfordern eine weitgehende, wenn auch zeitbegrenzte Autonomie des Fahrzeugs, um diesen Zeitraum unter allen Umständen sicher überbrücken zu können. Um diesen Grad der Autonomie erreichen zu können, muss das Fahrzeug seine Umgebung wahrnehmen, geeignet interpretieren und daraus kontinuierlich sichere Handlungen ableiten und ausführen. Technisch wird diese Aufgabe durch einzelne, aufeinander aufbauende Verarbeitungsmodule gelöst. Eine vereinfachte Darstellung der Zusammenhänge zeigt Abb. 20.1.
Abb. 20.1 Grobstruktur der Informationsverarbeitung bei der automatischen Fahrzeugführung
Die maschinelle Wahrnehmung der Fahrumgebung erfolgt durch verschiedene am Fahrzeug verbaute Sensoren wie Kameras oder Radarsensoren. Hinzu kommen in der Regel weitere Informationen über das statische Fahrumfeld aus hochgenauen digitalen Karten. Sie sind allerdings nur dann nutzbar, wenn das Fahrzeug seine genaue Position kennt. Somit ist als weiteres Funktionsmodul auch eine Eigenlokalisation des Fahrzeugs für den Kartenabgleich erforderlich. Das Ergebnis der maschinellen Wahrnehmung ist ein dynamisches Fahrzeugumfeldmodell, in dem das eigene Fahrzeug sowie alle anderen Verkehrsteilnehmer durch individuelle Bewegungsmodelle repräsentiert sind. Ferner sollten alle relevanten
Infrastruktureinrichtungen wie Verkehrsschilder und Lichtsignalanlagen, aber auch strukturierende Elemente wie Verkehrsinseln und Bordsteine sowie Fahrbahnmarkierungen für die Fahrstreifeneinteilung, gesperrte Flächen oder Fußgängerüberwege in Form von Zebrastreifen enthalten sein.
Aufbauend auf diesem Fahrzeugumfeldmodell werden dann bei der Situationserkennung alle Einzelkomponenten in Beziehung zueinander gesetzt, um aus den Abhängigkeiten der Einzelelemente ein maschinelles Szenenverständnis zu errechnen. Im darauf aufbauenden Modul der Situationsprädiktion werden verschiedene mögliche zeitliche Entwicklungen der Szene, auch Episoden genannt, vorausberechnet und hinsichtlich der Wahrscheinlichkeit des Eintretens bewertet. Eine Episode kennzeichnet damit in diesem Beitrag eine mögliche spezifische zeitliche Entwicklung einer erkannten Verkehrsszene, wobei der Zeithorizont im Bereich von wenigen Sekunden liegt. Auf Basis dieser situativen Informationen ermittelt das darauf aufbauende Modul eine übergeordnete Handlungsplanung. Sie könnte beispielsweise das Umfahren eines Hindernisses oder das Überholen eines langsameren Fahrzeugs vorsehen. Zur Ausführung der Pläne werden dann mögliche Trajektorien des Fahrzeugs mit einem typischen Zeithorizont von drei bis fünf Sekunden berechnet und hinsichtlich Sicherheit und Komfort bewertet. Die nach vorgebbaren Kriterien optimale Trajektorie wird von der Fahrzeugregelung ausgeführt. Der beschriebene Bearbeitungsprozess wird fortlaufend, in der Regel schritthaltend mit der sensorischen Erfassung erneut durchgeführt, um auf Aktionen und Reaktionen anderer Verkehrsteilnehmer reagieren zu können.
Die Beschreibung dieser technischen Prozesskette macht deutlich, dass ein Ausfall der maschinellen Wahrnehmung umgehend zu so großen Unsicherheiten in der Situationsbewertung führen würde, dass eine sichere Handlungsplanung und Handlungsausführung nicht mehr gewährleistet werden kann. Die Degradation des maschinellen Szenenverständnisses und der darauf aufbauenden Handlungsplanung und Handlungsausführung ist situationsabhängig; eine zuverlässige Prädiktion wird typisch aber zwei bis drei Sekunden nicht übersteigen können. Es ist somit evident, dass eine Mindestwahrnehmungsleistung schon beim hochautomatisierten Fahren aufgrund der deutlich größeren Übergabezeiträume an den Fahrer notwendig ist. Ein Komplettausfall der maschinellen Wahrnehmung ist unter allen Umständen zu vermeiden, wobei dies natürlich auch für die darauf aufbauenden Module und die Fahrzeugregelung mit ihren Sensoren und Aktoren gilt, die aber nicht im Fokus dieses Beitrags stehen.
Es stellt sich daher die Frage, ob Einschränkungen in der Funktion der maschinellen Wahrnehmung erkennbar oder sogar prädizierbar sind und, falls ja, über welchen Zeitraum. In den folgenden Abschnitten werden hierzu nach dem Stand der Technik bekannte methodische Ansätze diskutiert und darauf aufbauend mögliche Forschungsfragen abgeleitet.