Das FFG NGS-Projekt „Next Generation Safety“ zielte darauf ab, eine KI-basierte Automatisierung im Air Traffic Management (ATM) bereitzustellen. Insbesondere soll die Sicherheit, Zuverlässigkeit und Geschwindigkeit in Air Traffic Management (ATM)-Prozessen durch künstliche Intelligenz (KI) erhöht werden, wobei der Schwerpunkt auf der Automatisierung (i) der Kommunikation zwischen Fluglotsen und Piloten und (ii) der Situationsüberwachung und -korrektur liegt Maßnahmen, die die Situation erfordert. Die KI-Automatisierung von Standardsituationen ermöglicht es Fluglotsen, sich mit geringerem Stresslevel und mehr Zeit auf sicherheitskritische, komplexe Situationen zu konzentrieren.
Dieses Projekt erforscht und entwickelt neue KI-Algorithmen und Methoden in den Bereichen Speech-2-Text (Spracherkennung), kontextsensitiver Dialog (Natural Language Processing & Understanding) und Text-2-Speech (menschliche Sprachsynthese) zur Automatisierung der Kommunikation zwischen Fluglotsen und Piloten sowie ein Entscheidungsautomatisierungssystem für die ATM-Prozessautomatisierung. Zur Evaluation von KI in sicherheitssensiblen Umgebungen wird eine Simulationsumgebung für ATM-Prozesse entwickelt und ein externer Beirat mit Fluglotsen, Piloten, Flughäfen, Fluggesellschaften und anderen zusammengestellt.
Die industriellen Forschungsergebnisse aus der Kooperation zwischen dem Sprach-KI-Spezialisten ONDEWO und dem ATM-Marktnischenführer Frequentis eröffneten neue Möglichkeiten für die KI-Automatisierung im ATM-Bereich, um das nächste Sicherheitslevel im Flugverkehr zu erreichen, das wir Menschen nicht erreichen können allein mit unserer kognitiven Leistungsfähigkeit. Als Grundlage für diese Forschung wurde die ONDEWO Call Center AI Platform (CCAI) verwendet, um die fortschrittlichen Algorithmen der künstlichen Intelligenz durchzuführen und zu entwickeln.
Das Projekt umfasste eine technische und betriebliche Bewertung mit mehr als 100 Testläufen und der Sammlung von Rückmeldungen von 12 Fluglotsen (ATCOs). Es wurde von einem Beirat bestehend aus Austro Control, Skyguide und Austrian Airlines unterstützt, um eine operative Sichtweise hinzuzufügen. Die Speech-2-Text-Transkriptionsverarbeitung war sehr schnell mit einer durchschnittlichen Zeit von 1,6 Sekunden, um durchschnittlich 5-8 Sekunden Eingangsaudio zu verarbeiten. Die Funktranskription wurde auf WER 13–14 % und CER 8–10 % im Vergleich zu WER von 16 % oder mehr bei Cloud-Engines optimiert.
Aufgrund der guten Zusammenarbeit mit Frequentis, dem interessanten Feedback der Teilnehmer aus dem Beirat und den aktuellen Erkenntnissen freuen wir uns über den besonders erfolgreichen Abschluss dieses komplexen Forschungsvorhabens. Aus den Erkenntnissen dieses Forschungsprojekts ergeben sich weitere mögliche Use Cases im ATM-Bereich für Forschungs- und kommerzielle Ideen.
Für detailliertere Ergebnisse besuchen Sie bitte hier die offizielle Pressemitteilung unseres Projektpartners Frequentis.