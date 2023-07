Gefährdete vierte Landessprache – Eine KI zur Rettung des Rätoromanischen Die künstliche Intelligenz @llegra spricht die rätoromanische Sprachvarietät Vallader und soll es vor allem Kindern erleichtern, das gefährdete Idiom zu erlernen. Joachim Laukenmann

Allegra, eu sun ün assistent artificiala per vallader – Grüezi, ich bin ein künstlicher Assistent für Vallader. So begrüsst der Chatbot @llegra seine Gesprächspartnerinnen und Gesprächspartner beim Chat. Er wurde auf Basis des KI-Sprachmodells GPT-4 der US-Firma Open AI eigens für Unterhaltungen im bedrohten rätoromanischen Idiom Vallader optimiert – und soll zu dessen Rettung beitragen.

Vallader ist eines der fünf Idiome des Bündnerromanischen. Gerade mal 0,5 Prozent der Schweizer Bevölkerung sprechen Rätoromanisch, davon rund 7000 Personen Vallader, und zwar im Unterengadin zwischen Martina im Nordosten und Zernez im Südwesten sowie im Val Müstair. Bei schriftlichen Eingaben in Deutsch, Englisch oder Rätoromanisch antwortet der Chatbot @llegra auf Vallader, sowohl in Schriftform als auch in gesprochener Sprache.

«@llegra ist ein Tool für die Sprachförderung», sagt Oliver Bendel, Professor im Kompetenzschwerpunkt Digital Trust der Fachhochschule Nordwestschweiz (FHNW), der @llegra zusammen mit dem Entwickler Dalil Jabou kreiert hat. «Insbesondere Kinder können damit zu Hause oder in der Schule Vallader lernen.»

Der Vallader-Chatbot kann aber noch mehr. Ihm steht das geballte Wissen von GPT-4 zur Verfügung. So weiss @llegra zum Beispiel erstaunlich viel über Orte und Sehenswürdigkeiten im Unterengadin. Nur antwortet er auf Anfragen im Gegensatz zu Chat-GPT und anderen KI-Chatbots immer auf Vallader. @llegra vertont dabei die Textausgabe von GPT-4 mithilfe eines Text-to-Speech-Systems von Slowsoft aus Zürich, das die Firma speziell für Vallader entwickelt hat.

Es mag erstaunen, dass das von der US-Firma Open AI entwickelte Sprachmodell überhaupt Vallader beherrscht. Der Grund: «GPT-4 wurde mit allen möglichen Dokumenten abgefüllt, auch solchen in Vallader», erklärt Bendel. «Das Idiom ist also in diesem Sprachmodell enthalten. Tatsächlich erwies sich dieses sogar als sehr mächtig innerhalb dieses Idioms. Wir haben bei @llegra nur die Spracheingabe auf Rätoromanisch, Deutsch und Englisch beschränkt sowie die Ausgabe auf Vallader.»

«Wir freuen uns, dass für eines der rätoromanischen Idiome ein Bot am Entstehen ist.» Andreas Gabriel, Generalsekretär ad interim der Lia Rumantscha

Eine zusätzliche Wissensdatenbank, auf die @llegra ebenfalls zugreift, haben Bendel und Jabou mit in Vallader verfassten Sätzen aus Kinderbüchern gefüttert. Die Datenbank erweitert somit das spezifisch für Kinder relevante Wissen über GPT-4 hinaus und wird bei bestimmten Eingaben in @llegra abgerufen.

Andreas Gabriel, Generalsekretär ad interim der Lia Rumantscha, des Dachverbands aller romanischen Sprachvereine, hat @llegra getestet. «Wir freuen uns, dass für eines der rätoromanischen Idiome ein Bot am Entstehen ist», sagt Gabriel. «Wir erachten Applikationen wie @llegra grundsätzlich als wichtige und spannende Ergänzungen zu den bekannten Lernformaten und sehen sie als Chance, den Einstieg in die rätoromanische Sprachwelt zu erleichtern und das Interesse für das Rätoromanische zu fördern.»

Je nach Verwendungszweck müsste @llegra angepasst werden

Erfreulich ist laut Gabriel, dass @llegra wohl so konzipiert ist, dass es die anderen rätoromanischen Sprachvarietäten verstehen und auf Vallader antworten kann. «Das ist eine Eigenschaft, die das System von vergleichbaren, bereits öffentlich zugänglichen Diensten unterscheidet.» Je nach Verwendungszweck müsste die Informationsbasis allerdings angepasst werden. «Insbesondere für Kinder ist es wichtig, dass auf Alter und Vorwissen abgestimmte Mittel eingesetzt werden. Daher denken wir, dass gute, strukturierte und didaktische Lernangebote in absehbarer Zeit nicht gänzlich durch solche Applikationen ersetzt werden können.»

Bezüglich Sprachniveau und Wissensstand zeigt die getestete Version von @llegra laut Gabriel noch Entwicklungspotenzial. «Uns ist bewusst, dass dies keine Schwäche des Chatbots selbst ist, sondern eine Frage der Ressourcen und @llegra zurzeit noch ein experimentelles Projekt und kein Endprodukt ist.» Zum Beispiel umfasse das Vokabular von @llegra noch Ausdrücke anderer lateinischer Sprachen. Zudem bräuchte es systematische Anpassungen bei der Sprachausgabe, damit @llegra zum Beispiel lerne, dass die korrekte Aussprache von «svolar» (fliegen) «schvolar» sei.

Dennoch lautet das Fazit von Gabriel: «Gratulaziun für diesen tollen Ansatz. Wir würden uns sehr freuen, wenn @llegra dranbleiben und weiter Vallader sowie die weiteren rätoromanischen Idiome lernen würde.»

Ein Chatbot für ausgestorbene Sprachen wie Ägyptisch

Grundsätzlich liesse sich ein entsprechender Chatbot auch für andere seltene Dialekte und Idiome der Schweiz entwickeln, sagt Bendel. Eine Bedingung ist allerdings, dass jeweils genug Schriften vorliegen, die den Weg in GPT-4 gefunden haben. Zudem braucht es eine Sprachausgabe, wie Slowsoft sie eigens für Vallader aufgebaut hat. Bendel plant nicht, aus Chatbots wie @llegra ausgereifte Produkte zu machen. «Wir beschränken uns auf die Entwicklung von Prototypen.»

Davon hat der Forscher der FHNW schon mehrere kreiert. So hat er 2013 den Goodbot entwickelt, der nach bestimmten moralischen Regeln agiert und dem Nutzer im Notfall weiterhilft, etwa mit einer Kontaktnummer. 2016 kam der nächste Schritt: Bendel hat den Lügenbot präsentiert, der mit sieben verschiedenen Strategien systematisch lügt – ein Thema, das jüngst mit den Halbwahrheiten und Falschinformationen, die Chatbots wie Chat-GPT verbreiten, brandaktuell geworden ist.

Zwei Jahre später, 2018, hat Bendel den Bestbot präsentiert, der mit Gesichts- und Emotionserkennung ausgestattet ist. Brisant ist der Bestbot laut Bendel insbesondere vor dem Hintergrund, dass immer mehr Überwachungssysteme auf Physiognomik setzen, also versuchen, aus dem Äusseren eines Menschen auf dessen Charakterzüge, politische Gesinnung oder Gewaltbereitschaft zu schliessen.

Als Nächstes möchte Bendel nach dem Vorbild von @llegra einen Chatbot entwickeln, der eine ausgestorbene Sprache zum Leben erweckt. «Eine Möglichkeit wäre Ägyptisch», sagt Bendel. «Dazu liegen viele schriftliche Dokumente vor. Der Chatbot würde wohl Cleop@tra heissen. Aber das ist vorerst noch ein Wunschtraum.»

