Eine Bevölkerung digitalisiert ihre Sprache
Moderne Ansätze in der Entwicklungshilfe sollen den Anschluss Afrikas an Schlüsseltechnologien sichern.
Ideen-Hackathon in Kigal, Ruanda: So sollen lokale Programmieren erfahren, wie sie Open-Source-Sprachtechnologien in ihrer eigenen Sprache entwickeln können. (Bild: ZVG Daniel Brumund)
Es war eine bemerkenswerte Kooperation, die das deutsche Bundesministerium für wirtschaftliche Zusammenarbeit und Entwicklung (BMZ) und die US-amerikanische Mozilla Foundation, ein Schwergewicht aus dem Silicon Valley, Ende 2019 gemeinsam bekanntgaben. Sie wollen zusammen mit einem Heer an Freiwilligen die afrikanische Sprache Kinyarwanda digitalisieren. Kinyarwanda wird von zwölf Millionen Menschen gesprochen, ist in Ruanda sowie in angrenzenden Gebieten der Demokratischen Republik Kongo und Ugandas verbreitet und gehört zur Gruppe der Bantu-Sprachen. Doch was hat das mit Entwicklungshilfe zu tun?
Via Sprache ins Internet
Hintergrund dieser Initiative ist, dass die Schlüsseltechnologie «künstliche Intelligenz» KI auch die Bevölkerung in Afrika erreicht. Denn versteht ein Computer oder ein Smartphone erst einmal direkt Sprachbefehle, muss derjenige, der sie bedient, im Grunde gar nicht mehr schreiben können. Deshalb nehmen in den Industrieländern die sprachgesteuerten Zugriffe auf das Internet inzwischen mit grosser Geschwindigkeit zu. Doch im Gegensatz zu den Sprachen in den Industrieländern ist die Digitalisierung einer Sprache Afrikas mit viel höherem Aufwand verbunden.
Um eine schnelle Übersetzungsmaschine zu programmieren, greifen die Ingenieure heutzutage auf KI zurück und konzipieren ein selbstlernendes System. Wie bei allen maschinellen Lernmodellen, muss eine effektive maschinelle Übersetzung mit riesigen Mengen an «Trainingsdaten» gefüttert werden, um adäquate Ergebnisse zu erzielen. Eine der grössten Herausforderungen im Zusammenhang mit afrikanischen Sprachen besteht darin, dass sie «ressourcenschwach» sind, dass also diese wichtigen Sprachdaten fehlen, verstreut oder nicht öffentlich zugänglich sind.
Abertausende Stunden Sprachaufnahmen werden digitalisiert
In der Welt der neuronalen maschinellen Übersetzung werden die Dokumente, die zur Erstellung der benötigten Datensätze dienen, als Korpora bezeichnet. Parallele Textkorpora – grosse Mengen von Texten, die Satz für Satz in mehreren Sprachen zugänglich sind – sind ein grosser Vorteil, wenn es darum geht, maschinelle Übersetzungsmodelle zu trainieren. Parallelkorpora sind in den grossen westlichen Sprachen kein Mangel, weil zum Beispiel die Entscheide und Dokumente der Europäischen Union qualitativ hochwertige, von Menschen übersetzte Parallelkorpora in einer grossen Vielfalt von EU-Sprachen bieten. Für afrikanische Sprachen fehlen solche Parallelkorpora jedoch, was reale Auswirkungen auf die Verfügbarkeit von Informationen im Internet hat.
Und genau dieses Problem soll mit der Initiative gelöst werden. Mit dem spannenden Projekt sollen nämlich mehrere tausend Stunden Sprachaufnahmen in Kinyarwanda digitalisiert werden. So können Computersysteme mittels KI lernen, diese afrikanische Sprache zu erfassen und zu verstehen. Später sollen dann weitere Sprachen nicht nur im Kongobecken digital erfasst werden.
Sätze werden laut vorgelesen und digital aufgenommen
Die Mozilla Foundation hat dafür eigene Tools entwickelt. Mit einem Community-getriebenen Ansatz werden Menschen eingebunden, mitzuhelfen, einen Sprachdatensatz in ihrer Sprache aufzubauen. Einige sind leidenschaftliche Freiwillige, andere tun dies im Rahmen ihrer täglichen Arbeit als Linguistinnen oder Ingenieure. Für ein solches Sprachprojekt wird eine Webseite aufgebaut, die Sätze und Beiträge vorgibt, diese müssen dann von jemandem vorgelesen und digital aufgenommen werden. Im BMZ-Projekt haben Tausende Freiwillige mit einem Smartphone oder Computer mitgeholfen, schon einen grossen Teil von Kinyarwanda zu digitalisieren.
Pflanzenkrankheiten werden automatisiert erkannt
Die Entwicklung sprachgestützter Anwendungen sollen der lokalen Bevölkerung einen Mehrwert in ihrem täglichen Leben bieten. Beispielsweise können Kleinbauern in Ruanda so auf eine Fülle von Informationen zugreifen. Dabei bietet KI nicht nur neue Möglichkeiten, um etwa Pflanzenkrankheiten automatisiert zu erkennen. Die Bauern bekommen durch interaktive Sprachassistenten auch Zugang zu telefonischen Beratungsdiensten in der lokalen Sprache. So können sie umgehend Gegenmassnahmen ergreifen und die Ernteerträge steigern. Sprachgestützte Technologien ermöglichen Kommunikation in lokalen Sprachen. KI hilft so, digitale Dienste inklusiver zu gestalten, damit mehr Menschen von der digitalen Transformation profitieren.
Oder anders ausgedrückt: Man muss nicht mehr unbedingt eine Weltsprache oder eine westeuropäische Sprache beherrschen, um in einen Dialog per Internet treten zu können. Zur Erinnerung: In vielen afrikanischen Ländern hat der Aufbau der Mobilfunktechnologie dazu geführt, dass viele Menschen auch in wenig besiedelten Gebieten über diese Technologie Zugang zum Internet erhalten haben. Das Smartphone dient dabei als Zugang zu modernsten Diensten wie etwa Banking, Handel oder Informationsgewinnung. Dabei muss eine Einzelperson nicht einmal ein eigenes Smartphone besitzen. Viele Leute verfügen lediglich über eine eigene SIM-Karte und können sich ein Gerät für ihre notwendigen Erledigungen ausborgen.
«Nirgendwo in der Welt schreitet die Digitalisierung schneller voran als in Afrika»
Kein Wunder, ist der zuständige deutsche Minister Gerd Müller (CDU) stolz auf das Projekt. Er sagt bei der Lancierung: «Nirgendwo in der Welt schreitet die Digitalisierung schneller voran als in Afrika. Mit der Digitalisierung kann Afrika riesige Entwicklungssprünge machen und neue Angebote für Bildung, Ausbildung und Jobs schaffen. Künstliche Intelligenz ist dabei eine der Schlüsseltechnologien von morgen.» Wichtig seien dabei der Ausbau der lokalen Entwicklung in Afrika und ein hoher Datenschutz. Insgesamt investiert das deutsche Entwicklungsministerium in seiner Digitalinitiative in mehr als 200 Digitalprojekte in 30 afrikanischen Ländern: Von internetbasierter Bürgerbeteiligung über App-gesteuerte Verkaufswege für Landwirte bis zu Telemedizin in entlegenen Gebieten.
Das BMZ und Mozilla laden weitere interessierte Technologieunternehmen und Länder ein, eine Allianz zur Öffnung von Sprachdaten zu bilden. Solche Trainingsdaten benötigen afrikanische Start-ups, um passende KI-Anwendungen vor Ort zu entwickeln. Und darum sieht die Entwicklungshilfe für afrikanische Länder heute ganz anders aus.