Google-Maschine denkt wie ein Mensch

Im Brettspiel Go hat die künstliche Intelligenz die Herrschaft übernommen: Die selbstlernende Google-Software besiegte zunächst den weltbesten Spieler, danach sich selber.

Das Brettspiel Go versus Googles Künstliche Intelligenz. (Bild: Google DeepMind)

Die Geschichte Mensch gegen Maschine wiederholt sich. Der IBM-Computer Deep Blue gewann 1997 im Schach-Experiment über sechs Runden gegen Weltmeister Garri Kasparow 3,5:2,5 – nun ist auch das zweite bedeutende Brettspiel Go fest in Hand der künstlichen Intelligenz (KI). Im vergangenen Mai verlor der Weltranglistenerste Ke Jie in einem Go-Wettkampf über drei Runden gegen «AlphaGo» 0:3. Der Chinese blieb im asiatischen Strategiespiel gegen den Rivalen aus dem Google-Labor chancenlos.

Eine Meldung im englischen Wissenschaftsmagazin «Nature» lässt nun aufhorchen: Demis Hassabis und David Silver haben im KI-Forschungszentrum Deep Mind in London ein wahres Monster erschaffen: «Alpha Go Zero». Die von Googles Tochtergesellschaft weiterentwickelte KI-Software überrannte vor einem Monat die Muttermaschine in einem Vergleich 100:0. Was einfach nur verblüfft: «Alpha Go Zero» wurde durch Spiele gegen sich selbst so unfassbar stark.

Ein leeres Brett und 72 Stunden Training
Hatten die Intelligenzforscher die erste Version von «AlphaGo» noch mit 30 Millionen Partien der Go-Meister und Amateure aus Fleisch und Blut gefüttert, brauchte «Alpha Go Zero» bloss ein leeres Spielbrett mit schwarzen und weissen Steinen, Kenntnis der Regeln sowie die Zugfolge von 4,9 Millionen gegen sich selbst gespielte Go-Partien. 72 Stunden Training genügten dem Computerprogramm, um die Finessen des Spiels zu lernen und nach Analyse der eigenen Wettkämpfe herauszufinden, welche Strategien, Züge und Taktiken nötig sind, um eine Partie erfolgreich zu gestalten.

Tatsächlich brachte sich «Alpha Go Zero» also innerhalb weniger Tage selbst das Wissen bei, das sich Menschen seit Jahrtausenden angehäuft hatten. Die Konsequenz: «Alpha Go Zero» zerzauste alle seine Vorgängermaschinen – gänzlich ohne menschliche Unterstützung. Die Erkenntnisse dieses Go-Experiments, das Schätzungen zufolge 35 Millionen Dollar gekostet haben soll, könnten für die KI-Forschung bahnbrechend sein.

Go-Gott
Das ursprünglich aus China stammende Brettspiel ist hochkomplex. Der Go spielende Mensch brauchte die künstliche Intelligenz lange Zeit nicht zu befürchten, zu gross schien die Variantenvielfalt noch bis vor kurzem. Auf dem 19x19 horizontale und vertikale Linien umfassenden Brett können weitaus mehr verschiedene Stellungen entstehen als im Schach. Mehr noch: Die Zahl der Kombinationsmöglichkeiten ist grösser als die Zahl der Atome im Universum. Im Go, meinten Computerwissenschaftler seit den 1970er-Jahren, würden Intuition, Kreativität, Rechenleistung, Logik und Erfahrung den Menschen in einem Duell gegen die künstliche Intelligenz bevorteilen. Die Google-Forscher haben diese Meinung nun widerlegt und einen Lernalgorithmus entwickelt, der nicht nur dank gewaltiger Rechenkraft über die Kreativität des menschlichen Genies obsiegt. Nein, die Wissenschaftler aus dem Silicon Valley haben der Maschine gewissermassen Einsteins Muskel implantiert – «Alpha Go Zero» denkt wie ein Mensch. Vorbei sind die Zeiten, in denen Rechner blitzschnell, doch vollkommen ohne Verstand, digitale Daten durch ihre mächtigen Prozessoren jagten.

Der ehemals beste Go-Spieler der Welt, Lee Seedol, liess nach seiner vernichtenden Niederlage im Januar 2016 gegen «AlphaGo» verlauten, dass ein unorthodoxer, aber genialer Zug der Maschine sein Spiel kaputt gemacht habe. Auch Ke Jie zollte dem Monster aus Silicon Valley höchsten Respekt. Die Software habe 2016 noch wie ein Mensch gespielt, nun aber spiele sie wie ein Go-Gott, sagte der Weltranglistenerste der New York Times.

Belohnung nach jedem Zug
Wie denkt «Alpha Go Zero»? Die Forscher haben ein neuronales Netzwerk entwickelt und einen Algorithmus geschaffen, der das menschliche Gehirn und dessen Arbeitsweise nachzuahmen versucht. Kombiniert mit der Prüfung unfassbarer Datenmengen und der akkuraten Stellungsbewertung wählt der Computer jenen Zug aus, der ihm aus strategischer Sicht am erfolgversprechendsten erscheint, um das Spiel auf lange Sicht zu gewinnen. Dafür belohnt sich der Rechner mit Siegespunkten. Der nächste Zug erfolgt nach dem gleichen Denk- und Handlungsmuster. So lernt «Alpha Go Zero» mit jedem Zug dazu. Forscher bezeichnen diesen Prozess als Reinforcement Learning, auf Deutsch bestärkendes Lernen.

Medizin und Wissenschaft
Die gewonnenen Erkenntnisse aus dem Go-Experiment sollen nun in andere Künstliche-Intelligenz-Projekte einfliessen. «Ich hoffe, dass diese von unserem Algorithmus und von zukünftigen Versionen von ‹AlphaGo› inspirierten Bereiche, wie zum Beispiel Wissenschaft und Medizin, mit uns zusammen daran arbeiten werden, Grenzen zu erweitern», sagte «AlphaGo»-Erschaffer Demis Hassabis im US-amerikanischen Technologie-Magazin Wired. Um anzufügen: «Vielleicht werden wir irgendwann neue Arten von Akkus, Materialien und Medikamenten haben, die zum Teil durch solche Algorithmen zusammen mit dem Menschen entwickelt wurden.»

Im Schach und im Go «denken» Computer dank intelligenter Software bereits wie Menschen. Das kann zu denken geben. Ob die künstliche Intelligenz bald einen Witz erfinden – oder eine Symphonie komponieren wird?

Autor: Thomas Wälti


2000 Profis können vom Go leben

Im strategischen Brettspiel Go sitzen sich jeweils zwei Spieler gegenüber. Sie setzen abwechselnd weisse oder schwarze, linsenförmige Steine auf die Schnittpunkte der 19 horizontalen und 19 vertikalen Linien eines zu Beginn leeren Bretts, das aus 324 Feldern besteht. Ziel ist es, mit den eigenen Steinen möglichst viel Terrain abzustecken und gleichzeitig die Bewegungsfreiheit des Gegners einzuschränken – das geschieht mit dem Umzingeln seiner Steine. Traditionell stehen 181 schwarze und 180 weisse Steine zur Verfügung. An Turnieren wird in der Regel mit einem bestimmten Zeitlimit gespielt. Schachuhren kontrollieren die Bedenkzeit. Eine Partie kann bis zu acht Stunden dauern. Am Ende wird die Grösse der beherrschten Gebiete verglichen sowie die Anzahl gefangener Steine hinzugezählt. Wer am Schluss die höhere Punktzahl aufweist, hat das Spiel gewonnen.

Es gibt vier Grundregeln. Anders als beim Schach herrscht beim Go keine Zugpflicht. Das bedeutet, dass ein Spieler auf seinen Zug verzichten kann. Das Spiel endet auch meist dadurch, dass beide Spieler nacheinander passen. Sie greifen auf diese Möglichkeit zurück, wenn sie feststellen, dass weiteres Setzen keinen Punktgewinn oder sogar einen Punktverlust zur Folge hätte.

In China, Südkorea und Japan ist Go besonders populär. Laut Weltverband IGF spielen 18 Millionen Menschen gelegentlich Go (Online/Offline); 2,5 Millionen Leute nehmen regelmässig an Turnieren teil, 2000 Spieler verdienen ihren Lebensunterhalt als Go-Profi – sechs davon sind Europäer. Es gibt drei Stärkeklassen: Schülergrade (Kyu), Meistergrade und Profigrade, die vom 1. bis zum 9. Dan gehen. Weltklassespieler messen sich an Turnieren, die von Tageszeitungen oder Unternehmen wie LG oder Toyota gesponsert werden und Preisgelder von bis zu 300 000 Euro ausschütten. Eine Weltmeisterschaft für professionelle Go-Spieler gibt es nicht.

Der Schweizer Go-Verband hat rund 300 Mitglieder.