wissen.de Artikel
Wie Kochbücher oder Bauanleitungen interaktiv werden
Die Situation kennen einige von uns: Es soll selbstgemachte Pizza geben und man steht in der Küche, hat die Hände voller Mehl. Dann fragt man sich plötzlich: „Wie viel Wasser muss nochmal in den Teig?“ Jetzt mit schmutzigen Fingern das Kochbuch oder Tablet anfassen, um das nachzuschlagen, will man eigentlich nicht. Viel angenehmer wäre doch, einfach die Frage stellen zu können und von einem Computer per Sprachausgabe die Antwort zu erhalten.
Genau dies wollen Wissenschaftler um den Computerlinguistik-Professor Alexander Koller von der Universität des Saarlandes entwickeln. Was bei Sprachassistenten wie Alexa, Siri und CO schon funktioniert, soll in Zukunft auch ihr digitales Kochbuch können. Darüber hinaus soll das interaktive Kochbuch seine Benutzer aber auch schrittweise durch die Zubereitung einer Speise oder eines Gebäcks führen. Dabei soll sich das System an die Kocherfahrung des individuellen Nutzers anpassen und auf Rückfragen reagieren. Geplant ist es, das interaktive Kochbuch später als App herauszubringen.
Rezepte sind für Computer schwere Kost
Voraussetzung für eine solchen digitalen Koch- und Backhelfer ist es allerdings, dass das Computersystem die Rezepte inhaltlich versteht. Helfen sollen bei der Entwicklung dieses mitdenkenden Kochbuchs verschiedenen Methoden aus dem Werkzeugkasten der künstlichen Intelligenz, etwa das Maschinelle Lernen mit neuronalen Netzen. Konkret müssen die Wissenschaftler dafür zunächst einen Algorithmus entwickeln, der der Rezepttexte automatisch ausliest und in für den Computer verständliche Ablaufdiagramme übersetzt.
„Rezepte als Textsorte weisen viele sprachliche Eigenheiten auf, die für Computer schwer zu handhaben sind“, erklärt Koller. So werden zahlreiche Informationen und Anweisungen implizit vorausgesetzt. „Sätze wie ‚Gemüse bereitlegen. Schneiden.‘ sind für uns Menschen leicht verständlich. Dem Computer fehlt aber vor allem bei der Anweisung ‚Schneiden.‘ jegliches Bezugswort, so dass wir Mittel und Wege finden müssen, diese semantischen Verbindungen trotzdem zu erkennen“, erklärt Koller.
An die Kocherfahrung angepasst
Dann müssen die Forscher dem Programm beibringen, das bestimmte Schritte beim Kochen mit unterschiedlich ausführlichen Anweisungen beschrieben werden können. Nur so kann das interaktive Kochbuch sich später daran anpassen, ob ein Anfänger oder Fortgeschrittener das Rezept nachkocht. Während für einen Profi die Anweisung „Kartoffeln kochen“ völlig ausreicht, benötigt ein Anfänger möglicherweise noch genauere Erläuterungen dazu, wie man dies tut.
Auch die Sprachausgabe des interaktiven Kochbuchs ist eine Herausforderung: Koller und sein Team wollen erreichen, dass das Kochbuch nicht nur Versatzstücke aus dem ursprünglichen Rezepttext in der richtigen Reihenfolge wiedergibt, sondern eigene, korrekte Äußerungen generiert. „Bekannte Methoden zur Sprachsynthese wie der Algorithmus GPT-3 können zwar äußerst überzeugend wirkende, sprachlich schöne Texte produzieren – inhaltlich sind diese aber oft mangelhaft", erklärt Koller. "Da es bei Rezepten aber gerade auf inhaltliche Präzision ankommt, müssen wir aufpassen, dass uns der Sprachsynthese-Algorithmus nicht entgleist und Sachen hinzuerfindet, nur weil sie schön klingen."
Einsatz auch in anderen Bereichen
Für die Computerwissenschaftler ist das interaktive Kochbuch nur ein Beispiel dafür, wie fortgeschrittene Dialogsysteme zu sprachfähigen Helfern werden könnten. Gerade wenn es darum geht, komplexe Textanweisungen interaktiv und an den Nutzer angepasst vermitteln, könnte sie in Zukunft wertvolle Hilfe leisten. Sind solche Algorithmen einmal entwickelt, könnten sie auch sprachliche Anweisungen zu Bauanleitungen geben oder das Lernen klar strukturierter Vorgänge unterstützen.
Quelle: Universität des Saarlandes