wespennest zeitschrift
Wespennest Backlist
Thomas Eder
Künstliche Intelligenz auf dem Holzweg

Mit frei verfügbaren Übersetzungsprogrammen lassen sich selbst komplexe Satzkonstruktionen beeindruckend – oder erschreckend – gut übertragen. Thomas Eder konfrontiert eine viel gelobte Software mit einem „Holzwegsatz“ des US-amerikanischen Linguisten Thomas Bever und zeigt gewitzt ihre Grenzen auf. Hat die humane Textproduktion also doch eine Zukunft?

Die Leistungen der sogenannten Künstlichen Intelligenz auf dem Feld der Sprachverarbeitung, und nicht nur dort, sind enorm. Maschinelle Methoden, Texte zu verfassen oder zwischen verschiedenen natürlichen Sprachen zu übersetzen, erzielen erstaunliche Ergebnisse. In vielen Fällen sind sie kaum von menschlich verfassten Texten zu unterscheiden, im Bereich des Journalismus etwa ist damit eine kostenschonende Alternative zu Redakteursgehältern in Aussicht. Humane Textproduktion, eine der „Königskategorien“ der Vernunfttätigkeit, gilt als Auslaufmodell.

Dagegen lässt sich nur mühsam argumentieren. In den unterschiedlichen Philosophien der Transhumanisten und Posthumanisten und deren Kritik finden sich dazu Ansätze, sie sind allerdings zumeist von grundlegenden ethischen Erwägungen oder aber von berechtigten, wenn auch überwindbaren Einwänden zur technischen Machbarkeit getragen. Auf diese Flughöhe der Debatte will ich nicht einschwenken, stattdessen ein kurzes Beispiel aus der Praxis eines Philologen geben, der sich einerseits mit syntaktisch komplexen Sätzen und Versen beschäftigt und andererseits gelegentlich eine viel gelobte und sehr verdienstvolle, frei verfügbare Übersetzungssoftware benützt.

Bei meinen Verstehensversuchen einer komplexen Ode mit dem Titel „Blödigkeit“ von Friedrich Hölderlin, vor allem am Beginn der dritten Strophe, habe ich das Erlebnis, auf dem Holzweg (nicht sensu Heidegger) zu sein. Tatsächlich bezeichnet die kognitive Linguistik, vor allem seit einer bahnbrechenden Arbeit von Thomas Bever, syntaktisch komplexe Sätze, die manche Schwierigkeiten beim Verstehen machen, als Holzwegsätze, im englischen Original als „garden path sentences“. Holzwegsätze halte ich für einen sehr angemessenen Begriff, ist es doch ihr herausragendes Merkmal, dass sie eine temporäre Ambiguität aufgrund ihres schwierigen Satzbaus erzeugen. Man versteht trivialerweise einen Satz beim Hören oder Lesen entlang seiner Wörter und Wortgruppen. Bei Holzwegsätzen folgt man ein Stück weit – beziehungsweise eine Zeit lang – einer bestimmten Annahme der syntaktischen Verhältnisse und wird dann ab einem bestimmten Wort getrieben, ‚zurückzugehen‘ und eine andere, davon abweichende syntaktische Zuordnung und grammatische Konstruktion anzunehmen. „The horse raced past the barn fell“ ist das viel zitierte Beispiel, bei dem bis zum Erreichen des Worts „fell“ durch die Hörenden/Lesenden das Wort „raced“ als Hauptverb im Präteritum verstanden wird – erst mit dem Auftauchen von „fell“ sind die Hörenden/Lesenden gezwungen, dieses als Hauptverb im Präteritum und „raced“ als Partizip Perfekt, das einen abgekürzten Relativsatz einleitet, zu verstehen. Auf Deutsch, mit unverkürztem Relativsatz: „Das Pferd, das an der Scheune vorbeirannte, stürzte.“ Und verkürzt: „Das Pferd, vorbeigerannt an der Scheune, stürzte.“

Die erwähnte Übersetzungssoftware beindruckt mich, einerseits ob ihrer Ergebnisse, andererseits, weil man ihr scheinbar beim Ringen um eine Übersetzungslösung zuschauen kann. Bei jedem Wort oder jeder Wortgruppe liefert sie mit variierender, aber eher geringer Verzögerung das bis dahin Eingegebene als das bis dahin von „ihr“ „Vermutete“ in der ausgewählten Zielsprache. (Natürlich ist sowohl meine Verwendung des Possessivpronomens „ihr“ als auch die Handlung des „Vermutens“ ein schlicht falscher Anthropomorphismus für das korrekt wohl „Parsen“ benennbare Verarbeiten des Satzes.)
Sie liefert als Ergebnis ihrer Übersetzung dieses englischen Satzes ins Deutsche: „Das Pferd raste an der Scheune vorbei fiel.“ In Teile portioniert geht das so vor sich:

Das Pferd / The horse
The horse raced / Das Pferd raste
The horse raced past / Das Pferd raste vorbei
The horse raced past the barn / Das Pferd raste an der Scheune vorbei
The horse raced past the barn fell / Das Pferd raste an der Scheune vorbei fiel

Ich bin zwar kein Prophet hinsichtlich der Geschicklichkeit der Programmierenden, die die Algorithmen dieser Übersetzungssoftware erstellen, aber die prinzipielle Machbarkeit einer korrekten Lösung bezweifle ich nicht. Was ich mit diesem simplen Beispiel befragen möchte, ist etwas anderes: Bei meinem Verstehen, soweit ich das mit Hilfe der ausgeführten Selbstbeobachtungen valide und nicht verzerrt schildern kann (denn auch das steht ja häufig in Zweifel), erlebe ich beim Erreichen des Wortes „fell“ etwas Besonderes an diesem Umschlagpunkt. Nun scheint es mir, dass ich meine Aufmerksamkeit auf die vorangehenden Wörter und Wortgruppen zurückwende, um das Wort „raced“ umzuverstehen und nun den verkürzten Relativsatz als korrekte, einzig möglich Aufschlüsselung des Satzbaus aufzufassen. Dieser Moment des Umschlagens hat eine klare phänomenale Qualität, ich bemerke die Nichtanschließbarkeit des Wortes „fell“ an das dahin von mir Verstandene, erlebe eine Art Fehlersignal, dessen phänomenale Qualität zu detaillieren wohl der Mühe lohnte, bin schließlich erfreut, hier doch etwas Licht in den Satz und mein Verstehen davon gebracht zu haben. Wahrscheinlich habe ich ein von Karl Bühler so genanntes „‘aha‘-Erlebnis“ bei diesem Sprachverstehen, viel expliziter wird er allerdings auch nicht: „[W]ie baut sich [ein (zusammengesetzter)] Gedanke im Bewußtsein des Hörers auf? Bei einfachen und bei geläufigen Sätzen erhält man darauf auch von den geübtesten V[ersuchs]p.[ersonen] keine Auskunft; mit dem Anhören scheint der Sinn fertig zu sein, ein Geschehen kann die Selbstbeobachtung überhaupt nicht konstatieren. Anders wird das erst, wenn eine Störung oder eine Erschwerung eintritt, da kann man dann häufig bemerken, daß nach dem Anhören der Worte der Sinn eine zeitlang auf sich warten läßt, um dann manchmal langsam, manchmal plötzlich, mit einem inneren Ruck ins Bewußtsein einzutreten. Die V[ersuchs]p.[erson] ruft häufig dabei laut oder leise aha!, der Sinn überrascht sie. […]“

Das ist es, was die Programmierenden von Parsern wohl kaum je hinkriegen: dass diese ihr Prozessieren phänomenal erleben, dass phänomenale Erlebnisse das Prozessieren von Sätzen begleiten. Ist also das Phänomenale und seine Imagination, als ein Erzeugen von Sinn anhand von formalen Zeichenketten, wie es Sätze für Maschinen sind, das Diskriminierungsmerkmal zwischen menschlichem und maschinellem Produzieren und Verstehen von Text? Aber: wem nützt‘s? Ist diese Fähigkeit eine der Besonderheiten, die die Spezies Mensch – einfach gesagt und gedacht – dafür qualifizierte, von dereinst sehr mächtigen „Künstlichen Intelligenzen“ in Reservaten und reproduzierfähig gehalten zu werden? Oder sollte es dennoch, vielleicht nicht unbedingt beim Sprachverstehen, aber doch bei Leistungen der Intelligenz anhand mundaner und weniger mundaner Probleme, sich zeigen, dass dieser Aspekt menschlichen Vorgehens einen Vorteil gegenüber Maschinen erbringt, sehr frei in Umwendung eines Gedankens von Oswald Wiener: „Sinn ist ein Trick [der Evolution], die Beschränkungen der formalen Kapazität eines Organismus zu umgehen; er ermöglicht die Führung syntaktischer Operationen durch ‚Inhalt‘“.

Ich hätte anstatt meines Beispiels der frei verfügbaren Übersetzungssoftware wohl auch von manchen Praktiken und Techniken der prosperierenden „Digital Humanities“, des Verwendens von sogenannter Künstlicher Intelligenz zum Analysieren von (literarischen) Texten sprechen können. Ich hätte etwa das „Distant Reading“ oder das Lob der Kulturtechnik der Verflachung adressieren können; oder etwa auch die Idee, dass mit den Möglichkeiten forensischer Datenanalyse von Menschen nicht mehr bearbeitbare und nicht mehr überblickbare Datenkorpora auf verborgene Muster abgeklopft werden. – Dies weist auf die Methode der sogenannten „Stilometrie“, die jene Texteigenschaften vermisst (von: „vermessen“, nicht von: „vermissen“), die auf unbeabsichtigten Merkmalen beruhen. Somit mache die Maschine explizit, was einem Text – und den Schreibenden und Lesenden unbewusst – implizit ist. Womöglich wäre ich bei all dem zu ähnlichen Vermutungen wie den von mir hier zum Prozessieren von Holzwegsätzen skizzierten gelangt.


Literatur:

Bever, Thomas 2013 [1972]. The cognitive basis for linguistic structures. In: Sanz, Montserrat, Itziar Laka und Michael K Tanenhaus (Hg.), Language Down the Garden Path. The Cognitive and Biological Basis for Linguistic Structures. Oxford: OUP, 1-80.

Bühler, Karl 1909. Über das Sprachverständnis vom Standpunkt der Normalpsychologie aus. In: Prof. Dr. F. Schumann (Hg.), Bericht über den 111. Kongreß für experimentelle Psychologie in Frankfurt a. Main vom 22. bis 25. April 1908. Leipzig: Johann Ambrosius Barth, 94-130.

Hölderlin, Friedrich 1984. Sämtliche Werke. Frankfurter Ausgabe. Historisch-kritische Ausgabe hg. v. D. E. Sattler. Bd. 5: Oden II. Hg. v. D. E. Sattler and Michael Knaupp. Frankfurt/Main: Stroemfeld Roter Stern.

Sanz, Montserrat, Itziar Laka und Michael K Tanenhaus 2013. Sentence comprehension before and after 1970: Topics, debates, and techniques. In: Dies. (Hg.), Language Down the Garden Path. The Cognitive and Biological Basis for Linguistic Structures. Oxford: OUP, 81-110.

Wiener, Oswald 1996 [1988]: Form und Inhalt in Organismen aus Turing-Maschinen. In: Ders., Schriften zur Erkenntnistheorie. Wien: Springer, 112-144.


Thomas Eder, geb. 1968, Literaturwissenschaftler, Lehrbeauftragter am Institut für Germanistik der Universität Wien, Leiter des Referates für Publikationen und Grafik im österreichischen Bundeskanzleramt. Redaktionsmitglied des wespennest seit 1999. Monographien zu Reinhard Priessnitz sowie Herausgabe zahlreicher Bücher u.a. zu Oswald Wiener, Heimrad Bäcker oder Konrad Bayer. Zuletzt erschienen: Dieter Roth. Zum literarischen Werk des Künstlerdichters (Hg. mit Florian Neuner, edition text + kritik 2021).

© Thomas Eder / Wespennest


Wespennest Backlist
„wespenstiche“ ist die Netzkolumne der Redaktion und kritischen Interventionen jenseits der Printausgaben unserer Zeitschrift vorbehalten. Ihre Autorinnen und Autoren stechen unregelmäßig und anlassbezogen.










Lukas Meschik
Der tiefe Riss

Andrea Roedig
Pest und Polio


Susanne Scharnowski
Der Anti-Heimat-Reflex

Jan Koneffke
Der Heimat-Sprech














Andrea Roedig
Mutterobjekt
















Wespennest Zeitschrift
Heft 186 |w186| Auf die Ängste der 1980er reagierte man mit dem Slogan „No Future“, heutige Bewegungen tragen „for Future“ im Namen. Was hat sich geändert an der Haltung zur Zukunft?
Heft 185 |w185| Die Kluft zwischen uns und den Tieren wird zunehmend kleiner. Bleibt als Unterschied die singuläre Sprachwahrnehmung und Sprachproduktion des Menschen?
Heft 184 |w184| Wie lange eine Ordnung hält, ist nicht vorhersehbar. Wer von „Zeitenwende“ spricht, steht auch vor der Frage, welche der alten Regeln noch gelten und woraus sich Neues formt.
Wespennest Partner

C.H.Beck

Glanz und Elend

© wespennest zeitschrift & edition | rembrandtstr. 31/4 | a-1020 wien | österreich
t +43-1-3326691 | f +43-1-3332970 | office@wespennest.at