Peter Riedlsperger
Proust und neuronale Netze - die Proustmaschine
Es ist die Frage, die sich gleich beim Lesen der Überschrift aufdrängt, was hat Proust bzw. ein Prousttext mit neuronalen Netzen zu tun, deren Beantwortung uns eine Beschreibung des Projekts liefert. Grundidee war es, eine Übersetzung von Alltagstexten (Realdaten) in einen Text literarischer Fiktion zu liefern. Beispielhaft sollten dabei APA-Texte in eine Textsorte nach Prousts Romanzyklus ,,Auf der Suche nach der verlorenen Zeit" über-setzt werden.
Die technische Realisierung ging dabei von einem einfachem Modell aus. Der Eingangstext (APA-Text) wird durch ein Programm in aufeinanderfolgende syntaktische Einheiten zerlegt (sogenanntes ,,parsen"). Diese Sequenz kann, in codierter Form, als Aufeinanderfolge von Mustern interpretiert werden. Wir benötigen also ,,nur" ein ausgereiftes Verfahren, das diese Muster in Bezug zur Referenz (dem Prousttext) stellt. Ein einfaches ,,pattern matching", also ein Verfahren des Vergleichs, würde hier nicht genügen, da diese Verfahren keinerlei ,,kontextuelle" Rücksicht nehmen würde, sondern nur feststellt, ob das gegebene Muster an irgendeiner Stelle mit dem Referenztext übereinstimmt oder nicht. Es würden keinerlei Werte zwischen wahr und falsch berücksichtigt werden. Aus diesen und anderen Gründen (experimentelle Neugier) wurde für dieses Projekt das sogenannte Modell von Kohonen in der Implementierung eines sogenannten ,,Learning Vector Quantification"-Verfahrens (LVQ) verwendet.
Neuronale Netze basieren auf der Gleichsetzung des Gehirns bzw. gewisser seiner Fähigkeiten mit einem mathematischen Modell. In diesen Modellen werden Neuronen als Elemente mit der Eigenschaft eines Addierers mit Schwellenwertfunktion behandelt. Die Verbindungen zwischen diesen Neuronen (Synapsen) nehmen über die Aktivierungswerte der verschiedenen Neuronen bestimmte Gewichtungswerte an und lassen am Ausgang eine Aktivität entstehen, falls der Wert eine definierte Schwelle überschreitet. Diese Neuronen werden meist zu Schichten gruppiert. Zumeist sind es zwei Schichten, von denen eine als Eingangsschicht und die andere als Verarbeitungsschicht gesehen werden und die über die Neuronen (durch die Gewichte ihrer Verbindungen) vollständig miteinander verbunden sind. Auch Kohonens Modell geht von einer zweidimensionalen Schichtung aus. Durch die erste Schicht laufen die Eingangskanäle, die das Eingangssignal heranführen und die Neuronen über die Gewichtungen erregen oder hemmen. Die Erregung dieser Neuronen soll sich dabei auf ein bestimmtes ,,räumliches" lokalisierbares Gebiet beschränken. Die Lage dieses Gebietes wird von denjenigen Neuronen bestimmt, die auf den gegebenen Reiz am stärksten ansprechen. Die Neuronenschicht wirkt als topographische Merkmalskarte, wenn die Lage der am stärksten erregten Neuronen in gesetzmäßiger und stetiger Weise mit einigen wenigen, wichtigen Signalmerkmalen korreliert ist. Benachbarte Erregungsorte in der Schichtung entsprechen Reizen (Signalen, Eingangsmustern) mit ähnlichen Merkmalen. Dieser Vorgang kann auch als fehlertolerante Klassifizierung gesehen werden. Um den Eingangsreizen die Möglichkeit einer Verarbeitung überhaupt geben zu können, muß dem Netz vorher eine Referenzgewichtung gegeben werden (Lernphase des Netzes) - in unserem Fall der Prousttext.
Ein wesentlicher Punkt in diesem Projekt ist der erste Schritt der Zerlegung und Codierung des Eingangstextes in die adäquate Sequenz von Mustern (Zahlentupeln). Dabei wurde im Laufe der Realisierung klar, daß die Zerlegung des Textes nicht nur in syntaktische Einheiten, sondern auch auf semantischer Ebene nötig ist (propositionale Analyse). Zur Realisierung dieser Analyse wurde ein natürlichsprachlicher PROLOG-Parser für ein Fragment der deutschen Sprache entworfen und z.T. entwickelt. So steht vorliegende Entwicklung nicht nur in einem kunsttheoretischen Zusammenhang, sondern kann auch als anwendungsorientierte Entwicklung im Bereich automatisierter hermeneutischer Textverarbeitung gesehen werden.
Bei Fragen, Anregungen und Wunsch nach weiterer Information:
e-mail: peter@ast5.uibk.ac.at
www: http://ast5.uibk.ac.at
Quellenangabe
Peter Riedlsperger, Proust und neuronale Netze - die Proustmaschine. In: SYSTEM-DATEN-WELT-ARCHITEKTUR, Triton-Verlag, Wien 1995, Seite 66 ff.
|