Typologie von digitalen Literaturgeneratoren

1 Vorbemerkungen
1.1 Forschunglsage
1.2 Spezifikation des Gebietes und Definition
1.3 Methodik
2 Genre und Gattungen
2.1 Poetizität
2.2 Narrativität
2.3 Dramatizität
3 Typologie
3.1 Input
3.2 Selektion
3.3 Generationsprozess
3.4 Präsentation
3.5 Output
4 Conclusio
Anmerkung
Literaturverzeichnis

Text(e)-Fil(e)s
Text(e)-Fil(e)s, Pascal Dombis (2010)


1 Vorbemerkungen

Literature always has had an affinity with playing if we regard the many word-games of antiquity, or the combinatory literature in the baroque era or even the methods suggested by Oulipo, even though without computer. With electronic devices and nets this playful literature now enters other dimensions [...] [45, S. 30]
Die Fortsetzung dieser "word games" oder deren "other dimension" ist die digitale Literaturgeneration. Ihr Spiel ist das Erkunden von Möglichkeiten und Grenzen der Sprache, Technik und insbesondere der Literaturtheorie. Letzteres vollzieht sie intensiver als jedes andere postmoderne Genre, indem sie abstrakte Theorie praktiziert. Wenn Programmierer/innen diese in ein Konzept oder Programm einarbeiten und mit ihnen Texte generieren, kehren sie die wissenschaftlichen Methoden der literarischen Analyse, Strukturalisierung und Interpretation um und ästhetisieren sie. Diese "Theorie"-Maschinen schaffen Kunst, die so wissenschaftlich ist, dass sie die Begriffe und Systeme der Ästhetik untergraben. Aus dieser Provokation erwacht rückwirkend auch eine neue Perspektive in der Wissenschaft und ein Drang zur Findung von adäquateren Modelle, Methoden und Terminologien resultiert. Diesem Ziel verschreibt sich auch der vorliegende Artikel. Denn die vorgestellte Typologie bietet ein neues Modell, das die Strukturierung der unübersichtlichen Menge an Werken und den Vergleich zwischen einzelnen erleichtern soll.
Im 1. Kapitel werden die grundlegenden Vorbemerkungen mit einem historischen Abriss zur Forschungslage, der Spezifikation des Gebietes über die Definition der Grundtermini und der Festlegung der Methode getroffen. Diesem Kapitel folgt eine Einordnung im Feld der literarischen Gattungen und die adaptiven Relationen zur Gattungstrias. Der Dreiteilung des Forschungsbereichs (Vgl. Kapitel 1.2) folgend baut sich die eigentliche Kategorisierung im 3. Kapitel in drei Sektionen (Input, Generationsprozess und Output) und zwei verbindende Zwischenkategorien (Selektion und Präsentation) auf. In der Conclusio wird die erarbeitete Typologie zusammengefasst und eine mögliche Anwendung beschrieben.

1.1 Forschungslage

Zur Evaluierung der Forschungslage vollziehe ich eine historische Zäsur um etwa 1995, die auch Chris T. Funkhouser [
42] machte, mit der artifiziellen Nutzung des WWW und dessen medial spezifischen Attribute. (1)
In der "prehistoric" Phase, deren Generatoren großteils noch Medium unabhängig sind und die Möglichkeiten des neuen Kommunikationswegs, wie Multimedialität oder Vernetzung, noch nicht nützen, sind Typologien auf die Grade und Arten der Permutation beschränkt. So differenziert zum Beispiel The New Princeton Encyclopedia of Poetry and Poetics in "formulary" und "derivative" (2), und Funkhouser separierte letztere noch in "permutational" und "combinatoric" und "slotted":
In devising a typology of these works, I measure the permutation procedures of algorithmically generated poems into three classifications. Works are either permutational (recombining elements into new words or variations), combinatoric (using limited, preset word lists in controlled or random combinations), or slotted into syntactic templates (also combinatoric but within grammatical frames to create an image of "sense"). [42, S. 36]
Aus informatischer Perspektive stellte Martin Boot ähnliche Kategorien auf, denen er das "filter model" basierend auf der "pattern recognition" (Wahrscheinlichkeitsberechnungen und unlinearen Suchoperationen) hinzufügte. (3) Diese avancierte in der Science of Artificial Intelligence zur Natural Language Generation, die neue Anstöße auch für künstlerische Generatoren gibt (Kapitel 3.3.2).
Trotz aktuellerem Erscheinungsdatum sind die Beschreibungen der Brockhaus Enzyklopädie [27, S. 25] und von Gero von Wilpert [65, S. 145] nur auf die asemantische Permutation mit derivativen Regeln beschränkt und unterscheiden nur grob nach Genres zwischen Computerkunst und -dichtung (und -lyrik).
An der Grenze zur nächsten Generation von Generatoren steht Vincent M. van Mechelens Definition, die schon deren Merkmale aufgriff:
I myself shall therefore differentiate between derivative and original computer poetry. Original computer poetry does neither imitate the structures of existing, non-computer-generated poems nor copy their lexical contents. [...] In other words: derivative computer poetry and the ‘classic’ use of computer technology are imitative, whereas original computer poetry and the ‘expressive’ use of this new technology are innovative. It stands to reason that original computer poetry requires greater imagination than its derivative cousin, even though both may be in free verse. Moreover, it unambiguously conceives of computer poetry as a process and mode of literary composition in its own right, with its own medium and potentialities. [...] [C]omputer poetry is original in that it is not based on earlier poetry: data and structure are both completely new. [63]
Ab etwa 1995 unterscheiden sich diese neuen Generatoren und deren Kategorien durch ihre mediale Gebundenheit und Anwendung der medienspezifischen Generierungsmethoden:
Das Metzler Literatur Lexikon separierte "Computertexte" funktional in automatische Übersetzung, Dialog-Systeme oder Generation mit ästhetischem Interesse.
Neben dieser grundlegenden Abgrenzung differenzierte zum Beispiel Christiane Heibach digitale Literatur in On- und Offline Literatur und weiters in horizontale und vertikale Oszillation (4). Diese Kategorisierung kann auch für Generatoren angewendet werden, doch möchte ich noch tiefer und differenzierter in die Strukturen von Literaturgeneration blicken, denn diese Typologieentwürfe sind meiner Ansicht nach wesentlich, doch oberflächlich oder zu spezifisch. Folglich mangelt dieses Feld der digitalen Literaturgeneration bis heute einer einheitlichen Kategorisierung.

1.2 Spezifikation des Gebiets und Definition

Eine Notwendigkeit an Einschränkung und Definierung dieses Forschungsgebietes sehe ich in der Terminologie (5), die sich noch nicht vereinheitlicht hat und sehr ambivalent und oft unreflektiert in der Sekundärliteratur verwendet wird.
Selbst für das Objekt meiner Klassifikation variieren die Begriffe und deren Definition je nach Disziplin von Computerkunst, Dichtungsgeneration bis zu Automatik Text Processing, und selbst innerhalb der Literaturwissenschaft, wie zum Beispiel Computerdichtung oder Unique-Reading Poems [36]. In meiner Analyse präferiere ich den Terminus digitale Literaturgeneration aus Gründen, die sich aus den aufbauenden Definitionen von Literatur, digitale Literatur und digitale Literaturgeneration ergeben werden:

Definition: Literatur

Da ästhetische Texte des digitalen Mediums den traditionellen Begriff der Literatur problematisieren und in seinen Grundfesten (Vgl. [28, S. 2-3]) erschüttern, plädieren etliche Theoretiker auf eine Neubestimmung oder Erweiterung:
"Sprachkunst" signalisiert eine Allgemeinheit, weil er - mehr als der Be- griff der Literatur - eine Flexibilität in der Referenzierung auf die verwendeten Medien verspricht. "Sprachkunst" verweist auf die Sprache als prinzipiell transmedialen Code, der weitgehend problemlos in unterschiedlichen Medien umgesetzt werden kann, wobei er sich allerdings je nach medialer Struktur verändert. Sprachkunst umfasst daher nicht nur Text, sondern auch gesprochene Sprache, ebenso wie multimediale und performative Umsetzungen: [48, S. 25]
Da Literatur dadurch nicht mehr nur auf die Sprache, sondern auch auf andere künstlerische Ausdrucksformen zurückgreift, würde sie zu Begriffen wie Gesamtkunstwerk, Multimediakunst oder Neue Medienkunst [46, S. 14] expandieren. Obwohl diese weite Definition der digitalen Kunstsituation entspricht, soll in der folgenden Typologie der Text als wesentliches Element des generierten Kunstobjektes inhärent sein. Ich ziele hier auf die etymologische Bedeutung der Schriftlichkeit aus dem lateinischen litterae ab. Dies wird besonders im Kapitel 3.1 klar, wenn literarische und nicht-literarische, fiktive und nicht-fiktive Texte gleichwertig generiert werden. Das künstlerische Kriterium enthält das Konzept durch die Intention des Programmierers (Autors) oder/und erst das generierte Ergebnis durch die spezifische Präsentation und Rezeption. Auch wenn diese Hinweise nicht immer klar hervortreten, die Ergebnisse eines Slogangenerators eine kommerzielle Rezeption erlauben und die Intention der Natural Language Generation selten künstlerisch ist, können auch diese Generatoren unter der Typologie betrachtet und kategorisiert werden. Diese sollen jedoch nur am Rande erwähnt bleiben, denn mein Fokus liegt auf künstlerischen Ergebnissen.

Definition: digitale Literatur

Davon wird digitale Literatur meist durch seine charakteristischen Attribute abgegrenzt, die Roberto Simanowski definiert als "künstlerische Ausdrucksform, die den digitalen Medien als Existenzgrundlage bedarf, weil sie sich durch mindestens eines der spezifischen Merkmale digitale Medien auszeichnet: Interaktivität, Intermedialität, Inszenierung." [29, S. 4] Friedrich W. Block [34] fügt diesen drei Kriterien den medialen Selbstbezug und die Prozessualität hinzu. Simanowski ergänzt im ersten Kapitel seines aktuelleren Buches diese noch durch das künstlerische Konzept, die ästhetische Verwendung der Technik, die Dynamisierung des Textes und die Multilinearität (Vgl. [60]).
Das hinzugefügte Adjektiv digital impliziert jedoch nicht nur spezielle Attribute, sondern eine grundlegende Veränderung des Mediums: Denn digitale Literatur besteht aus den Grundelementen ...
... null und eins, womit das Nichtfließen und Fließen von Strom kodiert wird. Auf dieser binären Symbolik beruhen die 256 Zeichen (Buchstaben, Zahlen, Steuerzeichen) des Standardcodes (ASCII), aus denen sich die Sprachen und Programmierungen im Computer wie auch ledigliche damit erzeugten Bilder, Filme, Töne, Schriftzeichen beziehungsweise die Verarbeitung und der Austausch von Informationen zusammensetzen (computieren).
Das Attribut ‘digital’ betont in diesem Zusammenhang das Symbol- beziehungsweise Zeichenhafte, das auf spezifische Weise die so wirkungsvolle Kultur der Computertechnologie beeinflusst. [34, S. 12]
Unter der Textoberfläche liegen folglich noch eine sprachliche Code-Ebene und darunter das binäre Signal. Basierend auf der mittleren Ebene baut sich Florian Cramers äußerst weitgreifende Definition auf, das gesamte Internet sei codierter Text und folglich (digitale) Literatur (6). Diese kann ich nur eingeschränkt, beziehungsweise ansatzweise verwenden, da die medialen Differenzierungen und die Literarizität für meine Typologie entscheidend sind. Hervorzuheben sind nur die textuellen Eben, wie sie Philippe Bootz unterscheidet:
In digital literary work one can distinguish several types of textual objects: the author-text (elements produced by the maker, i. e. the source code and the data; it cannot be reached by the reader), the text-to-be-seen (the reader has access), the read-text (the reader’s mental representation of the whole communication process including its function and objects) and the inferred data which are generated by the generation function, sometimes while the reader is reading but are not intended for the reader. The written-text is another textual object corresponding to the author’s project as it transpires from the completed literary work. [36]
Sehr allgemein gehalten, aber als Arbeitsbasis ausreichend fasse ich mit den Worten der Electronic Literature Organization zusammen: Digitale Literatur enthält "works with important literary aspects that take advantage of the capabilities and contexts provided by the stand-alone or networked computer" [54].

Definition: digitale Literaturgeneration

Von der Electronic Literature Organization werden "[p]oems and stories that are generated by computers, either interactively or based on parameters given at the beginning" [54] als Kategorie der digitalen Literatur genannt. Diese simple Definition kann exakter ausgeführt werden, wie zum Beispiel durch Bachleitners Begriffsbestimmung aus der literatursoziologischen Perspektive: Diese Programme versuchen die bei der Texterstellung durch Menschen ablaufenden Prozesse zu formalisieren, um sie in der Folge zu simulieren. [...] Maschinengenerierte Texte und Erzählgerüste beruhen ausschließlich auf formalisierten logisch-mathematischen Operationen, zu ihrer Entstehung haben weder Lebenserfahrung noch Empfindung oder ähnliche Faktoren, die lange Zeit Teil der Literaturtheorie gewesen sind, beigetragen. [30, S. 117] Doch eine Programmdefinition an sich reicht nicht, um die digitale Literaturgeneration als ästhetisches Kommunikationssystem zu beschreiben. Es fehlen die Ausgangsbasis und die Ergebnisse mit ihrer Rezeption, um Literaturgeneration von pragmatischer Textproduktion zu differenzieren. Denn erst durch sie können die bereits genannten Literarizitätskriterien (Intention des/r Autors/in, beziehungsweise Programmierer/in, Rezeption, Präsentation und Kontextualisierung) analysiert werden. In dieser Erweiterung gibt es neben dieser technoiden Genese, auch einen Teil der Textgeneration, der sehr wohl vom Menschen mit all seinen Erfahrungen und Empfindungen beeinflusst wird.
Folglich füge ich den Generationsprozessen erweiternd und ganzheitlich zwei Bereiche hinzu: Input (Kapitel 3.1), Generationsprozess (Kapitel 3.3) und Output (Kapitel 3.5). Während der von Bachleitner beschriebene Generationsprozess nur "formalisierten logisch-mathematischen Operationen" folgt, sind die im ersten Bereich enthaltenen Konzepte, Programmierungen und zu generierenden Elemente (unter anderem auch ästhetische Texte) von einem Menschen kreiert und oft auch sozial reflexiv (7). Auch die rezeptive Wirkung, Interpretation und Weiterverarbeitung ist nicht maschinell.
Definition
Digitale Literaturgeneration beschreibt ein Kommunikationssystem, in dem Texte, die literarische Konzepte (Narrativität, Poetizität und Dramatizität) umsetzen, von einem vernetzten oder stand-alone Computer generiert werden. Man kann drei Bereiche (Input, Genese, Output) separieren, in welchen mindestens ein spezifisches Attribut des digitalen Mediums (Interaktivität, Intermedialität, Inszenierung, medialer Selbstbezug und Prozessualität) und ästhetische Ansprüche in Intention, Präsentation und/oder Rezeption zu finden sind.

1.3 Methodik

Wie kein anderes Genre verbindet die digitale Literaturgeneration die Disziplinen und fordert daher auch einen interdisziplinäre, komparatistische Perspektive. Aufgrund meiner Spezifikation des Gebietes (Kapitel 1.2) liegt jedoch der Schwerpunkt auf einer medien- und literaturwissenschaftliche Perspektive. Doch wurden auch Kenntnisse der Informatik und Artificial Intelligence integriert. Existierende Typologien aufgreifend erarbeitete ich ein ganzheitliches Klassifizierungsmodell. Mein Modell richtet sich nach einer synthetischen Facettenklassifikation mit seinen Vorteilen gegenüber hervorgehenden Systemen, da die Kategorien flexibel austauschbar und erweiterbar für neue Generationsentwicklungen und -projekte sind. Außerdem kann in jeder Kategorie unabhängig von anderen die passende/n theoretische/n und disziplinäre/n Perspektive gewählt werden [50]. Um diese Freiheit für mein Modell einzugrenzen und einzelne Kategorien zu verknüpfen, gab ich den ersten zwei Bereichen einen produktionsästhetischen und dem letzten Teil einen rezeptionsästhetischen Fokus.

2 Genre und Gattungen

Den Aufteilungen von Bachleitner [32], ELO [54] und Anderen anschließend sehe ich digitale Literaturgeneration als eigenständiges Subgenre der digitalen Literatur an (8), ohne hybride Mischformen mit anderen Subgattungen auszuschließen.
Dieser Artikel soll jedoch nicht die Notwendigkeit von Gattungen diskutieren, sondern die typischen Kriterien der digitalen Generatoren aufzeigen und die Verbindungen zur traditioneller Gattungseinteilung anführen. Denn trotz der subversiven Eigenschaften dieses Subgenres, die auch der digitalen Literatur eigen sind, sind die Ergebnisse der Generatoren im Hinblick auf die Gattungstrias Lyrik, Epik und Dramatik sehr klar gekennzeichnet und zuordbar. Dieser Widerspruch von starker Traditionsverbundenheit und postmodernem Bruch prägt die Untergattung und beschriebt ihre grundlegenden Ziele: die Imitation (das Konkurrieren mit) der hohen Literatur und die Findung neuer Formen. Im Bezug zur Gattungstrias fordert Joseph Tabbi in der digitalen Literatur eine Erweiterung: "In a time of transition, more generic and more qualitative terms are needed: narrativity or fiction more generally than novel, poesis more generally than poem, conceptual writing more generally than essay." [61] Diese Poetizität, Narrativität und Dramatik finden sich im Subgenre ebenfalls wieder:

2.1 Poetizität

Am häufigsten vertreten ist die Lyrik, da sie sowohl für klassische, wie auch moderne Gedichte besondere Vorteile bieten. So spiegelt sich in ihr deutlich die inhärente Widersprüchlichkeit wider: Erstere bietet durch formale Vorgaben hervorragende Grundlagen für die programmierten Regeln zur Anordnung eines Vokabulars, wie Raimond Queneaus Sonettgenerator Cent mille milliards de pomes zeigt, der von Beverly Charles Rowe [22] digitalisiert wurde. Besonders die romantischen Gedichte, die für den Genialitätsbegriffes des Autors stehen, haben Anreiz zur Hinterfragung und Kritik durch die automatische Imitation gefunden. Beispiel hierfür wäre A* Romantic Poetry Generator, der Gedichte aus dem 19. Jahrhundert imitiert:
to note the old time ;
and i will praise ,
that all i can ,
that there was aught ever .
log p = ?264.550417 [41]
Auf der anderen Seite steht die besondere, poetische Freiheit der überstrukturierten und selbstreferentierende Sprache, die sich bis zu der destruktiven, konkreten oder aleatorischen Poesie steigert. Diese erlauben die Semantik oder Syntax zu vernachlässigen, wodurch die Auswahl der Wörter bei der Generation erleichtert wird. Surrealistische, dadaistische oder postmoderne Ideale, wie die écriture automatique und die entAutorvisierte Textgenese, sind durch die digitale Literaturgeneration einen Schritt weiter, da der/die Programmierer/in nur noch konzeptuell und regulativ in den Schreibprozess eingreift. Ein hervorragendes Beispiel für den modernen Bruch wäre Flowerewolf (Abb. 1). Dieser Generator schafft Gedichte ohne semantischer, syntaktischer, formaler Kohärenz und ohne sich über Input (Wörterbuch) oder Stil an eine Vorlage zu richten. Bis auf Gervás’ Versuche einer "prose to poetry transcription" [47], welche die Gattungsgrenzen überschreiten, zieht sich nun eine scharfe Grenze zur Prosa.

Abbildung 1: Gedicht von Flowerewolf. Aus: [33]
Abb.1: Flowerewolf

2.2 Narrativität

Currently, story generators enjoy a phase of revival, both as stand-alone systems or embedded components. Most of them make reference to an explicit model of narrative, but the approaches used are diverse: they range from story grammars in the generative vein to the conceptually inspired engagement-reflection cycle. Real-life applications include the generation of a set of plot plans for screen writers in a commercial entertainment environment, who could use the automatically created story pool as a source of inspiration, and the generation of new kinds of interactive dramas (video games). [51, S. 1]
Diese expliziten Modelle reichen von strukturalistischen Theorien, wie Wladimir Jakowlewitsch Propps Morphologie des Märchens (Propan Fairy Tale Generator v1.0 [23] oder Protopropp beschrieben in: [55] und [55]) bis zu Gustav Freytags dramatisches Pyramidenmodell (9). Neuere Generatoren kombinieren diese Narrationsmodelle, wie es zum Beispiel Birte Lönneker und Jan Christoph Meister in ihrem idealen Story Generator Algorithm präsentieren, der auf Historie und discourse Ebene verschiedene literaturtheoretische Ansätze und die Produktionsstadien der klassischen Rhetorik einarbeitet (Abb. 2). So werden epische Generatoren nicht nur durch formale und linguistische Regeln, sondern auch durch die narrativen Darstellungsoptionen der diskursiven Ebene, wie Temporalität, Erzählsituation, Figuren- und Handlungsaufbau etc., bestimmt. Während die narrative Struktur relativ einfach technisch produziert werden kann, besteht bis heute vor allem die Herausforderung der inhaltlichen Ebene und der Notwendigkeit der semantischen Kohärenz bis zur Wortkonstellation (Näheres im Kapitel 3.3.2).

Abbildung 2: Generationsprozess des Story Generator Algorithm. Aus: [51, S. 2]
Abb.2: StoryGeneratorAlgorithm

2.3 Dramatizität

Das Drama an sich findet sich in diesem Genre noch nicht, doch kann man Computerspiele als virtuelle, interaktive Kommunikationssituation sehen. Jörgen Schäfer analysiert die dramatischen Elemente am Generationsprojekt Façade und folgert:
[C]omputer games share at least two characteristics with narratives and dramas: first, they all represent fictional worlds; second, fictional action is necessarily and functional equivalents that allow the mutual substitution of game elements with either narrative or drama elements. Yet, many features of games, narratives, and drama are in opposition to each other as regards who the agent of the action is, what motivates him/her, how s/he performs the action and how action comes to an end. [57, S. 144]
Ebenfalls hinzu zählen kann man P[a]ra[pra]xis, das nach psychoanalytischen Prinzipien vertonte (Chat)Dialoge generiert (10).

3 Typologie

Abbildung 3: Klassifikationsmodell zur digitalen Literaturgeneration.
Abb.3: Typologie

3.1 Input

Die erste Unterscheidung des Inputs sieht Gerard Salton zwischen einer knowledge base und den Input goals. Letzteres bezeichnet Konzepte "that characterize the expected effect of the text excerpt on the reader" [58, S. 448]. So werden Genre, Stil, Thema und ähnliche Metaspezifikatoren festgelegt und diese bestimmen die Auswahl der knowledge base, des Generationsprozesses und der Präsentation. Die möglichen Kategorien der Intentionen des/r Programmierers/in fasse ich im Kapitel 3.5 zum Output zusammen, da sie in ihren Ergebnissen am einfachsten zu analysieren sind.
Ebenfalls wesentlich für meine Typologie ist die knowledge base, die sich aus der vermittelten Information (Signifikat) und dem vermittelnden Zeichenmaterial (Signifikant) zusammensetzt. Das Signifikat kann über Synonyme, Schlagwörter und/oder semantische Verknüpfungen deskriptiv festgehalten werden und mit weiteren Zusatzinformationen (Grammatik, Metrik, Sprache etc.) in den Generationsprozess wieder eingebunden werden (Weiter relevant für Selektion - Kapitel 3.2).
Bemerkenswert ist hierzu, dass dieses Zeichenmaterial bereits über ein Medium vermittelt worden ist. Anders als bei dem "klassischen", human künstlerischen Schöpfungsprozess, bei welchem Signifikate direkt in Signifikanten kodiert werden, werden im digitalen Generationsprozess nur Signifikanten als Ausgangsmaterial herangezogen. Außerdem können nur über energetische Medien (11) vermittelte Zeichen verwendet werden. Es können aber die ursprünglich materiellen Medieninhalte in den binären Code übertragen werden. Oft ist die Information, welche Quellen herangezogen werden, nicht klar ausgewiesen und so entziehen sich viele Generatoren dieser Einteilung.
Ein qualitatives, aber ebenfalls nicht immer transparent einsehbares Merkmal für Textgeneratoren bildet die Quantität des Inputs. Denn mit dem Umfang des Zeichenmaterials steigt auch die Komplexität, die mögliche Outputanzahl und dessen rezeptive Unvorhersehbarkeit. Die Signifikanten kann man weiter in den visuellen und auditiven Kommunikationskanal differenzieren. Ersteren unterscheide ich in Bezug zur digitalen Generation noch in Sprache und Bild. Die Attribute der drei Kanäle Text, Bild und Ton erlauben noch detailliertere Unterscheidungen:

Schrift

Als häufigster Input sind sprachliche Zeichen in schriftlicher Form zu finden. Diese teilen sich wiederum in literarische, unliterarische Texte und diverse Wörterbücher/-listen:
Literarischer Text
Die Verwendung von literarischem Material wurde lange Zeit präferiert, was die Annäherung an die ursprüngliche Poesie verstärkt und die Polemie der autorialen Genialität und Humanität der Literatur durch Imitation als Hintergedanken aufweist. Hier reicht die quantitative Spannweite von einem abgeschlossenen Text (12) bis zu einer unabgeschlossenen Datenbank, wie gutenberg.org oder bartleby.com (13).
Pragmatischer Text
Das sprachliche Material, das bereits durch Printmedien oder digitale Medien vermittelt wurde, muss nicht nur literarische Textdaten beinhalten. Die Tendenz der letzten Jahre zeigt eine Präferenz für das Zurückgreifen auf unliterarische und digitale Quellen, wie Blogs, Nachrichtenseiten (14) etc.
Obwohl bei Produktion von Literatur aus unliterarischem Input die Distanz zwischen Fiktivität und Faktualität sich verringert, ist eine Vermischung dieser im Input nicht zu finden. "[D]ie Missachtung der Unterscheidung zwischen Fiktion und Wirklichkeit" [31], wie es Bachleitner in einem anderen Aufsatz formulierte, findet sich folglich nur auf der Seite des Rezipienten, der im digitalen Medium wegen fehlender Markierungen diese Differenzierung nicht mehr nachvollziehen kann. Mit diesem unästhetischen Repertoire (auch bei Bild und Ton) werden nicht nur die Werte der Kunst untergraben, sondern oft aktivistische Konzepte provokanter und realgetreuer umgesetzt.
Wörterbuch
In den letzten Jahren dominieren vor allem Wörterbuch-Datenbanken als Input. Ausgehend von den Ansprüchen der Natural Language Processing (NLP) können dadurch komplexere Ergebnisse generiert werden, denn sie sind unabhängig von Textvorlagen. Paradigmatisch hierfür steht Wordnet oder FrameNet, englische Wortschatzdatenbanken mit semantischen und lexikalischen Verknüpfungen. Auf diese greifen Flowerewolf [33], P[a]ra[pra]xis [40] und andere zurück. GermaNet, das deutschsprachige Pendant, ist jedoch nicht frei verfügbar und fand in meiner Recherche keine Anwendung.

Bild

Unter dem visuellem Kanal zähle ich sowohl statische (15) und dynamische, wie auch künstlerische und pragmatische Bilder. Ein Beispiel wäre der Grafik Dynamo von Kate Armstrong und Michael Tippett [4], der Photographien mit Sprechblasentexten kombiniert.
Natürlich gibt es auch zahlreiche Bildgeneratoren oder algorithmisch angeordnete, konkrete Kunst. Doch diese liegen außerhalb meiner anfänglichen Einschränkung, da sie keinen Text generieren.

Ton

Die orale Sprachform, Musik und andere Tonspuren werden meistens nur zusätzlich hinzugefügt um einen multimedialen Eindruck zu erzeugen. Doch in seltenen Fällen wie zum Beispiel John Cayleys Translation werden auditive Elemente in den Generationsprozess eingebaut (16). Noch stärker in die Textgeneration eingebunden wird der auditive Kanal in intermedialen Transformationen (Kapitel 3.3).

Online / Offline

Zuletzt kann man noch in online und offline Medien differenzieren. Wie bereits erwähnt setzen sich mit der Verbreitung des Internets immer mehr vernetzte Input-Quellen durch, wie Datenbanken, Suchmaschinen-Ergebnisse, Inhalte von Internetseiten, Social-Networks etc. Da es sich bei der Vernetzung um ein Kriterium für die gesamte Domäne handelt, muss jedoch auch, Heibachs Typologie [29] folgend, bei der Genese und meiner Ansicht nach auch bei der Rezeption zwischen online und offline differenziert werden.

3.2 Selektion

Der nächste Schritt nach der Definition und zur Aufbereitung des Inputs ist die Selektion der knowledge base. Denn bis auf wenige permutative Generatoren, die das gesamte Datenmaterial in verschiedenen Kombinationen aufarbeiten (z. B.: die Lorca-Maschine [3]), findet vor oder während dem Generationsprozess eine Auswahl statt. Dieses Verfahren kann singulär oder repetitiv und linear oder zirkulär herantastend sein. Zusätzlich kann es nach verschiedenen Kriterien selektieren, woraus ich drei anführe, die oft auch kombiniert werden:

Stochastik

Nahezu jeder literarische Generator arbeitet mit aleatorischer Auswahl, die sich komplementär zur gezielten Suche (wie in den folgenden beiden Strategien) verhält. Bei den meisten ist der Zufall nur als Teil einer algorithmischen Kette integriert, bei anderen jedoch als einziger Selektionsprozess. Der "Zufall" wird mittels diverser Zufallszahlengeneratoren, meist auch hybrider Kombination, errechnet.

Signifikant

Wie auch bei der aleatorischen Selektion werden die Zeichen hier als unbedeutende Einheiten verwendet. Die Suche findet auf der Textebene statt, das heißt wie bei einer gewöhnlichen Websuchmaschine sucht das Programm nach Textelementen ohne deren Kontext oder Bedeutung zu berücksichtigen. Ein Beispiel hierfür ist der We feel fine Generator [14], der Blogeinträge nach der Wortsequenz I feel oder I am feeling durchsucht. Ein komplexeres Verfahren wurde für die Texte in Barnesbook [19] verwendet. Jackson Mac Lows Methode, die automatisiert in Charles O. Hartmans DIASTEXT wurde, war: "The process uses a "seed" text (an index-word or -phrase) which is then applied to a corpus of text as a sort of acrostic, where letters and their order in the seed determine words selected from the corpus and outputted by the program." [64]

Signifikat

Die Auswahl auf der Signifikatebene sehe ich in der externen Verknüpfung und Markierung der Daten. Dies kann simpel über Wortlisten, sortiert nach willkürlichen oder logischen (lexikalisch, syntaktisch, semantisch, metrisch etc.) Regeln, oder spezifische Markierungen geschehen. Ist die knowledge base dafür angelegt, dann sucht das Programm nun nicht (nur) mehr auf der Textebene, sondern nach der adäquaten Markierung oder Liste. Durch Methoden wie das Case Based Reasoning und Wahrscheinlichkeitsberechnungen kann die Selektion über "Erfahrung" beschleunigt und gelenkt werden. Gänzlich automatisiert wurde die Auswahl bei Versquelle über Markow-Ketten: "Die gespeicherten Gedichte werden auf ihre syntaktische Struktur hin analysiert, es wird daraus eine eigene Struktur kreiert und zuletzt mit Wörtern aus dem Speicher befüllt." [32]

3.3 Generationsprozess

Permutation

Die ursprüngliche und häufigste Literaturgeneration im digitalen Medium ist die Permutation, eine Kombination aller n Elemente einer vorgegebenen Menge [27]. Norbert Bachleitner definiert und erläutert diese für unsere Domäne näher als ...
... Textproduktion durch Permutation von Elementen aus einem vorgegebenen Repertoire (‘dictionairy’) sprachlichen Materials. In diesen Texten werden Wörter oder Phrasen wie Gegenstände behandelt, nicht wie bedeutungsvolle Einheiten. Permutative Dichtung, die manchmal auch als kombinatorische Dichtung bezeichnet wird, kann als ein Programm beschrieben werden, das es erlaubt, eine - meist unüberschaubar große - Anzahl von Texten zu generieren. Die Satzbildung geht durch algorithmisch gesteuerte Prozesse vor sich. Wie so viele experimentelle literarische Formen lässt sich auch die permutative Dichtung bis in die Antike zurückführen. [30, S. 119]
Aus diesem Zitat lassen sich folgende drei Kriterien herausarbeiten:
Vorgegebenes Repertoire sprachlichen Materials
Zu dem sprachlichen Material (Text) möchte ich noch die Bildsprache und den auditiven Input addieren. Diese Multimedialität unterscheidet sich von Intermedialität, da diese eigenständige Elemente bleiben und ohne Beziehung zu einander stehen, wie beim Grafik Dynamo [4]. Das heißt auch, dass diese einzelnen Elemente unverändert bleiben, wodurch sich die Permutation von der Transformation abgrenzt. Diese beliebigen Elemente werden als Zeichen (Signifikant) kombiniert ohne die Signifikat-Verknüpfungen, die Semantik, Syntax etc. ermöglichen, zu beachten. Das bereits erwähnte Qualitätsmerkmal über die Quantität des Inputs kann auch als Kriterium kombinatorischer Dichtung gesehen werden, die sich oft als Unendlichkeit oder Zufälligkeit rühmt, aber nur eine rezeptiv unfassbare, aber finite Quantität an Output enthält. So ergibt sich in der Praxis eine vielfältige Bandbreite, angefangen von einer niedrigen Anzahl von Output-Varianten, wie sie zum Beispiel die Lorca Maschine [3] generiert, bis zu 100.000.000.000 poems [22].
Historische Tradition
Im Gegensatz zu anderen Kategorien geht den permutativen Generatoren eine lange Vorgeschichte außerhalb des digitalen Mediums voraus. Die kombinatorische Permutation wird nur durch Computer unterstützt, aber wäre auch auf Papier realisierbar und wurde zum Teil gedruckt oder imitierte Print-Originale (wie im Falle der Cent mille Milliarde de pomes vom OuLiPo Begründer Raymond Queneau [22]). Daraus kann man schließen, dass permutative Texterzeugung vom digitalen Medium unabhängig sei. Doch ergaben sich gewisse mediale Vorteile (große Kapazität, komplexere Kombinationsvorgänge etc.) und neue Eigenschaften, wie die realtime-Generation von Online-Input.
Permutation
Die verschiedenen Prozesse der Permutationen werden vom/von der Programmierer/in gesteuert und können als der eigentliche Schöpfungsprozess gesehen werden. Diese Generationsverfahren differenziere ich in zwei Kategorien:
1. Kombination
"Kombinatorische Dichtung sei hier definiert als Dichtung, die ihren Text nach festgelegten Regeln umstellt und variiert" [38]. Exemplarisch hierfür stehen die digitalisierten Vorgänger [11], von denen ich Julius Caesar Scaligers Proteus herausnehmen möchte, da es das kombinatorische Verfahren äußerst simpel demonstriert. Aus den sechs Wörtern "Perfide sperasti diuos te fallere Proteu" können 720 Varianten permutiert werden, ohne die Worte zu verändern. Aus der Neuanordnung resultiert in anderen Sprachen (17) meist eine syntaktische Fehlstellung, mangelnde grammatikale Kongruenz und seltene Sinnhaftigkeit, die oft auch als Charakteristikum der permutativen Generation genannt wird. Dies kann jedoch durch das Selektionsverfahren umgangen werden. Denn ist zum Beispiel die knowledge base in Listen unterteilt und werden die Wörter einer Liste an einer bestimmten Position des Satzes kombinatorisch ausgewechselt, kann eine Kohärenz geschaffen werden (18).
Eine der am häufigsten zitierten Anordnungsmethoden ist der Zufall. Bereits die ersten Textgeneratoren, wie Theo Lutzs mit ZUSE Z22 generierten Texte, arbeiteten mit aleatorischen Kombinationsverfahren. Mac Low [19] hingegen hielt seine selektierten Textelemente nach dem Erscheinen im Ursprungstext fest. Ein weiteres Verfahren ist die Lücken eines Rahmengerüstes permutativ zu füllen (19).
2. Algorithmus
Der nächste evolutionäre Schritt war die Selektions- und Kombinationsverfahren nach algorithmischen Regeln zu programmieren. Ein Algorithmus ist ein Lösungsverfahren, dass in einer endlichen Sequenz von Befehlen verfährt. Diese können von Zufallssimulationen bis zu komplexen Entscheidungsprozesse variieren. Letzteres gewährleistet eine zunehmende Kohärenz und Ästhetik der generierten Texte und wird im NLP perfektioniert.

Natural Language Processing - Semantik

Obwohl Natural Language Processing (auch NLGeneration genannt) kein einzelnes Generationsverfahren sondern einen Forschungsbereich der Science of Artificial Intelligence beschreibt, umfasst es einen innovativen Einflussfaktor zur Problemlösung bei künstlerischen Projekten und gleichzeitig den wissenschaftlich-technischen Hintergrund zur digitalen Literaturgeneration. Denn auch wenn die Motivation dieser Forschungsdisziplin mehr auf einen kommerziellen Nutzen gerichtet ist, finden sich deren Erkenntnisse auch in künstlerischen Projekten wieder.
Unter NLP inkludiere ich nicht nur die Bemühungen um eine Annäherung an die "natürliche" Sprachverwendung (20) oder die literarische Konvention, sondern vor allem das Streben nach semantischen Verständnis. Bachleitner legt den Unterschied wie folgt fest:
[...] [D]ie Artificial Intelligence Entwickler versuchen den störenden Faktor [Zufall, Entropie] des Maschinellen, Mechanischen zu beseitigen, mit dem Ziel, die aus ihren Programmen resultierenden Produkte möglichst täuschend humaner Textproduktion anzugleichen. Die dichterische Avantgarde interessiert dagegen gerade die aus der mechanischen, ohne Nachdenken und Berücksichtigung des Kontexts erfolgende Produktion und die daraus resultierenden Ver- und Befremdungseffekte. [30, S. 132]
Doch gerade in narrativen Generationsprojekten wird eine reduzierte Entropie angestrebt. Die größte Herausforderung ist nach wie vor die semantische Kohärenz (21), die über Datenmarkierung und komplexe, algorithmische Generationsverfahren versucht wird.
Ein etwas älteres Beispiel aus der NLP, das künstlerisch umgesetzt wurde [47], ist das bereits erwähnte Case Based Reasoning. CBR ist ein 1994 entwickeltes Modell aus der Artificial Intelligence, das im Selektions- und Generationsprozess angewandt wird. Aus der Perspektive des NLP entwickelte auch Ray Kurzweil [18] seine Generatoren, die mit verschiedensten Methoden die menschliche Textgeneration nachahmen.

Transformation

Dieses Generationsverfahren wird bestimmt von Verwandlungsprozessen, welche ich in die zwei Hauptbereiche Übersetzung und Intermedialität differenziere:
Übersetzung
Die Sprachenvielfalt ist ebenfalls eine Herausforderung im Feld der Artificial Intelligence. Die Verarbeitung von multilateralen Input, die korrekte Translation eines Textes in eine oder mehrere Sprachen oder die Erkennung von peripheren Sprachen oder Dialekten sind einige der aktuellen Problemfelder des NLP.
Aber nicht nur die pragmatisch kommerziellen Translationsprogramme stehen hier im Fokus, sondern vor allem die künstlerische Auseinandersetzung mit Übersetzungsprozessen. Ein besonders innovatives Projekt ist Translation von John Cayley [10], in dem On Language as Such and on the Language of Man, der kanonisierte Essay zur Übersetzungstheorie von Walter Benjamin, ins Deutsche und Französische übersetzt wird. Durch die selbstreferentielle Textauswahl und die Transparenz des Übertragungsaktes problematisiert Cayley den Vorgang des Übersetzens.
Intermedialität
Auch wenn Cramer argumentiert, dass es in der digitalen Kommunikation keine Medien gebe und folglich auch keine intermedialen Beziehungen und Aktionen (22), ignoriere ich diesen Ansatz zu Gunsten einer Kategorie, die im letzten Jahrzehnt nicht wegzudenken wäre: Inter-, Multi- oder Hypermedialität. Während die Komposition verschiedener Medien zu den permutativen Generatoren zu zuordnen ist, ist die Transformation der Dateninformation über einen Medienwechsel eine separate Kategorie. Am Beispiel SearchSongs - Sehnsuchtsmelodien des Netzes ist dies leicht zu illustrieren:
Die SearchSongs greifen auf den Wortstrom der Livesuche von Lycos zu. Wörter beinhalten spielbare Töne der Notenskala (c, d, e, f, g, a, h, c, fis, ces ...). Das Webinterface der SearchSongs zeigt einerseits den Wortstrom der Livesuche an, andererseits läuft darunter eine Notenlinie, die spielbare Buchstaben in Noten umwandelt. Nicht spielbare Buchstaben definieren die Tonlänge. Außerdem wird dem Begriff der musikalischen Improvisation der Zufall als Generator gegenüber gestellt, den strengen Regeln der musikalischen Notation tritt der Algorithmus entgegen. Und so objektiviert sich letztlich die subjektive Suchmaschinenanfrage in der Melodie der Search- Songs. Jedoch bewahren die SearchSongs das persönliche Moment, indem sie dem Zuschauer/-hörer ermöglichen, zusätzlich eigene Worte interaktiv in den Wortstrom einzuschieben und mitzumusizieren. [5]

Interaktion

Als ein Kriterium der digitalen Literatur kann sich Interaktion in allen Bereichen der digitalen Literaturgeneration befinden. Der/Die Rezipient/in kann aktiv den Input vorgeben [5], die Selektion bestimmen [3] oder die Komposition selektiv über [14] das Anhalten des Generationsprozesses [15] oder physisch entweder mit Körpereinsatz [24] oder der Abwesenheit des/r Lesers/in mitgestalten. Verbunden mit der Vernetzung erkennt Roberto Simanowski noch eine kommunikative Interaktivität (23), die sich jedoch meistens auf Texteingaben zur knowledge base beschränkt. Ein Beispiel wäre Nanette Wyldes Haiku [25], bei dem der/die Benützer/in einen Haiku eingibt und dieser mit anderen Eingaben gemischt wird. Auch wenn die Zuordnung von Projekten, die visuell-kinetische dargestellte Permutationsprozesse durch das Anhalten oder Aktivieren der Bewegung verwenden, als Textgeneration diskutabel ist, seien diese Werke, wie Seattle Drift [2], hier nur am Rande erwähnt.

3.4 Präsentation

Die erste grundlegende Differenzierung ist die der Publikationsform. Obwohl die "klassische" Buchveröffentlichung unökonomisch und quantitativ zu aufwendig ist, finden sich in der "prehistoric" Phase (vor dem Internet) gedruckte Computertexte, wie Computerlyrik [17], The Policeman’s Beard is Half Constructed [21] oder Barnesbook [19]. Die folgenden besprochen Outputs sind nun jedoch entweder auf digitalen Trägern oder im WWW zur Verfügung gestellt:

Vernetzung

Prinzipiell kann man die Präsentation der generierten Texte in online und offline differenzieren. Doch möchte ich hier nicht nur die Rezeptionssituation ansprechen, sondern vor allem die verbundenen Attribute und Effekte. Denn oft könnten online Präsentationen auch auf offline Datenträger oder sogar auf Papier realisiert werden. Doch gewisse Texte erhalten ihre performative Wirkung erst durch die Vernetzung, wie zum Beispiel Poem for Echelon [26]. Dieses Projekt alarmiert über generierte Emails mit Signalwörtern eine internationale Spionageeinrichtung.

Intradiegese

Eine spezielle Präsentationsform ist es den Output in eine Rahmenhandlung oder den Fließtext eines Werkes der digitalen Literatur einzubauen.

Multimedia

Auch wenn im Generationsprozess andere mediale Kanäle (Bild, Ton) nicht integriert wären, können sie in der Präsentation hinzugefügt werden, um den Output zu unterstreichen, kontrastieren oder weitere Effekte und Interpretationen zu ergänzen. So kontrastieren zum Beispiel die Geschichten von storyland [25] mit einer an Zirkus erinnernde Melodie.

3.5 Output

Simanowski öffnet einen hermeneutischen Zugang zu textmachines und legt drei Möglichkeiten zur Sinnkonstruktion fest: "(1) one dismisses any meaning in texts without authorial intent regardless of its quality; (2) one admits meaning in texts regardless of their authorship; (3) one sees meaning in chance; and (4) one establishes authorial intent in the text." [60, S. 99] Für die Typologie relevant sind vor allem der zweite und letzte Punkt. Denn mehr als die Rezeptionshaltung unterscheide ich im Folgenden nach der Beziehung des Outputs zum Inputs und der daraus erkennbaren Autorintention. So vielfältig die Ergebnisse der digitalen Generatoren auch sind, man kann sie in folgende Kategorien einordnen:

Destruktion

Zur Rezeptionssituation konstatierte Bachleitner eine grundlegende Differenz zwischen menschen- und computergenerierten Texten:
Der Unterschied scheint vor allem in der Lesererwartung zu bestehen. Bei menschlichen Gedichten ist ein Teil der Motivation für die Lektüre und Interpretation die Annahme, dass sich der Autor etwas dabei gedacht, etwas gefühlt, zum Ausdruck gebracht hat, das vielleicht nicht immer deutlich zu erkennen ist, aber umso eher zur Suche herausfordert. In einem Maschinengedicht ist man schneller bereit, sich damit abzufinden, dass es sinnfrei ist. [32, 3.2; S. 4]
Diese rezeptive Haltung reflektiert sich auch im Output, der sich in bedeutungsvoll und sinnlos teilt. Letztere ist jedoch heute meist kein Resultat mangelnder technischer Möglichkeiten, sondern beabsichtigte Sinnlosigkeit, die das Konzept und den Schreibprozess in den Vordergrund heben soll. Zur Einteilung und Messung der Sinnlosigkeit kann man die informationstheoretische Berechnung (24) heranziehen oder sie über einen Destruktionsgrad mit dem Input vergleichen. Zur Zerstörung sinnhafter Textstrukturen und zur Vermeidung von Sinn werden Verfremdungstechniken der Moderne (Collage, Cut-Up Technik etc.), Zufallsalgorithmen, Permutation, Animation oder Transformation angewendet. Als Paradigma hierfür kann der Dada Poetry Generator [16] gesehen werden, der Texteingaben dekonstruiert.

Imitation

Konträr zur Destruktion steht die Imitation von analogen literarischen Konzepten, welche im Feld der Natural Language Generation gipfelt, dessen Programme mit Hilfe von narrativen, poetischen oder formalen Strukturen, Stilistik und einem umfassenderen Input neue Texte generieren (25).

Innovation

Selten findet sich neben diesen zwei Haupttendenzen Generatoren, die innovativen und medienspezifischen Output schaffen. Die Ergebnisse können in diesem Fall nicht am Input festgelegt werden, sondern bieten neue Formen, sprachliche Ausdrücke und Inhalte. Hierfür könnte man van Mechelens Typus original computer poetry nennen:
In other words: derivative computer poetry and the ‘classic’ use of computer technology are imitative, whereas original computer poetry and the ‘’expressive’ use of this new technology are innovative. It stands to reason that original computer poetry requires greater imagination than its derivative cousin, even though both may be in free verse. Moreover, it unambiguously conceives of computer poetry as a process and mode of literary composition in its own right, with its own medium and potentialities. Computer poetry is original in that it is not based on earlier poetry: data and structure are both completely new.

Literarisches Hilfsmittel

Abgesehen von pragmatisch kommerzieller Nützung, Aktionismus und unterhaltender Lektüre fungieren generierte Texte vor allem als produktive Hilfestellung. Die Ergebnisse digitaler Textgeneration können somit wieder in den menschlichen "Kreativitätsprozess" eingehen. Meist wird vergessen, dass die Zusammenarbeit von Autor und Programm bei der Werkgenese heute schon alltägliche Praxis ist, da die meisten Texte mit den kleinen Rechtschreibungshelfern geschrieben oder ediert werden. Interessanter ist aber weniger die technische Unterstützung beim Schreiben, sondern die kreative Einwirkung eines Computers auf einen literarischen Text. Von einem "gespenstischen" Einwirken des Computers auf den menschlichen Schreibprozess berichtete Yoko Tawada, als sie ein bilinguales Schreibprogramm (Japanisch und Deutsch) verwendete, das automatisch Umlaute in bestimmter Buchstabenkombination in Ideogramme transformiert [62]. Die Generatoren liefern aber auch narrative Gerüste, wie storyland [25], oder Figuren [6], die dann überarbeitet und adaptiert werden können. Hierzu nennt Bachleitner Kurzweils Cybernetic Poet:
Die Vorschläge des Dichter-Assistenten umfassen Reim, Halbreim, Alliterationen, das nächste Wort, das Zu-Ende-führen von Phrasen und sogar Vorschläge für das gesamte restliche Gedicht. Eine fortgeschrittene - und kostenpflichtige - Version des "Cybernetic Poet" stellt ein reines Tool zur Textanalyse bereit. [32]

Algorithmische Textanalyse

Eine letzte Möglichkeit den Output zu rezipieren wäre, ihn wissenschaftlich zu analysieren. Dafür gibt es mehrere Methoden neben der vorgestellten Typologie, doch besonders passend ist die von Thomas Kamphusmann:
Die Idee, die mit dem hier vorzustellenden Ansatz verfolgt wird, ist viel- mehr die, die Texte selber in ihrer durch das skizzierte Modell formalisierter Materialität als Datenbank anzusehen, die hinreichend ist, bei entsprechender Auswertung Aussagen über ihre, der Texte, Struktur abzuleiten, ... [44, S. 284-5]
Postmodernism Generator [9] abgeben, der eine vollständige (jedoch unsinnige) Arbeit generiert.

4 Conclusio

Die vorgestellte Typologie erleichtert eine deskriptive oder komparative Analyse einzelner Werke. Wie die genannten Beispiele können auch andere generative Programme über die Kriterien der drei Kategorien bestimmt werden und daraufhin mit anderen verglichen werden. Dadurch können genauere Unterschiede und Analogien aufgezeigt werden, da Werke sich oft nur in einem der drei Teile oder gar einem Unterpunkt dieser differenzieren. Weiters ermöglicht die Typologie eine Ordnung mehrerer, heterogener Generationsprogramme. Dies zeigt meine Anthologie Florigenium [20], in der sich Selektionsverfahren und Anordnung nach diesen Kategorien richten.
Die Beispiele dienten nicht nur der Illustration der Kategorien und der Demonstration ihrer Anwendbarkeit, sondern zeigen auch die induktive Nähe der Typologie zur literarischen Praxis. Folglich können und sollen innovative Generatoren die Typologie stets erweitern. Doch trotz dieser Offenheit gegenüber Ergänzungen sind die Dreiteilung und deren variablen Unterkategorien essentielle Bestandteile jeder digitalen Literaturgeneration.

Anmerkungen

(1)Auch Norbert Bachleitner differenzierte zwischen den "permutative Generatoren und komplexe Textmaschinen, die mehr oder weniger formvollendete und semantisch ausgewogene Sätze, Verse und Geschichten produzieren." [30, S. 119] "Die Textgeneratoren können danach unterteilt werden, ob sie Programme zur Permutation von vorgegebenen Textelementen benützen, die sich bis in die Antike zurück verfolgen lassen, oder eigenständig Texte generieren". [31]
(2)Computer poems are of two kinds: formulary and derivative. Formulary poems consist of strings of sentences generated by means of a formula or syntactic rule [...] The second kind of c. p. is derivative. Here the basic principle is to take an existing line or poem and alter it in some systematic way. [56, S. 230]
(3)Martin Boot determined three categories in 1984: the "dice model," in which single words are chosen at random from a dictionary; the "sentence variation model," in which grammatical rules are observed; and the "filter model," which is based on "pattern recognition" in a text. [42, S. 36] zitiert nach [35].
(4)Oszillation wird von Heibach als prozessuale, transformierende Interaktion verstanden, die in der digitalen Literatur "zwischen Elementen des gleichen Typs" (horizontal; z. B. Programm-Programm) und "zwischen systemfremden Elementen" (vertikal; z. B. Computer-Mensch) [29, S. 33]. Aus der Kombination dieser zwei Typen ergeben sich für sie 1.) hypermediale Oszillation (Offline und horizontal) 2.) Transformation (ebenso und "Generierung neuer Elemente auf der Basis schon bestehender" [29, S. 35]) 3.) Maschine-Maschine Oszillation (Online und horizontal) 4.)Mensch-Maschine- Mensch-Oszillation (Online und vertikal).
(5)Auch wenn folgende Begriffsbestimmungen keinen absoluten Anspruch auf Definiertheit oder Vollständigkeit erheben möchten, gelten sie für meine Typologie und sollen die relevanten Aspekte angeführt und erläutert werden.
(6)Das Internet selbst ist Literatur, ein Buchstabenwesen. [59, S. 51]
(7)Als ein besonders emotionales Beispiel kann We feel fine [14] genannt werden. In diesem Projekt werden aus Blogeinträgen Sätze mit "I feel" and "I am feeling" komponiert und so ein Spiegel der emotionalen Blogsituation simuliert. Weiters könnte man auch argumentieren, dass gerade diese logisch operierenden Generatoren die rationalistisch, schnelllebige Konsumgesellschaft unserer Zeit am besten reflektieren kann.
(8)Ob automatische Textgeneration mit ihren historischen Vorläufern auch unabhängig vom digitalen Medium als eine literarische Gattung angesehen wird, habe ich bei meiner Recherche nicht feststellen können. Es wäre einer weitere Diskussion wert über die Möglichkeiten und den Nutzen artifizieller Generationsprojekte zusammenzufassen und Kriterien hierfür festzulegen.
(9)Als Beispiel sei hier Yun Gyung Cheongs Disserationsprojekt genannt, indem neben der Freytags Pyramide noch andere Theorien aus Literaturwissenschaft und kognitiver Psychologie herangezogen wurden "to evoke a targeted degree of suspense" [37].
(10)Po[or Symm]etry [Dra]in[s] [E]motion[s] is a live networked performance piece developed with P[a]ra[pra]xis software and implemented using the JAR library and a custom GUI. It should be stressed that this description is not prescriptive; lyrical and musical decisions are entirely decoupled from the core software. The work presents an Instant Messenger (IM)-like conversation between two people, in an obviously troubled relationship. Both screens are presented separately to the audience. [40]
(11)In der Publizistik und Kommunikationswissenschaft wird aus dem technischen Medienbegriff die Differenzierung nach dem Hilfsmittel getroffen: Medien sind materielle (Printmedien) oder energetische (elektrische, elektronische, digital, opto-elektronische) Träger und Übermittler von Daten bzw. Informationseinheiten (Mittelpunkt: Materialität und Technizität), was die Möglichkeiten eines Mediums bestimmt. Vgl: [49].
(12)Simon Biggs The Great Wall of China [7] greift zum Beispiel nur Franz Kafkas Beim Bau der Chinesischen Mauer als Textbasis auf.
(13)So verwendet A* Romantic Poetry Generator [41] von gutenberg.org Gedichte aus dem 19. Jahrhundert zur Textgenese. Als englischsprachiges Beispiel dient der Random Generator von Angie McKaig, dessen "poetry database is made up of (at times slightly modified) first lines from hundreds of poems in the public domain; most of these were snagged from Bartleby." [52]
(14)3by3by3 kombiniert journalistische, online Artikel: "Pick 3 stories from Google News. Using only words that occur in the first 3 paragraphs of each story, make a poem with 3 stanzas, 3 lines each, no more than 60 characters per line. The 3-word title should use a word from each story." [53]
(15)Zu den statischen, visuellen Medien, die als Input verwendet werden können, zählen die Fotografie, Malerei oder Comic, jedoch nicht Architektur, Plastiken, Installationen und ähnliche dreidimensionale Vermittlungsinstanzen, die nur über die zuvor genannten Medien digital vermittelbar sind.
(16)Bachleitner beschreibt diese multimediale Genese: "Parallel zu diesen Transformationen werden die Vorgänge in eine Montage aus Druckbuchstaben und - transmedial - in zwei graphische Codes (Farbflächen und Linien) sowie in Musik, "übersetzt". Translation diente auch als Basis für eine Performance mit dem Titel Imposition, bei der die Transformationen in einer einzigen Sprache über das Internet übertragen und von den Zuschauern auf Laptops mitverfolgt werden können. Zudem werden je nach gewählter Sprache und Modus (sinking, floating oder surfacing) vokalmusikalische Schleifen zugespielt." [31]
(17)Latein erlaubt eine freiere Anordnung der Wörter. Englisch ist ebenfalls durch die einheitlichen Deklinationen einfacher anzuwenden.
(18)Funkhouser nennt das anschauliche Exempel, in dem Subjekte und Präpositionen separat permutiert werden: "Strict permutation with added elements is found in Barbosa’s "Porto" (written in 1977), in which every activation of the program produced 25 lines of text that present permutations of a text built from four subjects: "GRANITO" (granite), "HISTORIA" (history), "PEDRA" (stone), and "SAUDADE" (longing/nostalgia). The additional inclusion of prepositions (e.g., "NA/NO," "A," "DA/DO," "O" in Portuguese) assigns alternative content to the nouns, enabling grammatical variation into the output." [43, S. 69]
(19)So konstruierte zum Beispiel die internationale Gruppe ALAMO (Atelier de Littérature Assistée par la Mathématique et les Ordinateurs), die kombinatorische Dichtung digitalisiert und eigene Generationsprogramme entwickelt, den Generator Rimbaudelaire nach folgendem Prinzip: "Le moule a été obtenu en réduisant Le dormeur du val à un squelette dépourvu de mots pleins (substantifs, adjectifs et verbes). Ce squelette est alors nourri de mots appartenant au vocabulaire de Baudelaire, et qui respectent, bien sûr, de trs fortes contraintes syntaxiques, rythmiques, etc." [1]
(20)Denn kann man semantische, syntaktische Inkohärenz, Neologismen oder Onomotopoeia nicht eher zur humanen, wenn nicht sogar künstlerischeren oder Alltags näheren Sprache, als die angestrebte Perfektion zählen?
(21)Im Vorwort eines aktuellen Bandes zu Semantic Knowledge Management wird die Schwierigkeit der semantischen Datenerfassung im Internet erläutert, die auch für den Input anzuwenden ist: "Currently, Web-based information is based primarily on documents written in HTML, a language useful for describing the visual presentation of web pages through a browser. HTML an today’s web, however, offer only very limited ways of describing the content itself. So, for example, you can specify that a given string should be displayed in a large bold font but you cannot specify that the string represents a product code or a product price. [...] Semantic Web Technology aims to address this shortcoming using the descriptive languages RDF and OWL, and the datacentric, customizeable markup language XML." [39, S. 1]
Einen Lösungsansatz zeigen Kalina Bontecheva und ihre Mitautoren auf: "Information extraction (IE) takes unseen texts as input and produces fixed-format, unambigious data as output. It involves processing text to identify selected informations, such as particular named entities or relations among them from text documents. [...] Ontology-based information extraction (OBIE) can be adapted specifically for semantic annotation tasks. An important difference between traditional IE and OBIE is the latter’s closely coupled use of an ontology as one of the system’s resources - the ontology serves not only as a schema or list of classifications in the output, but also as input data - its structure affects the training and tagging processes." [39, S. 37] Ob dieser Ansatz auch künstlerisch umgesetzt wurde oder wird, kann meine Recherche noch nicht bestätigen.
(22)Da der Computer die gesamte Strecke der Kommunikation bedient, ist er eine universelle Zeichenmaschine und nicht bloß ein Medium. Mit der geisteswissenschaftliche Fehllektüre des Computers als bloßem Medium wurde Netzwissenschaft als, "Medienwissenschaft" (statt als Semiotik) mißverstanden und, in direkter Folge, Netzkunst als sogenannte ,"Medienkunst". Diese Fehllektüre hat, so scheint es, dazu geführt, daß ein seit Kracauer und McLuhan an Film, Fernsehen, Radio und Video geschultes Begriffs- und Analyseinstrumentarium einfach auf Computer und Internet übertragen wurde. Analog wurden Begriffe wie ,"Multimedialität", "Interaktivität" und "Nonlinearität" in texttheoretisch und poetologisch fragwürdigen Definitionen in den Diskurs der Netzliteratur importiert und hinterließen dort einen konzeptuellen Trümmerhaufen, der bis heute noch nicht vollständig abgeräumt ist. [38]
(23)Mit Interaktivität ist dabei die Teilhabe der Rezipienten an der Konstruktion des Werkes (programmierte Interaktivität: Mensch-Software) oder in Reaktion auf Handlungen anderer Rezipienten (netzgebundene Interaktivität: Mensch-Mensch via Software) erfolgen kann. [29, S. 5]
(24)Folgt man der Informationstheorie, bemisst sich der Grad des Informationsgehaltes einer Botschaft am Wechselspiel von Ordnung und Zufall, Erwartetem und Überraschung. Bis zu einem gewissen Punkt nimmt die Information bei steigendem Grad der Zufälligkeit zu, wenn dieser Punkt überschritten ist, nimmt die Information wieder ab. Ein Zuviel an Zufälligkeit, der Mangel an Ordnung, lässt eine Botschaft daher bedeutungslos und (zumindest für menschliche Leser) "unlesbar" werden. Erinnert sei an Birkhoffs Gleichung, die das "ästhetische Maß " ebenfalls durch das Verhältnis von Ordnung und Komplexität bestimmt (M = O : C; zit. in Bense, Aesthetica 31). [32, 3.2; S. 15]
(25)Der Romantik Poetry Generator zum Beispiel generiert romantische Gedichte aus gutenberg.org, um dem Geniegedanken aus dieser Zeit nachzueifern [41].

Literaturverzeichnis


Primärliteratur
[1] ALAMO: Rimbaudelaire. http://alamo.mshparisnord.org/programmes/rimbaudelaires-x.html, 2004.
[2] Andrews, Jim: StirFryTexts (Spastext und Correspondance) http://www.vispo.com/StirFryTexts/index.html, 1999.
[3] Arens, Manfred: Lorca Maschine http://www.untexte.de/texte/lorca.htm, 2001.
[4] Armstrong, Kate und Tippett, Michael: Grafik Dynamo. http://turbulence.org/Works/dynamo/index.html, 2005.
[5] Auer, Johannes: SearchSongs - Sehnsuchtsmelodien des Netzes. http://searchsongs.cyberfiction.ch/, 2008.
[6] Balazard, Simone: Le Jardin des drames. http://lapal.free.fr/alamo/articles/jdd/jdd.html, Stand: 1. 9. 2011.
[7] Biggs, Simon: The Great Wall of China. http://www.littlepig.org.uk/wall/wall.htm, Stand: 27. 08. 2010.
[8] Bleser, Frederik de, Smedt, Tom de, und Nijs, Lucas: Flowerewolf (NoteBox version 1.9.5 for Mac OS X) http://nodebox.net/code/index.php/Flowerewolf, 2002.
[9] Bulhak, Andrew C. und Larios, Josh: The Postmodernism Generator. (using Dada Engine) http://www.elsewhere.org/pomo/, Stand: 1. 9. 2011.
[10] Cayley, John und Perring, Giles: Translation http://www.shadoof.net/in, 2004.
[11] Cramer, Florian: per.m]utations http://permutationp.pleintekst.nl/, Stand: 1. 9. 2011.
[12] Fillmore, Nathanael. A* Romantic Poetry Generator. http://nate-fillmore.com/pub/astar-poetry-generation.pdf, Stand: 23. 11. 2011.
[13] Gervás, Pablo: Generating Poetry from a Prose Text: Creativity versus Faithfulness. Proceedings of the AISB󈧅 Symposium on Artificial Intelligence and Creativity in Arts and Science, 2001.
[14] Harris, Jonathan und Kamvar, Sep: We feel fine. http://www.wefeelfine.org, 2005, Stand: 30. 8. 2011.
[15] Hennessey, Neil: JABBER: The Jabberwoky Engine. http://www.poemsthatgo.com/gallery/winter2004/jabber/index.htm#, 2004.
[16] Hess, Gary R. Dada Poetry Generator. http://www.poemofquotes.com/tools/dada.php, Stand: 1. 9. 2011.
[17] Krause, Manfred und Schaudt, Götz Friedemann: Computer-Lyrik. Düsseldorf: Droste, 1967.
[18] Kurzweil, Ray: Cybernetic Poet. http://www.kurzweilcyberart.com/, Stand: 1. 9. 2011.
[19] Mac Low, Jackson, Hartman, Charles O. und Barnes, Djuna: Barnesbook: Four Poems Derived from Sentences by Djuna Barnes. Los Angeles: Sun and Moon Press, 1996.
[20] Minks, Patricia: Florigenium. http://www.unet.univie.ac.at/˜a0649517/, 2011.
[21] Racter (mit Chamberlain, William und Hall, Joan): The Policeman’s Beard is Half Constructed. New York: Warner Books, 1984.
[22] Rowe, Beverley Charles: 100.000.000.000 poems. (nach Raymond Queneau: Cent mille milliard de pomes) http://www.bevrowe.info/Queneau/QueneauRandom_v4.html, Stand: 10. 6. 2011.
[23] Seifert, Lewis u.a.: Proppian Fairy Tale Generator v1.0. http://www.brown.edu/Courses/FR0133/Fairytale_Generator/gen.html, 2001.
[24] Utterback, Camille und Achituv, Romy: Text Rain. http://www.camilleutterback.com/textrain.html, Stand: 18. 08. 2011.
[25] Wylde, Nanette: Preneo. http://preneo.org/nwylde/, Stand: 1. 9. 2011.
[26] Zeleznikar, Jaka: Poem for Echelon. http://www.jaka.org/2001/echelon/, Stand: 1. 9. 2011.

Sekundärliteratur
[27] Brockhaus. Enzyklopädie. 21. Auflage; Bd. 6, 7, 18. Leipzig / Mannheim: F. A. Brockhaus, 2006.
[28] Anz, Thomas (Hg.): Handbuch Literaturwissenschaft. Bd. 1. Gegenstände und Grundbegriffe. Stuttgart: J. B. Metzler, 2007.
[29] Arnold, Heinz Ludwig und Simanowski (Hg.): Digitale Literatur. Text + Kritik, 152, 2001.
[30] Bachleitner, Norbert: "Nicht jeder Tisch ist gross oder jedes Dorf ist alt". Dichtungsgeneratoren zwischen literarischer Avantgarde und kommerzieller Verwertung. In Finno-Ugrian studies in Austria. On the road - Zwischen Kulturen unterwegs. hrsg. v. Ágoston Zénó Bernád, Márta Csire und Andrea Seidler. Wien: Lit-Verlag, 2009, S. 117 - 133.
[31] Bachleitner, Norbert: Interaktivität, Data Mining und Reimling. Neuere Entwicklungen innerhalb der digitalen Literatur. In Neues vom Buch. Hrsg. v. Doris Moser, Arno Russegger und Constanze Drumm. Innsbruck: Studienverlag, 2011, S. 131-154.
[32] Bachleitner, Norbert: Formen digitaler Literatur. (Vorlesung). http://complit.univie.ac.at/skripten/digitale-literatur-20/, Stand: 2. 8. 2011.
[33] Bleser, Frederik de, Smedt, Tom de, und Nijs, Lucas: Flowerewolf (NoteBox version 1.9.5 for Mac OS X) http://nodebox.net/code/index.php/Flowerewolf , Stand: 16. 08. 2011.
[34] Block, Friedrich W.: p0es1s, Ästhetik digitaler Poesie - The Aesthetics of digital poetry. Ostfildern-Ruit: Hatje Cantz, 2004.
[35] Boot, Martin: Taal, Tekst, Computer. Katwijk: Servire, 1984.
[36] Bootz, Philippe: Unique-Reading Poems: A Multimedia Generator. In Media Poetry: An International Anthology. Hrsg. v. Eduardo Kac. Bristol: Intellect, 2007.
[37] Cheong, Yun Gyung: A Computional Model of Narrative Generation for Suspense. PhD thesis, North Carolina State University, 2007.
[38] Cramer, Florian: Kombinatorische Dichtung und Computernetzliteratur (Kasseler Fassung). http://cramer.pleintekst.nl/essays/combinatory_poetry_-_permutations/, 2000. Stand: 31. 7. 2011.
[39] Davis, John u. a. (Hg.): Semantic Knowledge Management: Integrating Ontology Management, Knowledge Discovery, and Human Language Technologies. Berlin u.a.: Springer, 2009.
[40] Dubrau, Josh und Havryliv, Mark: Poetry in Motion. nime2008.casapaganini.org/documents/Proceedings/Papers/224.pdf, Stand: 13. 11. 2011.
[42] Funkhouser, Chris T.: Prehistoric digital poetry: an archaeology of forms, 1959-1995. Tuscaloosa: Univ. of Alabama Press, 2007.
[43] Gendolla, Peter: The Aesthetics of Net Literature: Writing, Reading and Playing in Programmable Media. Bielefeld: transcript, 2007.
[44] Gendolla, Peter und Kamphusmann, Thomas (Hg.): Die Künste des Zufalls. Frank- furt a. M.: Suhrkamp, 1999.
[45] Gendolla, Peter und Schäfer, Jörgen: Playing With Si- Literary Communication. http://dev.stg.brown.edu/projects/netart/readings/Gendolla_Schfer.pdf, Stand: 3. 12. 2011.
[46] Gendolla, Peter u.a. (Hg.): Formen interaktive Medienkunst. Geschichte, Tendenzen, Utopien. Frankfurt a. M.: Suhrkamp, 2001.
[47] Gervás, Pablo: Generating Poetry from a Prose Text: Creativity versus Faithfulness. Proceedings of the AISB󈧅 Symposium on Artificial Intelligence and Creativity in Arts and Science, 2001.
[48] Heibach, Christiane: Literatur im elektronischen Raum. Frankfurt a. M.: Suhrkamp, 2003.
[49] Hiebel, Hans H., Hiebler, Heinz und Kogler, Karl: Die Medien: Logik, Leistung, Geschichte. München: Fink, 1998.
[50] Kwasnik, Barbara H.: The Role Of Classification In Knowledge Representation And Discovery. Library Trends, 48.1, 1999.
[51] Lönneker, Birte, Meister, Jan Christoph, Gervás, Pablo, Peinado, Federico und Mateas, Michael: Story generators: Models and approaches for the generation of literary artefacts. ACH/ALLC 2005 Conference Abstracts. Proceedings of the 17th Joint International Conference of the Association for Computers and the Humanities and the Association for Literary and Linguistic Computing. Victoria, BC, Canada, 2005, S. 126-133.
[52] McKaig, Angie: Random Poetry Generator. http://www.angiemckaig.com/play/poetrygen/index.php?numlines=8, Stand: 16. 08. 2011.
[53] Newman, Lance: 3by3by3. http://3by3by3.blogspot.com/, Stand: 10. 6. 2011.
[54] Electronic Literature Organization: What is Electronic Literature? http://www.eliterature.org/about/, Stand: 23. 08. 2011.
[55] Peinado, Federico, Gervás, Pablo, Diaz-Agudo, Belén und Hervás, Raquel: ProtoPropp. The Fairy-Tale Generator. http://www.fdi.ucm.es/profesor/pgervas/projects.html, 1. 9. 2010.
[56] Preminger, Alex und Brogan, T.V.F: The New Princeton Encyclopedia of Poetry and Poetics. New Jersey: Princeton University Press, 1993.
[57] Ricardo, Francisco J. (Hg.): Literary Art in Digital Performance. Case Studies in New Media Art and Criticism. New York u. a.: Continuum, 2009.
[58] Salton, Gerard: Automatic Text Processing. The Transformation, Analysis, and Retrieval of Information by Computer. New York u. a.: Addison-Wesley Publishing Company, 1988.
[59] Schmidt-Bergmann, Hans-Georg und Cramer, Florian: Liter@tur. Computer - Literatur - Internet. Bielefeld: Aisthesis-Verlag, 2001.
[60] Simanowski, Roberto: Digital art and meaning: reading kinetic poetry, text machines, mapping art, and interactive installations. Minneapolis: UP Minnesota, 2011.
[61] Tabbi, Joseph: Toward a Semantic Literary Web: Setting a Direction for the Electronic Literature Organization’s Directory. , 2007, Stand: 18. 08. 2011.
[62] Tawada, Yoko: Verwandlungen. Tübinger Poetik-Vorlesung. Tübingen: Konkursbuch Verlag Gehrke, 2001.
[63] Van Menchelen, Vincent: Computer Poetry. http://www.trinp.org/Poet/ComP/ComPoe.HTM, 1992, Stand: 30. 8. 2011.
[64] Vincler, John: Barnesbook: Four Poems Derived from Sentences by Djuna Barnes. http://directory.eliterature.org/node/320, Stand: 1. 9. 2011.
[65] Wilpert, Gero von: Sachwörterbuch der Literatur. 8. Auflage. Stuttgart: Alfred Kröner Verlag, 2001.