Kunst und die Infrastruktur geteilter Intentionalität_1.Teil

1. Grundlagen

1.1

2009 erschien in deutscher Übersetzung ein Werk des seinerzeit am Leipziger Max-Planck-Institut für evolutionäre Anthropologie forschenden amerikanischen Anthropologen und Verhaltensforschers Michael Tomasello: Die Ursprünge der menschlichen Kommunikation. Es widmet sich, wie Jürgen Habermas in seiner Rezension in der ZEIT schrieb, des „uralte(n) Problem(s), an dem sich auch die Philosophie spätestens seit Herder die Zähne ausbeißt: Wie die Sprachen entstanden sind, die eine uns geläufige kommunikative Handlungskoordinierung und arbeitsteilige Kooperation möglich gemacht und damit einen völlig neuen Modus der Vergesellschaftung ins Leben gerufen haben“ (Habermas 2009). Begeistert nannte es Habermas ein „bahnbrechendes Buch“. Bahnbrechend deshalb, weil damit ein schlüssiges, durch experimentelle Vergleiche untermauertes Konzept der Onto- und Phylogenese der Infrastruktur menschlicher Kommunikation im Abgrenzung zu der der übrigen Hominiden vorgelegt wurde. Eine Infrastruktur, hinter die, einmal etabliert, der Mensch nicht mehr zurückgehen kann: Sie ist die Präsupposition jeder nur denkbaren Form menschlich-kommunikativer Akte; keine wie auch immer geartete intentionale Äußerung des Menschen, selbst die der Lüge oder des künstlerischen Schaffens, kann von dieser stillschweigenden Voraussetzung absehen und ohne sie vollzogen werden.

Worin besteht aber nun Tomasellos Leistung im Einzelnen? Er weist überzeugend auf, dass „die ersten, nur beim Menschen vorkommenden Formen der Kommunikation im Zeigen und Gebärdenspiel“ (Tomasello 2017: 13) bestehen – sie sind „die entscheidenden Übergangspunkte in der Evolution menschlicher Kommunikation“ (ebd.: 13). Während sich selbst die Zeigegesten so hoch entwickelter nicht-menschlicher Primaten wie die der Hominiden im Rahmen „selbstbezogene(r) Intentionalität“ (Habermas 2009) fast ausschließlich auf den Akt des Aufforderns beschränken, besitzen die Zeigegesten[1] der Menschen aufgrund ihres prosozialen Charakters einen weit größeren Anwendungsbereich. So ist nach Tomasello eine zentrale Motivation des Menschen die des Informierens resp. des Helfens: Schimpansen werden, im Gegensatz zum Menschen, einem schreienden Jungen nicht zeigen, wo dessen Mutter ist, „weil es einfach nicht zu ihren Kommunikationsmotiven gehört, andere auf hilfreiche Weise über etwas zu informieren“ (Tomasello 2017: 16). Sie können nicht von sich und ihren eigenen Intentionen abstrahieren, sind deshalb nicht imstande, sich in andere hineinzuversetzen und im Sinne deren Intentionen kooperativ zu handeln. Demgegenüber ist die menschliche Kommunikation „ein grundlegend kooperatives Unternehmen“ (ebd.: 17).

So zeigt ein Schimpanse in der Regel nur auf etwas, was im Moment des Zeigens, hier und jetzt, Objekt seiner Begierde, also seiner egoistischen, selbstbezogenen Intention ist: Er fordert sein Gegenüber auf, ihm dieses Objekt zu geben. Beim menschlichen Akt des Informierens hingegen verfolgt Person A gegenüber B keine derart egoistischen Interessen, sondern handelt in gewisser Weise altruistisch: A informiert B, weil A glaubt, dass B diese Information haben möchte. Mit der Zeigegeste generiert A dabei eine gemeinsame Aufmerksamkeit von A und B des durch ihn angezeigten, gemeinsam wahrgenommenen und identifizierten Objekts. Damit ist jedoch noch nichts gewonnen: Um die Zeigegeste des anderen angemessen interpretieren zu können, muss ich „feststellen können, welche Absicht der andere mit einer derartigen Lenkung meiner Aufmerksamkeit verfolgt“ (Tomasello 2017: 15), damit der kommunikative Akt reibungslos abläuft und erfolgreich ist. Wie kann aber nun, so fragt Tomasello, „etwas so Einfaches wie ein ausgestreckter Finger auf so komplexe Weise etwas mitteilen – und das bei verschiedenen Gelegenheiten auf so verschiedene Weise“ (ebd.: 14)? Sehen wir uns einen prototypischen Fall an:

A zeigt auf ein Fahrrad und lenkt so die Aufmerksamkeit von B darauf (geteilte Aufmerksamkeit). Das Fahrrad gehört C, einem stadtbekannten Filou. C hat sich auf unschöne Weise von D getrennt. Das weiß A ebenso wie B. Und A weiß, dass B dies weiß. Zudem weiß A, dass B weiß, dass A weiß, dass B dies weiß (ad infinitum) – es liegt also „ein intersubjektiv geteiltes Wissen“ (Habermas 2009) vor. Mit diesem wechselseitig geteilten, kulturellen Wissen (das A und B getrennt voneinander, aber durchaus auch durch gemeinschaftliche Tätigkeiten erworben haben können) liegt ein „gemeinsamer begrifflicher Hintergrund“ (Tomasello 2017: 15) vor. Je größer nun dieser gemeinsame Hintergrund ist, umso größer die Wahrscheinlichkeit, dass der kommunikative Akt zwischen A und B reibungslos ablaufen wird: A und B besitzen bezüglich C und D ein maximales, wechselseitig geteiltes Wissen. A weist B auf das Fahrrad von C hin. B versteht die Absicht, die A mit der Zeigegeste verfolgt, ‚blind‘[2]. Und macht einen großen Bogen um das Fahrrad, um ja nicht dem momentan abwesenden Filou C zu begegnen.

Neben der wechselseitig vorausgesetzten, kooperativ angelegten „prosoziale(n) Motivation“ (ebd.: 16) zur Kommunikation (A vermutet, dass B kein gesteigertes Interesse daran hat, C zu begegnen – und setzt ihn vermittels der Zeigegeste auf Basis ihres gemeinsamen Hintergrunds von Cs vermuteter Anwesenheit in Kenntnis) stellt die „Fähigkeit, einen gemeinsamen begrifflichen Hintergrund zu schaffen (…), eine absolut entscheidende Dimension aller menschlichen Kommunikation“ (ebd.: 16) dar. Sie erweist sich somit im Sinne des britischen Sprachphilosophen H. Paul Grice, auf den Tomasello zentrale Einsichten seines Konzepts gründet, als „ein grundlegend kooperatives Unternehmen“ (ebd.: 17).

Dieses Spezifikum menschlicher Kommunikation wird, so Tomasello, durch etwas strukturiert, was in der Handlungstheorie und Philosophie bis heute unter den Begriffen ‚collective intentionality‘ resp. ‚shared intentionality‘ oder ‚We-intentionality‘ („‚geteilte Intentionalität‘ oder ‚Wir-Intentionalität‘“[3] [ebd.: 17]) diskutiert wird. Eine solche „psychologische Infrastruktur“ (ebd.: 19) der Intentionalität ist „für die Beteiligung an spezifisch menschlichen Formen der Zusammenarbeit notwendig, bei denen ein Subjekt im Plural, ein ‚Wir‘ auftritt: gemeinsame Ziele, gemeinsame Absichten, wechselseitiges Wissen, geteilte Überzeugungen“ (ebd.: 17). Dies reicht von einfachen Formen der Zusammenarbeit wie der spontanen kooperativen Festlegung eines gemeinsamen Ziels bei der Zeigegeste von A, auf die B reagiert, über die gemeinsame Herstellung eines Werkzeugs bis hin zu alltäglichen Gesprächssituationen, in denen entsprechend des handlungstheoretischen Grundmodells von H. Paul Grice mit dem von A mit der Äußerung x gegenüber B Gemeinten (Sprecher-Intention resp. Sprecher-Bedeutung) strukturell auch der Beginn einer Bedeutungsetablierung einhergeht, und „kulturell konstruierten Dinge(n) wie Geld, Ehe und Regierung“ (ebd.: 17). Dinge, „die nur innerhalb einer institutionellen, kollektiv konstituierten Wirklichkeit existieren, an die wir alle glauben und in der wir gemeinsam handeln, so als ob es sie wirklich gäbe[4]“ (ebd.: 17).

Diese einzigartige Fähigkeit und Fertigkeit zur kooperativen Kommunikation ermöglicht es den Menschen, ihre „Aktivitäten der Zusammenarbeit effizienter zu gestalten“ (ebd.: 19) und dabei en passant ihre gruppenspezifischen Bindungen auf Basis eines gemeinsamen begrifflichen Hintergrunds unter Festlegung auf gemeinsame kulturelle Ziele zu stärken – bis hin zur Konstitution einer gemeinsamen Identität, die diejenigen ausgrenzt, die eben nicht über den gemeinsamen begrifflichen Hintergrund und die wechselseitig geteilten Ziele und Absichten verfügen. Im weiteren Verlauf der Entwicklung „begannen die Menschen außerhalb kooperativer Kontexte auf diese neue kooperative Weise zu übergeordneten, nichtkooperativen Zwecken zu kommunizieren – bis sie sogar in der Lage waren, andere durch Lügen zu täuschen“ (ebd.: 19, auch: 232). Da zeigt sich die Schattenseite dieser neuen Fähigkeit zur geteilten Intentionalität: Menschen sind sie nun fähig zu lügen. Also nutzen sie irgendwann diese neue Fähigkeit – und lügen. Schimpansen hingegen lügen nicht, weil sie nicht über diese neue Fähigkeit verfügen. Das heißt: Sie können nicht lügen. Dafür können sie aber auch nicht Theater spielen. Oder irgendwelche anderen künstlerischen Aktivitäten entfalten. Aber selbst wenn sie nun zu Aktivitäten imstande sein sollten, die für einen unbedarften Beobachter von den künstlerischen Aktivitäten und Artefakten der zur Lüge befähigten Hominiden nicht zu unterscheiden wären: Ihre Infrastruktur der Kommunikation beruht auf selbstbezogener, egoistischer Intentionalität; die der Menschen demgegenüber auf geteilter Intentionalität. Im Laufe seiner Phylogenese entwickelte der Mensch als Spezies die kooperative Infrastruktur, im Laufe seiner Ontogenese bildet der einzelne Mensch diese phylogenetisch angelegte Infrastruktur jeweils individuell aus[5]. Und handelt von da an kommunikativ auf Basis eben dieser kooperativen psychologischen Infrastruktur. Das heißt: Selbst wenn der Mensch, wie das leider oft genug der Fall ist, schamlos egoistisch handelt, handelt er stets auf Basis der Infrastruktur geteilter Intentionalität; die selbstbezogene Intentionalität des Menschen ist demnach strukturell anders geartet als die der Menschenaffen.

An anderer Stelle haben wir den strukturellen Mechanismus aller im weitesten Sinne kommunikativer Handlungen – vom alltäglichen Gespräch über das ‚Gespräch‘ als sozialem Diskurs (Clifford Geertz) und der Texte als intentionale Interventionen in die jeweiligen Diskurse ihrer Zeit (Quentin Skinner) bis hin zu den künstlerischen Äußerungen –, durch die A bei B intentional eine bestimmte Wirkung erzielen will, vorläufig als perlokutionäre Kraft der Form ‚A will B durch x zu etwas bewegen‘ bestimmt. Im Lichte der Erkenntnisse von Michael Tomasello et al. lässt sich nun festhalten, dass auch diese mit perlokutionärer Kraft vorgetragenen und egoistisch motivierten intentionalen kommunikativen Handlungen auf der bei jedem Einzelnen ontogenetisch ausgebildeten psychologischen Infrastruktur kooperativer Kommunikation basieren: der geteilten Intentionalität. Bei allen dabei auf den verschiedenen Ebenen kommunikativer Praxis vorläufig ausgemachten acht Erscheinungsformen der perlokutionären Kraft ist diese Grundannahme somit stillschweigend vorauszusetzen:

1. Verständigung ist „nicht ‚der Zweck‘ der Sprache, sondern allenfalls einer unter vielen“ (Keller 2014: 135). Vielmehr scheint eine wie auch immer sich darstellende Einflussnahme auf den Gesprächspartner das vorrangige Ziel eines Sprechers in einem Gespräch zu sein: A will Einfluss auf B nehmen, also eine bestimmte Wirkung durch das, was er sagt, bei B erzielen. Das heißt: B durch x zu etwas zu bewegen. So zum Beispiel zu einer Antwort, die wiederum mit perlokutionärer Kraft das Ziel verfolgen kann, eine Replik von A zu initiieren (ad infinitum).

2. Zentrales Momentum des handlungstheoretischen Grundmodells von H. Paul Grice ist das Erkennen der „reflexive(n) Intention“ (Liedtke 2016: 37) des Sprechers durch den Angesprochenen. Um die kommunikative Intention (die Sprecher-Intention), also das mit der Äußerung Gemeinte, sowie die intendierte Wirkung (die Sprecher-Bedeutung) verstehen zu können, muss der Angesprochene eine interpretative Leistung erbringen und über relevantes Kontextwissen verfügen. Dabei lässt sich die Intention von A, unabhängig von jeder inhaltlichen Aussage, strukturell ebenfalls darstellen als: A will B durch x zu etwas bewegen – nämlich zur Erkenntnis dessen, was A meint.

3. Gemäß des Grice’schen handlungstheoretischen Grundmodells ereignet sich das Verständnis des Gemeinten, das als Bedeutung noch nicht sozial festgelegt ist und bei der noch kein gemeinsamer Kontext konstituiert wurde, in einem Prozess kooperativen Handelns. Die Variation der perlocutionary force[6] (A will B durch x zu etwas bewegen – zur Erkenntnis dessen, was A meint) würde sich so als konstitutives Momentum jeder menschlich-kooperativen Interaktion und als struktureller Ausgangspunkt der Konventionalisierung resp. Codierung arbiträrer sprachlicher Zeichen darstellen.

4. In der Terminologie des britischen Sprachphilosophen John L. Austin wird der mit der Lokution und der Illokution verbundene Sprechakt der Perlokution als der nicht-konventionale Akt bezeichnet, mit der der Sprecher die Absicht verfolgt, bestimmte Wirkungen beim Angesprochenen zu erzielen. Diese intentionale Handlung ließe sich damit ebenfalls auf die ganz allgemeine Formel bringen: ‚A will bei B durch x etwas bewirken‘ (will ihn zu etwas bewegen).

5. A verfolgt die Intention, B durch die Äußerung x zu einer Replik zu inspirieren: Es hat den Anschein, als stelle dies den grundlegenden Impuls für Beginn und Fortführung eines jeden dialogisch konstituierten, kooperativen Konstrukts dar, also solcher Gespräche und Diskurse, die auf das klassische Konstrukt von Rede und Widerrede hinauslaufen. Gegebenenfalls ist die perlocutionary force aber sogar die treibende Kraft eines jeden sozialen Diskurses, zu dem auch die intentionalen Interventionen der künstlerisch Schaffenden in den diskursiven Kontext ihrer Zeit und Kultur durch ein Artefakt gehören würde – siehe die Punkte 7 und 8 (dialogische Konstrukte sind immer reziprok, soziale Diskurse nicht zwingend – das ist der grundlegende Unterschied zwischen dem Gespräch und dem ‚Gespräch‘ [Clifford Geertz]).

6. Die Vorsatzabsicht künstlerisch Schaffender, Artefakte zu kreieren, ist, so die Annahme, stets mit einer darüber hinaus gehenden, grundlegenden kommunikativen Absicht verbunden: beim potentiellen Rezipienten eine bestimmte Wirkung zu erzielen, um ihn zu etwas zu bewegen. Hierunter wäre insbesondere die Inspiration zur Assoziation zu fassen. Damit wäre die perlokutionäre Kraft als Impuls zur automatischen Rezeption die Voraussetzung dafür, dass aus einem Werk ein Kunst-Werk, also die singuläre, rein subjektive und flüchtige Signatur des Rezipienten, die keinen Bestand hat, werden kann (vorausgesetzt, seitens des Rezipienten besteht eine entsprechende dispositionelle Grundverfassung zur Rezeption).

7. Künstlerisch Schaffende intendieren, durch ihr Werk bei Rezipienten eine Reaktion hervorzurufen. Dabei kann es sich um die Inspiration zur Assoziation handeln, zudem kann sich die Intention aber auch als Intention zur Inspiration einer wie auch immer gearteten intelligiblen, interpretativen und reflexiven ‚Äußerung‘ äußern. Das intentional mit perlokutionärer Kraft verfolgte Ziel einer solchen Replik umfasst dabei die gesamte Breite vom persönlichen Statement unter anderem des Kunstinteressierten über die Interpretation durch die Kunstwissenschaft und Rezeption durch die Kunstkritik bis hin zur wohlwollenden Aufnahme durch den Kunstmarkt. Der grundlegende Mechanismus ‚A will B durch x zu etwas bewegen‘ erscheint so als durchgehendes Merkmal generell aller im realen sozialen Kontext stattfindenden kommunikativen Akte. Auch die der ‚Gespräche‘, die nicht auf ein Gespräch aus sind, also nicht auf das klassisch-dialogische Konstrukt von Rede und Widerrede. So wie es bei dem überwiegenden Teil der durch Kunstschaffende erstellten Artefakte der Fall ist, die mit ihnen in der Regel keinen Dialog initiieren wollen.

8. Künstlerisch Schaffende greifen durch ihr Werk zudem in die „allgemeinen diskursiven Kontexte ihrer Zeit“ (Skinner 2009b: 81) ein. Ihre Artefakte stellen insofern Beiträge sozialer Diskurse dar, die in kulturelle Kontexten eingebunden sind und die, will man sie ‚verstehen‘, zurück in diejenigen Kontexte gestellt werden müssen, in denen sie ursprünglich verfasst wurden und einer Bedeutungsexplikation durch die ‚dichte Beschreibung‘ harren (wobei in der modernen und zeitgenössischen Kunst diese Beiträge zumeist nicht auf Basis sozial festgelegter Bedeutungsstrukturen, also mit konventionalen Zeichen resp. öffentlichen Codes, sondern mit singulären ‚Künstler-Intentionen‘ verfasst werden). Hier zielt die perlokutionäre Kraft des ‚A will B durch x zu etwas bewegen‘ nicht zwingend auf eine konkrete Person B, sondern gegebenenfalls auf eine Öffentlichkeit, die Teil dieses sozialen Diskurses ist oder dazu motiviert werden soll, diesem Diskurs beizutreten.

1.2

Die Kompetenzen und Motivationen geteilter Intentionalität machen das aus, „was wir die ‚kooperative Infrastruktur menschlicher Kommunikation‘ nennen können“ (Tomasello 2017: 18). Wobei sich die „anfänglichen Schritte in diesem Prozeß (…) höchstwahrscheinlich im Modus der Geste“ (ebd.: 19) vollzogen haben. Sie werden von Menschenaffen häufig erlernt und flexibel zu verschiedenen sozialen Zwecken eingesetzt. Sie richten sie gezielt „an bestimmte Individuen und berücksichtigen dabei deren gegenwärtigen Aufmerksamkeitszustand“ (ebd.: 19/20), wohingegen Vokalisierungen bei ihnen „beinahe vollständig genetisch festgelegt, eng mit spezifischen Emotionen verknüpft und (…) wahllos an alle in der unmittelbaren Umgebung gerichtet“ (ebd.: 19) sind. Was hier als phylogenetische Wurzel menschlicher Kommunikation bestimmt wird, hat sich in Tomasellos Untersuchungen zur Entwicklung kommunikativer Verhaltensmuster bei Kleinkindern bestätigt: In der Ontogenese tritt die „menschliche kooperative Kommunikation (…) zuerst in Form natürlicher, spontaner Gesten des Zeigens und des Gebärdenspiels auf“ (ebd.: 22).

Die natürliche Neigung des Menschen besteht beim Zeigen darin, „der Blickrichtung von anderen zu externen Objekten zu folgen“ (ebd.: 20) und beim Gebärdenspiel darin, „die Handlungen anderer als absichtlich zu interpretieren“ (ebd.: 20). Damit wird eine wesentliche Basis für kollaborative Aktivitäten geschaffen, „in denen die Teilnehmer Absichten und Aufmerksamkeit teilen und (…) durch natürliche Formen gestischer Kommunikation koordiniert werden“ (ebd.: 20). Dies kann als „biologische Anpassungen zur Kooperation und sozialen Interaktion im allgemeinen“ (ebd.: 22) in Gestalt der „psychologischen Infrastruktur geteilter Intentionalität“ (ebd.: 22) des Menschen aufgefasst werden. Dazu gehören nach Tomasello neben

1. den „sozio-kognitiven Fertigkeiten zur gemeinschaftlichen Erzeugung gemeinsamer Absichten und gemeinsamer Aufmerksamkeit (und anderer Formen eines gemeinsamen Hintergrunds)“ (ebd.: 22)

2. auch „prosoziale Motive (und sogar Normen) des Helfens und Teilens mit anderen“ (ebd.: 22), wobei dieses Helfen und Teilen nicht ganz so selbstlos ist, wie es scheint: Für den Kommunizierenden muss, so Tomasello, das unmittelbare Ziel dieses Handelns mit einem mittelbaren Nutzen verbunden sein.

Um nun den Schritt von den elementaren biologischen Komponenten menschlicher Kommunikation, den natürlichen Gesten und der Infrastruktur geteilter Intentionalität, hin zur kooperativen „(k)onventionellen Kommunikation, wie sie in menschlichen Sprachen verkörpert ist“ (ebd.: 23), machen zu können, bedarf es weiterer entscheidender Komponenten. Dabei handelt es sich um die „Fertigkeiten des kulturellen Lernens und der Nachahmung, um gemeinsam verstandene kommunikative Konventionen und Konstruktionen zu schaffen und weitergeben zu können“ (ebd.: 23): „(A)uf dem Rücken dieser bereits verstandenen Gesten“ (ebd.: 20) werden aus Zeichensprachen stimmliche Sprachen, die „die Natürlichkeit des Zeigens und Gebärdenspiels durch eine gemeinsame Geschichte des sozialen Lernens (von der alle wechselseitig wissen, daß sie gemeinsam ist)“ (ebd.: 20) ersetzen.

Schon bei nicht-menschlichen Hominiden lässt sich etwas aufweisen, was wir strukturell als perlokutionäre Kraft bestimmen können: der intentionale, strategische und flexible Gebrauch bestimmter Signale, um andere zu beeinflussen – A will B durch x zu etwas bewegen. Aber nur weil uns etwas gleich erscheint, handelt es sich noch nicht um das Gleiche. Denn die mit perlokutionärer Kraft vorgetragenen Intentionen der Menschen erfolgen auf Basis der Infrastruktur geteilter Intentionalität, während die der nicht-menschlichen Hominiden auf Basis der Infrastruktur egoistischer, selbstbezogener Intentionalität erfolgen. Zur kooperativen Kommunikation wird intentionale Kommunikation erst, wenn der Aspekt des Helfens, zu dem insbesondere der des selbstlosen Informierens gehört, und der des Teilens hinzutritt. Dies ist jedoch weder bei Vokalisierungen noch bei gestischer Kommunikation von nicht-menschlichen Hominiden der Fall: Vokalisierungen scheinen bei ihnen „hauptsächlich ein individualistischer Ausdruck von Emotionen zu sein und keine Handlungen, die an Empfänger gerichtet sind“ (ebd.: 30) – fühlt sich der, der ruft, nicht selber bedroht, ruft er nicht. Fühlt er sich bedroht, ruft er. Dabei geht der Ruf physikalisch zwar an alle im Umfeld, ist aber an niemanden gerichtet: Die Empfänger informieren sich „durch Lauschen, sind aber nicht Adressaten des Rufers“ (ebd.: 29). Das heißt: Der Ruf erfolgt nicht mit perlokutionäre Kraft, will A doch B nicht durch x zu etwas bewegen.

Bei den Gesten sieht die Sache etwas anders aus. Denn die gestische Kommunikation der Menschenaffen und die sprachliche Kommunikation der Menschen haben „grundlegende funktionale Aspekte gemein (…), nämlich den absichtlichen und flexiblen Gebrauch gelernter Kommunikationssignale“ (ebd.: 32). Tomasello nennt diese Art der Gesten, in Abgrenzung zu genetisch festgelegten „Displays“ (ebd.: 31; dazu gehören spezifische Gesten wie z.B. das Blecken der Zähne), „intentionale Signale“ (ebd.: 31). Sie betreffen „soziale Aktivitäten (…), die emotional weniger aufgeladen und evolutionär weniger dringlich sind“ (ebd.: 31). Zwei funktionale Typen von Gesten werden nun von Tomasello unterschieden:

1. Erstens die ontogenetisch ritualisierten „Intentionsbewegungssignale“ (ebd.: 33), bei denen A versucht, das Verhalten von B „in der Interaktion direkt zu beeinflussen (ebd.: 33; hier liegt eine mit perlokutionärer Kraft vorgetragene Intention vor – aber auf Basis der Infrastruktur egoistischer Kommunikation): A hebt den Arm, um B zu signalisieren, dass er spielen will. Durch mehrfache Wiederholung der Handlung durch A lernt B, was A beabsichtigt: B lernt die Bedeutung. A lernt wiederum, die Antizipation von B vorwegzunehmen: A hebt den Arm – und wartet auf die entsprechende Reaktion von B. Diese Intentionsbewegungen, bei denen es sich fast ausnahmslos um Aufforderungen handelt, sind „ein Teil einer schon vorhandenen, sinnvollen sozialen Interaktion“ (ebd.: 38); ihre „Bedeutung ist schon in den Gesten eingebaut“ (ebd.: 38). Diese Art der Gesten sind einseitig, nicht wechselseitig gerichtete Kommunikationsmittel. Schimpansen sind nicht zum Rollentausch fähig: Macht B gegenüber A die gleiche Geste des Armhebens wie A gegenüber B, so erkennt A die Bedeutung der Geste, die er vorher selber gezeigt hat, nicht – A muss sie genauso erlernen, wie sie zuvor B erlernt hat.

2. Zweitens die „Aufmerksamkeitsfänger“ (ebd.: 32) genannten Gesten. Mit ihnen intendieren Schimpansen (a.) die Aufmerksamkeit eines anderen zu erregen, um damit dessen Aufmerksamkeit auf etwas zu lenken (sehen: „referentielle Intention“ [ebd.: 41]) und (b.), „daß der Empfänger auf bestimmte Weise handelt“ (tun: „soziale Intention“ [ebd.: 41]). Diese „zweistufige intentionale Struktur (stellt eine) echte evolutionäre Neuerung“ (ebd.: 41) dar, erfolgt doch hier die mit perlokutionärer Kraft vorgetragene intentionale Handlung durch einen Gestus, der flexibel für verschiedene soziale Zwecke eingesetzt werden kann. Zudem wird von dem Empfänger eine komplexe geistige Leistung erwartet: B muss imstande sein, von dem, was er sieht, auf das zu schließen, was A will, dass B es tut.

Es sind also nicht die Vokalisierungen der Menschenaffen, die als evolutionärer Vorläufer menschlich-stimmlicher Kommunikation anzusehen sind – es sind vielmehr die Zeigegesten und ihr flexibler Gebrauch, aus denen sich offensichtlich unsere Sprache entwickelt hat: Bei ihnen handelt es sich um Fälle „einer absichtlichen auf einen anderen gerichteten Handlung, in der sich zudem ein gewisses Verständnis davon offenbart, inwiefern die Reaktion des anderen von dessen Fähigkeiten abhängt, Dinge wahrzunehmen und zu intendieren“ (ebd.: 45). Kurz: um ein „Verstehen intentionalen Handelns“ (ebd.: 56).

Menschenaffen erlernen im Umgang mit Menschen keine neuen Vokalisierungen. Hingegen scheinen sie problemlos neue Gesten zu erlernen, die sie jedoch nur gegenüber dem Menschen, nicht gegenüber Artgenossen verwenden. Es handelt sich dabei um spezifische Gesten, die „als leistungsfähige Erweiterung ihrer natürlichen Gesten zur Gewinnung von Aufmerksamkeit“ (ebd.: 46) betrachtet werden können: um das Zeigen. Jedoch ist auch der Gebrauch dieser Zeigegesten im Wesentlichen auf eine spezifische Form der ‚Sprechakte‘ begrenzt: Menschenaffen zeigen weder deklarativ noch informativ, sondern allein auffordernd („imperative Gesten“ [ebd.: 46]). Ebenso wenig können sie „menschliche Zeigegesten (…) verstehen, die den Zweck haben, sie hilfreich über Dinge zu informieren“ (ebd.: 50). Offensichtlich sind sie nicht imstande zu „verstehen, daß der Mensch altruistisch kommuniziert, um ihnen beim Erreichen ihrer Ziele zu helfen“ (ebd.: 53). So wie Menschenaffen einzig „zu ihrem eigenen Gunsten auf etwas“ (ebd.: 65) zeigen, so verstehen sie, vice versa, auch nicht, „daß der andere zu ihren Gunsten auf etwas zeigt“ (ebd.: 65). Hier zeigt sich der entscheidende Unterschied zur Infrastruktur menschlicher Kommunikation: Wenn A in einer Spielsituation B mittels einer Zeigegeste auf etwas hinweist, so weiß B, „daß diese Zeigegeste wahrscheinlich in gewisser Weise für ihr gemeinsames Ziel relevant ist, das Spielzeug zu finden“ (ebd.: 65; Hervorhebung S.O.). Im Gegensatz zu den kommunikativen Akten der Schimpansen zeigt sich hier eine Form der Kommunikation, die „durch stärker kooperative Motive beherrscht wird – also nicht nur durch individuelle Intentionalität, sondern durch geteilte Intentionalität“ (ebd.: 65).

Zeigegesten sind im Rahmen sozialer menschlicher Aktivität innovative Mittel der Kommunikation. Innovativ insofern, als dass sie nicht kodiert, also in ihrem Gebrauch und damit in ihrer Bedeutung festgelegt sind, sondern als nicht-konventionalisierte Zeichen in unterschiedlichen Situationen von verschiedenen Kommunizierenden gegenüber anderen flexibel eingesetzt werden. Und doch sind Menschen, wie sich in unserem Beispiel ‚A zeigt auf ein Fahrrad und lenkt so die Aufmerksamkeit von B darauf‘ eingangs gezeigt hat, in je unterschiedlichen Situationen imstande zu verstehen, was der jeweils andere gemeint/intendiert hat. Wie ist dies nun aber ohne Rückgriff auf einen kodifizierten Zeichenbestand möglich, bei dem die Bedeutungen festgelegt sind? Wie (und warum) gelingt eine Kommunikation „ohne Begleitung durch irgendwelche kodifizierte Sprachen“ (ebd.: 71)?

1.3

Forschungen zur menschlichen Kommunikation bei vorsprachlichen Kleinkindern zeigen, dass sie in der Lage sind, durch „deiktische Gesten“ (Tomasello 2017: 71) intentional „die Aufmerksamkeit eines Empfängers räumlich auf etwas in der unmittelbaren Wahrnehmungsumgebung zu lenken“[7] (ebd.: 70). In ihrer weiteren Entwicklung verwenden Kinder neben diesen dann zunehmend auch „ikonische Gesten“ (ebd.: 73). Mit ihnen wollen sie eine Handlung, eine Beziehung oder einen Gegenstand simulieren und die Aufmerksamkeit „eines Empfängers auf etwas lenken, das sich normalerweise nicht in der unmittelbaren Wahrnehmungsumgebung befindet“ (ebd.: 72, Hervorhebung S.O.). In beiden Fällen ist es die referentielle Intention von A, B dazu zu veranlassen, die soziale Intention des Kommunikationsaktes von A zu erschließen, so dass der Kommunikationsakt nicht nur gelingt (B versteht, was A will), sondern auch erfolgreich ist: B tut das, was A mit seiner Geste beabsichtigt – entsprechend des Grice’schen Grundmodells, dem das Konzept der Infrastruktur geteilter Intentionalität resp. Wir-Intentionalität inhärent ist. Das Verständnis des Gemeinten, das noch nicht sozial festgelegt ist und bei dem noch kein gemeinsamer Hintergrund konstituiert wurde (‚Sprecher-Bedeutung‘ resp. ‚Sprecher-Intention‘), ereignet sich dabei in einem Prozess kooperativ-kommunikativen Handelns:

i. A intendiert, dass B erkennt, dass A mit seiner Äußerung a beabsichtigt.

ii. A intendiert, dass B meine Intention (i.) erkennt.

iii. A intendiert, dass B erkennt, was A mit seiner Äußerung a beabsichtigt, indem B sie Intention von A (ii.) erkennt.

Die Intention von A ist es, dass B Ziel und Absicht, die A mit seiner Äußerung verfolgt, erkennt und sich zu eigen macht (Konstitution eines gemeinsamen Ziels und einer gemeinsamen Absicht). Darüber hinaus ist es die Intention von A, dass im Verlaufe des Prozesses zwischen ihm und B diesbezüglich ein wechselseitig geteiltes Wissen konstituiert wird. Ist dies der Fall, so sind in diesem Prozess kooperativ-kommunikativen Handelns wesentliche Faktoren für den Bestand eines gemeinschaftlichen begrifflichen Hintergrund gegeben: Aufgrund ihrer spezifischen psychologischen Infrastruktur der Intentionalität sind Menschen wie gesagt zu einer Zusammenarbeit fähig, bei der „ein Subjekt im Plural, ein ‚Wir‘ auftritt: gemeinsame Ziele, gemeinsame Absichten, wechselseitiges Wissen, geteilte Überzeugungen“ (ebd.: 17). Das erhöht die Wahrscheinlichkeit dramatisch, dass der von A mit perlokutionärer Kraft erfolgte kommunikative Vorstoß letztlich in einen produktiven kooperativen Dialog zwischen A und B mündet.

Diese Fähigkeit zur Initiation eines solchen Dialogs zeigt sich bei Kleinkindern bereits im Alter von ca. 12 Monaten, wenn sie Zeigegesten verwenden. Also lange „bevor sie in großem Umfang oder überhaupt über eine Sprache verfügen“ (ebd.: 77). Auch mit „komplexen Verwendungen ikonischer und/oder konventionalisierter Gesten (beginnen sie) noch vor dem Spracherwerb“ (ebd.: 81). Selbst Erwachsene gebrauchen noch, obwohl bereits im Besitz vokalisierter Sprache, „in natürlichen Kontexten Zeigegesten zum Großteil ohne Sprache“ (ebd.: 74, Hervorhebung S.O.). Tomasello demonstriert dies an einem simplen, hier paraphrasierten Beispiel:

A sitzt in einer gut besuchten Bar auf dem Trockenen. Da es angesichts der Lautstärke keinen Sinn hat, zu schreien, um noch etwas zu trinken zu bestellen, wartet er ab, bis der Barkeeper B zu ihm rüber schaut – und deutet dann wortlos auf sein leeres Bierglas.

Damit liegt ein vollständiger, nicht-sprachlicher Kommunikationsakt vor, der, wie die Kommunikationsakte, die demgegenüber mit ikonischer Geste[8] vollzogen werden, auch ohne Rekurs auf bestehende Codes problemlos funktioniert. Dass dies möglich ist, liegt an einem einzigartigen Umstand: „Die Menschen kooperieren miteinander auf eine Weise, die wir von keiner anderen Spezies kennen, wobei diese Kooperation Prozesse geteilter Intentionalität beinhaltet“ (ebd.: 83) – Tomasello nennt es „das Kooperationsmodell der menschlichen Kommunikation“ (ebd.: 82).

Was hat es aber nun mit diesem sonderbaren Spezifikum ‚geteilte Intentionalität‘ auf sich, durch das sich der Mensch grundlegend vom Menschenaffen unterscheidet? Anders als diese und alle anderen Lebewesen im Tierreich nutzen Menschen Sprache, stellen mathematische Gleichungen auf, schaffen soziale Institutionen, heiraten, bauen Wolkenkratzer und betätigen sich künstlerisch. Aber was ist es, so fragen sich Michael Tomasello und Malinda Carpenter in ihrem 2007 erschienen Aufsatz ‚Shared intentionality‘, was einzig den Menschen dazu befähigt, diese und noch viele andere Dinge zu tun? Ihre These lautet: Der Mensch entwickelt gar keine neuen kognitiven Kompetenzen („skills“). Vielmehr vollzieht sich in seiner frühkindlichen Phase eine bemerkenswerte ontogenetische Transformation der bereits bei nicht-menschlichen Hominiden bestehenden, ausgeprägt individualistischen, selbstbezogenen Version elementarer kognitiver Skills hin zu einer Version geteilter Intentionalität, die sich allein beim Menschen findet. Dieser Wandel der kognitiven Infrastruktur, der sich im ersten und zweiten Lebensjahr ereignet, betrifft im Wesentlichen vier Aspekte:

1. vom folgenden Blick zur gemeinsamen Aufmerksamkeit

2. von der sozialen Beeinflussung zur kooperativen Kommunikation

3. von der Gruppenaktivität zur Kollaboration

4. vom sozialen Lernen zum instruierten Lernen

Dabei handelt es sich um sozial-kognitive und sozial-motivationale Kompetenzen, die sich auf kollaborative Interaktionen beziehen, bei denen die jeweiligen Kommunikationsteilnehmer Aufmerksamkeit, Hintergrund, Ziele und Pläne miteinander teilen, um ein Problem zu lösen, ein Spiel zu spielen oder auch ein Gespräch zu führen.

Vom folgenden Blick zur gemeinsamen Aufmerksamkeit: Kleinkinder folgen, wie Schimpansen auch, dem Blick anderer, um zu sehen, was diese sehen. Doch ab etwa dem ersten Lebensjahr[9] vollzieht sich bei ihnen ein entscheidender Wandel gegenüber dem Verhalten der Schimpansen: Sie folgen nicht mehr einfach nur dem Blick anderer, um zu sehen, was diese sehen – sie versuchen zudem, Aufmerksamkeit mit ihnen zu teilen: „(F)rom a very early age human infants are motivated to simply share interest and attention with others in a way that our nearest primate relatives are not“ (Tomasello 2007: 122). Diese durch sozial-motivationale Kompetenzen geschaffene gemeinsame Aufmerksamkeit ist aber nicht einfach dadurch gekennzeichnet, dass zwei Personen das gleiche Objekt zur gleichen Zeit wahrnehmen. Es addiert sich, so betonen Tomasello/Carpenter, ein ganz entscheidender Faktor: Nicht nur nehmen die beiden Personen das gleiche Objekt zur gleichen Zeit wahr – sie wissen auch beide, dass sie dies tun. Tomasello nennt diesen Faktor „intersubjective sharing“ (ebd.: 121). Damit wird eine geteilte Basis geschaffen, die von kollaborativen Aktivitäten bis hin zu geteilten Zielen in menschlich-kooperativer Kommunikation alles ermöglicht.

Von der sozialen Beeinflussung zur kooperativen Kommunikation: Um von Menschen zu bekommen, was sie wollen, kommunizieren Hominide intentional in bemerkenswert flexibler Weise mit Gesten. Bei ihrem Versuch, das Verhalten von Menschen in dieser Weise zu beeinflussen, geht es allerdings ausschließlich um selbstbezogene Intentionen: Es handelt sich dabei um Aufforderungen, die allein ihrem selbstbezogenen Interesse dienen. Nutzen hingegen Menschen Zeigegesten, um mit anderen zu kommunizieren, zeigt sich ein anderes Bild – „(t)hese gestures depend fundamentally on skills and motivations of shared intentionality“ (ebd.: 122):

1. Menschlich-intentionale Kommunikation basiert ganz wesentlich „on some kind of shared common ground between communicator and audience“ (ebd.: 122) wie zum Beispiel auf einem gemeinsamen Aufmerksamkeitsrahmen: Spielt ein Erwachsener mit einem Kleinkind ein Versteckspiel und zeigt er in diesem Kontext mit einer Geste ins Blaue hinein, so wird das Kleinkind wahrscheinlich schlussfolgern, dass sich das versteckte Objekt genau dort befindet, wohin der Erwachsene zeigt – eine Abstraktionsleistung, zu der nicht-menschliche Hominide nicht imstande sind. Sie teilen mit dem Menschen nicht den Aufmerksamkeitsrahmen des Versteckspiels. Zudem verstehen sie nicht, dass es sich bei der Zeigegeste um eine relevante Geste im Sinne einer gemeinsamen Handlung handelt.

2. Menschenaffen nutzen zwar Gesten, um andere dazu bringen, das zu tun, was sie wollen, dass sie es tun. Allerdings nicht in dem menschlich-kollaborativen Sinn, dass sie mit anderen Erfahrungen teilen und sie altruistisch helfend über bestimmte Dinge informieren wollen. Im Gegenteil: Zeigegesten der Menschen, die sie zum Beispiel darüber informieren, wo Nahrung verborgen ist, verstehen sie nicht – es ist ihnen im Rahmen ihrer kognitiven Infrastruktur selbstbezogener Intentionalität nicht möglich, den Sinn einer solchen selbstlosen Hilfe zu erkennen. So haben für sie diese Gesten und ihre impliziten kooperativen Motive, obwohl sie ja für sie von beträchtlichem Nutzen wären, keine Bedeutung. Anders die Kleinkinder: Bereits mit circa 9 Monaten nutzen sie Zeigegesten, um auf Basis gemeinsamer Aufmerksamkeit zu interagieren. Mit etwa 12 Monaten gehen sie dazu über, diese Gesten zu nutzen, um andere über Dinge zu informieren, die sie nicht kennen. So teilen sie kooperativ Informationen mit ihnen, auch wenn sie selbst davon gar keinen resp. keinen unmittelbaren Nutzen haben. Aber dieses Teilen von Informationen im Sinne eines altruistischen Helfens hat einen entscheidenden mittelbaren Nutzen: Er stärkt die soziale Bindung, schafft Gemeinsamkeit und konstituiert langfristig Identität – hier zeigt sich die soziale Dimension der spezifisch menschlich-kognitiven Infrastruktur geteilter Intentionalität.

Bemerkenswert ist, darauf weisen Tomasello/Carpenter hin, dass selbst dann, wenn Kleinkinder selbstbezogen intentional handeln, ihre Kommunikation kollaborativ strukturiert ist: „(T)hey are not just trying to get the things but instead to inﬂuence the other’s informational and goal states“ (ebd.: 122; selbst vorsprachliche Kinder kommunizieren in der Weise kooperativ – häufig ist das Teilen von Erfahrungen und Informationen mit anderen sogar ihre einzige kommunikative Motivation). Menschen handeln also stets kollaborativ, weil bei der Entwicklung zum Homo sapiens phylogenetisch eine Transformation grundlegender kognitiver Skills stattgefunden hat, die sich ontogenetisch bei jedem einzelnen Menschen abbildet: ein Wandel von der individualistischen Version dieser Kompetenzen hin zur Version geteilter Intentionalität. So lässt sich vermuten, dass alle menschlich-kommunikativen Akte auf Basis dieser Infrastruktur geteilter Intentionalität erfolgen. Was, sollte es so sein, weitreichende Konsequenzen hätte. Denn es würde bedeuten, dass vom alltäglichen Gespräch über das ‚Gespräch‘ als sozialem Diskurs (Clifford Geertz) und den Texten als intentionale Interventionen in die jeweiligen Diskurse ihrer Zeit (Quentin Skinner) bis hin zu den künstlerischen Äußerungen, also jedwedem künstlerischen Schaffen in allen nur erdenklichen Medien in allen Kulturen und Epochen (auch den zukünftigen), kein im weitesten Sinne kommunikativer Akt des Menschen ohne die Infrastruktur geteilter Intentionalität vorstellbar wäre: Sie ist all unserem kommunikativen Handeln und damit auch allen mit perlokutionärer Kraft (‚A will B durch x zu etwas bewegen‘) vorgetragenen und egoistisch motivierten intentionalen kommunikativen Handlungen unterlegt.

Von der Gruppenaktivität zur Kollaboration: Bei Gruppenaktivitäten wie der Jagd verfolgen nicht-menschliche Hominide ihre individuellen Ziele und reagieren auf das, was andere sehen und tun. Aber sie arbeiten nicht an einem gemeinsamen Ziel im Sinne geteilter Intentionalität koordiniert und kooperativ zusammen. Auch wenn es sich um eine kognitiv hoch komplexe Gruppenaktivität handelt – sie beinhaltet keine Kollaboration in der Weise, dass alle Mitglieder ein geteiltes Ziel haben, auf das sie gemeinsam hinarbeiten und gemeinsam wissen, dass sie darauf hinarbeiten sowie Pläne miteinander teilen, um dieses Ziel zu erreichen. Eine solche Interaktion ist allein dem Menschen vorbehalten. So kooperieren bereits Kleinkinder. Wobei es bei ihnen sogar manchmal den Anschein hat, als würde die Kooperation zum Selbstzweck werden. Ein Beispiel: Im Rahmen eines Spiels nimmt ein Erwachsener ein Spielzeug an sich und gibt es einem Kleinkind. Das nimmt das Spielzeug entgegen. Doch anstatt damit zu spielen, legt es das Kind wieder dorthin zurück, von wo es der Erwachsene genommen hat. Und das nur, damit dieser ihm das Spielzeug noch einmal gibt – eine auf den ersten Blick gänzlich dysfunktional erscheinende, weder ziel- noch nutzenorientierte Wiederholungshandlung, die bei Menschenaffen niemals auftritt. Die reine kollaborative Aktivität bereitet offenbar den Kindern zuweilen fast mehr Freude als das Spielen mit dem Spielzeug (wobei diese reine kollaborative Aktivität durchaus als ein durch das Kind initiiertes neues Spiel aufgefasst werden kann). In diesem Sinne lässt sich sagen, dass die Teilnahme von Menschenaffen bei Gruppenaktivitäten von selbstbezogener Intentionalität, die Teilnahme der Kleinkinder ab einem Alter von etwa einem Jahr hingegen von geteilter Intentionalität in Form geteilter Ziele und Pläne („perhaps underlain by skills of joint attention and cooperative communication“ [Tomasello 2007: 123]) sowie von rein sozialen Motiven wie dem Teilen von Erfahrungen mit anderen geprägt ist.

Vom sozialen Lernen zum instruierten Lernen: Lernen Menschenaffen von anderen, so ist dieses Lernen nicht von einem gezielten Lehren durch einen anderen begleitet. Menschenaffen lernen in der Regel von anderen, indem sie sie bei deren Tun beobachten. Kleinkinder hingegen imitieren nicht nur die Handlungen anderer, um zu lernen, manchmal imitieren sie diese einfach nur deshalb, um dem Anderen zu zeigen, dass sie wissen, wie es geht. Auch machen erwachsene Menschen etwas, was Menschenaffen in dieser spezifischen Form niemals tun: Sie lehren. Das heißt, sie zeigen Kindern intentional, gezielt und geplant Dinge, damit sie diese imitieren. Dabei internalisieren Kinder, was sie lernen – ein Lernvorgang, den Tomasello „instructed learning“ (ebd.: 123) nennt. Ebenfalls im Alter von etwa einem Jahr beginnen Kleinkinder darüber hinaus mit einer Art spielerischem Rollentausch: „(T)hey sometimes observe adult actions directed to them, and then reverse roles and redirect the actions back to the demonstrator, making it clear by looking to the demostrator’s face that they see this as a joint activity“ (ebd.: 123/124). In diesem Verhalten lässt sich eine frühe Phase des Erlernens sozialer Normen erkennen. Ist das menschliche Lernen kollaborativ strukturiert und oft mit der Motivation verbunden, geteilte Zustände anderen mitzuteilen, so gehen Kinder im weiteren Verlauf ihrer Entwicklung dazu über, bestimmte erlernte Handlungen in normative Cluster einzubetten. Ein Phänomen, das sich zum Beispiel beim Spiel mit Puppen beobachten lässt: Kinder stellen mit ihnen gezielt Handlungen nach, die nicht mit den in ihrem sozialen Kontext etablierten sozialen Normen konform gehen. Dann weisen sie die Puppen explizit auf ihr Fehlverhalten hin – und erzwingen so die Norm. „Social norms – even of this relatively trivial type – can only be created by creatures who engage in shared intentionality and collective beliefs“ (ebd.: 124). Das heißt: Nur Wesen, die über die Infrastruktur geteilter Intentionalität verfügen, sind imstande, soziale Normen zu konstituieren. Und nur dann, wenn diese konstituiert wurden, können kulturelle Gruppen auch Werte teilen und geteilte Werte aufrechterhalten, was wiederum langfristig zur Bildung einer Gruppenidentität wie auch, das ist die dunkle Seite der Macht menschlich-kognitiver Skills, zur Ab- und Ausgrenzung anderer beiträgt.

Kompetenzen und Motivationen für geteilte Intentionalität sind demnach, so der gegenwärtige Stand der Forschung, direkter Ausdruck einer biologischen Adaption, die Kleinkinder dazu befähigt, an kulturellen Praktiken und Prozessen um sie herum aktiv teilzunehmen. Dank dieser ontogenetisch angelegten Fähigkeiten und Motivationen sind Menschen zur Konstitution sozialer Normen, kollektiver Annahmen und kultureller Institutionen befähigt. Das Phänomen der geteilten Intentionalität bringt so Biologie und Kultur zusammen. Lässt man es bei der Betrachtung kultureller Aktivitäten, zu denen auch das künstlerische Schaffen gehört, außer acht, so werden sich diese kaum angemessen beschreiben lassen.

1.4

Mit der Transformation der selbstbezogenen Intentionalität zur geteilten Intentionalität wird das Kind zum mit- und umgestaltenden Teil seiner Lebenswelt – der intersubjektiv konstituierten Welt menschlich-kooperativen Verhaltens. Es ist dies die je spezifische Welt codierter Zeichen und konventioneller Bedeutungen im Rahmen einer bestehender Sprachgemeinschaft und Kultur innerhalb einer bestimmten Epoche. In sie wird der junge Mensch hineingeboren, sozialisiert und in einen gemeinsamen begrifflichen Hintergrund, ausgestattet mit gemeinsamen Zielen, gemeinsamen Absichten, wechselseitigem Wissen[10] und geteilten Überzeugungen, eingebettet. Eine Welt, die dadurch gekennzeichnet ist, dass die einen „aufgrund kooperativer Motive andere über bestimmte Dinge absichtlich zu informieren“ (Tomasello 2017: 24) suchen. Allgemeiner formuliert bedeutet dies: Wir versuchen, mit Signalen „andere zu beeinflussen“ (ebd.: 25). Das funktioniert „am natürlichsten und reibungslosesten im Kontext eines wechselseitig vorausgesetzten, gemeinsamen begrifflichen Hintergrunds (1) und wechselseitig vorausgesetzter, kooperativer Kommunikationsmotive (2)“ (ebd.: 17): Menschliche Kommunikation beruht als kooperative Kommunikation eben „auf geteilter Intentionalität“ (ebd.: 18).

In diesem Kontext ereignet sich auch die strukturell erste Verwendung einer Zeigegeste des Kindes als nicht codiertes Zeichen. Ausgehend von diesem singulären Gebrauch lässt sich nun ein hypothetischer Prozess beschreiben, der strukturell nicht wesentlich anders verläuft als der der Etablierung der Gebrauchsweise eines Wortes (also seiner Bedeutung): der Weg von der singulären Verwendung eines Wortes über die dauerhafte Verwendung durch einen, später durch mehrere Teilnehmer (Regularität) bis hin zum kollektiven Gebrauch (Regel). An diesem soziokulturellen Prozess[11] nehmen potentiell alle in einer Sprachgemeinschaft sozialisierten Personen teil. Durch eben diese aktive Teilnahme am Konstitutions- und Wandlungsprozess der Sprache und mit ihr der Bedeutung erwirbt der Muttersprachler eben jenes verständnissichernde kollektive implizite Erfahrungswissen, das ihn die Sprache, mit der er aufwächst, im Ryle’schen Sinne ‚im Schlaf‘ verstehen lässt. Das heißt: Der vom singulären Gebrauch strukturell ausgehende Prozess der Konventionalisierung[12] findet stets in einem sozialen Rahmen statt, in dem zumindest die rudimentäre Form eines codierten Zeichensystems vorliegt[13].

Einen ganz ähnlichen Gedanken hegt der ungarische Kunsthistoriker Arnold Hauser bei seiner soziologischen Deutung der Kunst. Einerseits sei sie, so schreibt er 1973 in seinem Werk Kunst und Gesellschaft, „an den Menschen als Menschen, an das Individuum als einzigartiges, wegen der unwiederholbaren Kombination seiner Anlagen und Neigungen unvergleichliches Wesen gebunden“ (Hauser 1973: 20). Andererseits ist aber das „Individuum selber gewissermaßen ein Produkt des sozialen Bodens“ (ebd.: 39), gibt es kein „von jeder zwischenmenschlichen Bindung und jedem gesellschaftlichen Einfluß freies Individuum“ (ebd.: 55). „Der Einzelne und die Gruppe sind (…) voneinander untrennbar und aufeinander nicht zu reduzieren“ (ebd.: 39). Das soziale Element ist damit konstituierende Komponente „des individuellen schöpferischen Faktors“ (ebd.: 39). Und weil der Mensch eben „ein wesentlich gesellschaftliches Dasein“ (ebd.: 23) im Rahmen zwischenmenschlicher Beziehungen führt, führt auch die Kunst kein isoliertes Dasein „inmitten eines einheitlich zusammenhängenden, praktisch unteilbaren, weltanschaulich zäsurlosen Lebens“ (ebd.: 23). Vielmehr ist sie integraler Bestandteil des „Ganzen des normalen Lebens“ (ebd.: 21; die Idee der Autonomie der Kunst entpuppt sich damit als eine in der Renaissance geborene Chimäre).

Die zwingende Bindung des Kunstschaffenden an die Lebenswelt, in die er hineingeboren ist, muss ihm aber durchaus kein Hindernis, sondern kann ihm höchst produktives Momentum sein: „Der künstlerische Ausdruck vollzieht sich nicht trotz, sondern dank dem Widerstand, auf den er in der Form der Konvention stößt“ (ebd.: 30). Dabei hat man „es stets mit der gegenseitigen Abhängigkeit von zwei in gleichem Maße konstitutiven Prinzipien zu tun“ (ebd.: 32) – es ist einerseits der „subjektive Antrieb zum künstlerischen Schaffen“ (ebd.: 32), der nicht von den gesellschaftlichen Bedingungen zu trennen ist, in dem es sich ereignet. Andererseits ist dieser „subjektive Impuls“ (ebd.: 32) aber nicht aus diesen Bedingungen abzuleiten. „Künstler sind, wie ihre Mitmenschen, soziale Wesen, Produkte und Produzenten der Gesellschaft“ (ebd.: 56; Hervorhebung S.O.). Das heißt: Einerseits sind sie bedingte Wesen – andererseits sind sie es, die die Bedingungen, durch die sie bedingt werden, selber wandeln. Und damit ein Stück weit eben die Bedingungen schaffen, durch die die nächste Generation bedingt wird. Wobei es sich bei diesen Bedingungen, wie bei allen soziokulturellen Phänomenen, um die kollektive, weder intendierte noch geplante „kausale Konsequenz einer Vielzahl individueller intentionaler Handlungen (handelt), die mindestens partiell ähnlichen Intentionen dienen“ (Keller 2014: 93). Individuum und Gesellschaft „machen sich gleichzeitig geltend, entwickeln sich im gleichen Schritt und verändern sich in gegenseitiger Abhängigkeit voneinander“ (Hauser 1973: 55). Aber dabei sind sie doch „bloß zwei Aspekte ein und derselben Erscheinung“ (ebd.: 56), bei der das Individuum „einziger aktiver Vertreter“ (ebd.: 57) ist: Das Individuum ist das einzige Handlungssubjekt und allein imstande, Kunstwerke zu erschaffen. Dabei ist es aber immer „Teil und Organ eines Kollektivs“ (ebd.: 57). Dies ist selbst in Epochen und Kulturen der Fall, die keinen Begriff der Individualität haben: Ein Kollektiv kann nicht „der aktive Träger von Kulturprozessen“ (ebd.: 65) sein, stets liegt „die Funktion des Denkens und Handelns (…) beim Individuum“ (ebd.: 65).

Literatur:

Austin, John L. (1979): Zur Theorie der Sprechakte (How to do things with Words), Stuttgart: Reclam Verlag.

Austin, John L. (1962): How to do things with Words‘, London: Oxford University Press. Online unter: https://pure.mpg.de/rest/items/item_2271128_6/component/file_2271430/content, zuletzt abgerufen am 27.02.2020

Cavell, Stanley (2001): Müssen wir meinen, was wir sagen?, in: Nach der Philosophie, Berlin: Akademie Verlag.

Fuchs, Thomas (2020): Verteidigung des Menschen. Grundfragen einer verkörperten Anthropologie, Frankfurt a. M.: Verlag Suhrkamp.

Gadamer, Hans-Georg (2012): Die Aktualität des Schönen, Stuttgart: Reclam Verlag.

Gallus, Alexander (2019): Die Schule von Cambridge - Wort, Satz und Sieg, Frankfurter Allgemeine Zeitung (https://www.faz.net/aktuell/wissen/geist-soziales/quentin-skinner-und-die-schule-von-cambridge-16480789.html, zuletzt abgerufen am 29.01.2020)

Geertz, Clifford (1987/1983): Dichte Beschreibung. Bemerkungen zu einer deutenden Theorie von Kultur, in: Dichte Beschreibung – Beiträge zum Verstehen kultureller Systeme, Frankfurt a.M.: Suhrkamp Verlag.
Grice, Herbert Paul (1957/1979): Intendieren, Meinen, Bedeuten. in: Georg Meggle (Hrsg.), Handlung Kommunikation Bedeutung, Frankfurt a. M.: Verlag Suhrkamp.

Grice, Herbert Paul (1968/1979): Sprecher-Bedeutung, Satz-Bedeutung, Wort-Bedeutung. in: Georg Meggle (Hrsg.), Handlung Kommunikation Bedeutung, Frankfurt a. M.: Verlag Suhrkamp.

Grice, Herbert Paul (1972-73/1979): Sprecher-Bedeutung und Intentionen. in: Georg Meggle (Hrsg.), Handlung Kommunikation Bedeutung, Frankfurt a. M.: Verlag Suhrkamp.
Grice, Herbert Paul (1975/1979): Logik und Konversation. in: Georg Meggle (Hrsg.), Handlung Kommunikation Bedeutung, Frankfurt a. M.: Verlag Suhrkamp.
Habermas, Jürgen (2009): Es beginnt mit dem Zeigefinger, Rezension in: DIE ZEIT, 10. Dezember 2009, Nr. 51, online unter: https://www.zeit.de/2009/51/Habermas-Tomasello (zuletzt abgerufen am: 28.06.2020).
Hauser, Arnold (1973): Kunst und Gesellschaft, München: C.H.Beck Verlag.
Jocks, Heinz-Norbert (2020): Das digitale Weltmuseum (Interview mit P. Weibel), in: Kunstforum International Bd. 269 08/09.2020.

Keller, Rudi (⁴2014): Sprachwandel, Tübingen: A. Francke Verlag.
Liedtke, Frank (2016): Moderne Pragmatik, Tübingen: Narr Francke Attempto Verlag.
Liedtke, Frank (2019): Sprechhandlung und Aushandlung, in: S. Meier, L. Bülow, F. Liedtke u.a. (Hrsg.), 50 Jahre Speech Acts. Bilanz und Perspektiven (Hg.), Tübingen: Narr Francke Attempto Verlag. (ich zitiere aus einem autorisierten Manuskript des Autors)
Nagel, Thomas (2016): What Is It Like to Be a Bat?/Wie ist es, eine Fledermaus zu sein?, Stuttgart: Reclam Verlag.

Oehm, Stefan (2019a): Entwurf einer grundsätzlichen Erörterung des Begriffs 'Kunst', in: Mythos Magazin (http://www.mythos-magazin.de/erklaerendehermeneutik/so_kunst.htm)
Oehm, Stefan (2019b): Worüber reden wir, wenn wir über Kunst reden?, Würzburg: Verlag Königshausen & Neumann.

Rebentisch, Juliane (³2015): Theorien der Gegenwartskunst, Hamburg: Junius

Verlag.

Ryle, Gilbert (1969): Der Begriff des Geistes, Stuttgart: Reclam Verlag.
Searle, John R. (1983): Sprechakte, Frankfurt a. M.: Verlag Suhrkamp.
Skinner, Quentin (2009a): Über Interpretation, in: Visionen des Politischen, Frankfurt a.M.: Suhrkamp Verlag.
Skinner, Quentin (2009b): Interpretation und das Verstehen von Sprechakten, in: Visionen des Politischen, Frankfurt a.M.: Suhrkamp Verlag.
Tomasello, Michael (⁴2017): Die Ursprünge der menschlichen Kommunikation, Frankfurt a. M.: Suhrkamp Verlag.

Tomasello, Michael/Carpenter, Malinda (2007): Shared intentionality, in: Developmental Science. 10, 2007, S. 121–125
Wiesing, Lambert (²2013): Sehen lassen – Die Praxis des Zeigens, Frankfurt a. M.: Suhrkamp Verlag.

[1] Der Philosoph Lambert Wiesing hat dem Thema ‚Zeigen‘ 2013 ein ungemein erhellendes Buch gewidmet: Sehen lassen. Die Praxis des Zeigens. Darin weist er auf einen ebenso unstrittigen wie, gerade in bildwissenschaftlichen Beiträgen, zumeist unbeachtet bleibenden Aspekt hin: „So wenig wie ein Gehirn denkt, fühlt oder etwas will, so wenig können Bilder, Pfeile, Uhren und Museen selbst etwas zeigen“ (Wiesing 2013: 13). Sie „zeigen nicht von selbst, sondern es sind Menschen, die mit diesen Instrumenten jemandem etwas zeigen – und dass dies so ist, gilt es vielleicht nicht im Alltag, aber doch in geisteswissenschaftlichen Kontexten strikt zu beachten“ (ebd.. 13). Das heißt: „Wenn man beschreiben möchte, wie etwas – zum Beispiel eine Uhr oder ein Gesicht – etwas zeigt, dann gilt es eine Praxis zu beschreiben, eben wie jemand wem was womit zeigt“ (ebd.: 14). Bilder zeigen nicht etwas wie handelnde Subjekte, „sondern immer nur, weil Menschen sie – wie viele andere Dinge auch – zum Zeigen verwenden“ (ebd.: 14). Deshalb stellt sich bei ihnen stets die Frage: „Wer zeigt wem was womit?“ (ebd.: 14). Ein ähnliches Phänomen lässt sich beobachten, wenn zum Beispiel davon die Rede ist, der Staat müsse daran arbeiten, das Aufstiegsversprechen der sozialen Marktwirtschaft einzulösen und Chancengleichheit herstellen: Auch der Staat ist kein handelndes Subjekt. Deshalb kann er unmöglich an irgendetwas arbeiten, das können immer nur Menschen.

[2] Was sich hier auf der Ebene situativer Handlungen ereignet, lässt sich ganz allgemein auf die Ebene sprachlicher Sozialisation übertragen: Ein Epiphänomen der Beteiligung an Prozessen sozialer Interaktion ist das implizite Wissen der Sprecher um die Regeln des in einer Sprachgemeinschaft allgemein akzeptierten Gebrauchs der Worte und damit die Internalisierung der Bedeutung: Die Regeln sind „erworbene Dispositionen“ (Ryle 1969: 48), sie werden uns „zur zweiten Natur“ (ebd.: 49). Und weil sie uns derart zur ‚zweiten Natur‘ geworden sind, können wir sie, anders als die, die nicht mit ihnen aufgewachsen und nicht in sie hineingewachsen sind, „im Schlaf“ (ebd.: 51) – wir verstehen sie ‚blind‘.

[3] Zu nennen wären hier insbesondere Wilfrid Sellars, Raimo Tuomela, Kaarlo Miller, John R. Searle, Michael Bratman, Margaret Gilbert und Frank Liedtke. Wobei es zwischen ihnen und Tomasello einen entscheidenden Unterschied gibt: Jene diskutieren die kollektive Intentionalität auf der situativen Handlungsebene, während Tomasello sie als grundlegende psychologische Infrastruktur kooperativer Kommunikation beschreibt, die jeder Mensch in seiner Ontogenese ausbildet. Mit anderen Worten: Tomasellos Begriff der geteilten resp. Wir-Intentionalität kennzeichnet die dispositionelle Grundverfassung des Menschen und erweist sich damit als conditio sine qua non der geteilten resp. Wir-Intentionalität der Menschen auf der situativen Handlungsebene (wie auch immer Handlungstheoretiker*innen diese nun im Detail beschreiben mögen). „Shared intentionality is a small psychological difference that made a huge difference in human evolution in the way that humans conduct their lives“ (Tomasello 2007: 124). Und weiter: „Skills and motivations for shared intentionality are, in the current account, direct expressions of the biological adaption that enables children to participate in the cultural practices around them“ (ebd.: 124).

[4] Zudem behandeln wir diese vermeintlich real existierenden, kulturell konstruierten Dinge gerne wie rational begabte Handlungssubjekte und nicht als das, was sie sind: unbelebte Entitäten, die prinzipiell nicht selbsttätig agieren oder reagieren können (cf. Wiesing 2013: 13f.). Nicht einmal wie chemische Substanzen oder biologische Organismen. So sprechen wir völlig unbefangen davon, dass die Sprache sich wandelt, der Markt sich selber reguliert, die Kunst die Menschen erfreut oder Bilder uns ansprechen. Nichts davon ist aber der Fall. Bei keinem dieser kulturell konstruierten Dinge handelt es sich um ein Handlungssubjekt. Was aber nicht heißt, dass diese Aussagen nun Fiktionen statt Fakten beschreiben. Letzteres tun sie sehr wohl, jedoch den Sachverhalt in verkürzender und damit in verfälschender Weise darstellend. In der Alltagskommunikation ist dies eine lässliche Sünde; für die Teilnehmer des politischen, juristischen oder auch (kunst)wissenschaftlichen Diskurses hingegen ist höchste Präzision bei der Darstellung des Sachverhalts unerlässlich.

[5] Ob diese Infrastruktur bei bestimmten Entwicklungsstörungen (zum Beispiel der Autismus-Spektrum-Störung), die mit Auffälligkeiten im Sozialverhalten sowie in der sprachlichen und non-verbalen Kommunikation einhergehen, ontologisch gar nicht oder nur rudimentär ausgebildet wird oder ob sie zwar als vollständig ausgebildete Potenz angelegt ist, sie aber, aus welchen Gründen auch immer, bei diesen Störungen nicht oder nicht vollumfänglich aktiviert wird oder werden kann, ist eine Frage, die in der Wissenschaft weiter diskutiert wird (cf. Carpenter, M., Tomasello, M., & Striano, T. [2005]. Role reversal imitation and language in typically-developing infants and children with autism. Infancy, 8, 253–278 oder auch Carpenter, M. [2006]. Instrumental, social, and shared goals and intentions in imitation. In S.J. Rogers & J. Williams [Eds], Imitation and the development of the social mind: Lessons from typical development and autism [pp. 48–70]. New York: Guilford).

[6] Dies hat bereits John R. Searle in seinem sprachphilosophischen Essay Speech Acts (1969) – allerdings kritisch – konstatiert: „Grob gesehen läuft Grices Bestimmung darauf hinaus, daß Bedeutung unter dem Gesichtspunkt der Absicht, einen perlokutionären Akt zu vollziehen, definiert werden muß“ (Searle 1983: 70).

[7] Dieses Phänomen ist kultur- und ethnieninvariant. Was die Vermutung nahelegt, dass es sich um ein universales menschliches Vermögen handelt.

[8] Tomasello gibt hierfür verschiedene sehr eingängige Beispiele. So dieses: Bei einem Fußballspiel verfehlt ein Schuss nur knapp das Tor. Der Trainer macht gegenüber seinem Assistenten mit Daumen und Zeigefinger ein markantes Zeichen. Seine Aussage ist unmissverständlich: Nur so viel hat gefehlt!

[9] Analog dazu führt der Psychiater und Philosoph Thomas Fuchs in seiner Differenzierung des „impliziten Gedächtnis(ses)“ (Fuchs 2020: 283) aus: „Schon im ersten Lebensjahr erlernt der Säugling Muster von sozialen Interaktionen mit anderen, die sich seinem Leibgedächtnis einprägen, lange bevor sich das biographische Gedächtnis im zweiten Lebensjahr entwickelt“ (ebd.: 284). In diesem Fall spricht man von „impliziten Beziehungswissen“ (ebd.: 284), ein Terminus, der durch den amerikanischen Psychoanalytiker Daniel Stern geprägt wurde.

[10] Bei diesem Wissen handelt es sich nicht um ein explizites Wissen, vielleicht noch nicht einmal um ein von den Beteiligten explizierbares Wissen, sondern vielmehr um ein implizites Wissen – die ontogenetisch angelegte, kooperative Annahme, dass das, was bei mir vorliegt, vice versa auch bei dem anderen vorliegt und dass beide ‚annehmen‘, dass sie dies wechselseitig wissen und in dieser Weise über ein geteiltes Wissen verfügen.

[11] Cf. Rudi Keller Sprachwandel (2014). Es handelt sich um eine Erklärung ‚von unten‘. Eine solche „ist den Prinzipien des methodologischen Individualismus verpflichtet. Das heißt: Ausgangspunkt der Erklärung sind handelnde Individuen; nicht Sprachen, Strukturen, Prozesse oder Kollektive“ (Keller 2014: 164). Laut dieser erkenntnistheoretischen Position sind kollektive Phänomene, zu denen auch Recht, Staat, Sitte, Geschmack oder Mode gehören, stets auf Entscheidungen und Handlungen der sie erzeugenden Individuen zurückzuführen.

[12] Dies ist m.E. eine wesentliche Pointe des Grice’schen Grundmodells: Mit der singulären Sprecher-Bedeutung nimmt der Prozess der Bedeutungsetablierung strukturell seinen Anfang (bei diesem Prozess wiederum handelt es sich um eben den, den Keller als ‚Invisible-hand-Prozess‘ beschreibt). Diese Pointe ist es, die nach meinem Dafürhalten Stanley Cavell nicht sieht: Die „Intentionen oder Wünsche eines Individuums (können) ebensowenig die allgemeine Bedeutung eines Wortes hervorbringen, wie sie aus einem Armen einen Reichen (…) machen können“ (Cavell 2001: 69). Doch er lässt sich im expliziten Bezug auf H. Paul Grice noch ein argumentatives Schlupfloch offen: Man kann, so sagt er, „mit einem bestimmten Wort in einer bestimmten Situation nicht eher das eine als das andere meinen [du konntest nicht etwas Beliebiges meinen], ohne dich dabei auf eine [allgemeine] Bedeutung dieses Wortes zu verlassen, die unabhängig von deiner Intention in dieser Situation ist [es sei denn, du ‚gibst‘ dabei dem Wort eine spezielle Bedeutung]“ (ebd.: 69; Hervorhebung S.O.).

[13] Diese Aussage mutet zugegebenermaßen zirkulär an. Es ist dabei jedoch zu bedenken, dass wir es hier mit Prozessen zu tun haben, die nicht nur die ontogenetische Historie eines einzelnen Wesens betreffen, sondern auch die phylogenetische Historie einer ganzen Gattung: des Homo sapiens. Wir reden also nicht über ein singuläres episodales Ereignis, das sich innerhalb eines begrenzten Zeitraums in der Synchronie abspielt – wir reden hier im Grunde über den gesamten Zeitraum der Genese der Menschheit.

Assoziationen

Dienstag, 15. September 2020

Austin, John L. (1979): Zur Theorie der Sprechakte (How to do things with Words), Stuttgart: Reclam Verlag.

Datenschutz