also in einer synthetischen Leistung, in einer Synthesis, die wir in unserer Wahrnehmung unwillkürlich vornehmen.21 Synthesis ist sie in dreierlei Hinsicht: Sie macht etwas überhaupt erst zu ihren Elementen; verbindet diese zu Gruppen; und dies, indem sie zwischen ihnen das Hervorhebungsverhältnis herstellt. Diese drei Momente bilden die einheitliche Leistung unseres Rhythmusreflexes. Ich nenne sie die Synthesis nach dem Hervorhebungsverhältnis, Takt-Synthesis oder, wenn auch im Bewusstsein, dass der menschliche Denkapparat neben ihr noch zahllose andere synthetische Leistungen erbringt, vereinfachend auch nur »die Synthesis«.
Zwei und drei und potenziert
Gut also: Diese synthetische Leistung ist wirksam in unserer Wahrnehmung; aber ist sie deshalb auch für den Taktrhythmus verantwortlich? Noch scheinen ihre Möglichkeiten arg bescheiden: beschränkt auf das eintönige Schlagen eines Metronoms. Doch das täuscht. Was sie leistet, ist zwar tatsächlich nur jene zweiwertige Verbindung von Elementen; trifft diese aber auf reichere Klänge, entwickelt sie eine Virtuosität, dass zuletzt tatsächlich der gesamte Kosmos des Taktrhythmus durch sie aufgespannt und getragen wird.
»Wir können uns im Falle regelmäßig auf einander folgender Gehörsvorstellungen nie davon frei machen, die Eindrücke wenigstens zu Gruppen von je zwei unter einander zu verbinden« – so hatte Dietze den »Einfluss der rhythmischen Gliederung« aufs knappste zusammengefasst.22 Doch er sagt zu Recht: »wenigstens zu Gruppen von je zwei«. Die Zweier-Gruppe, betont/unbetont oder unbetont/betont, ist nur die einfachste und gleichsam grundlegende Form, zu der es unser Reflex bringt. Daraus aber ergeben sich weitere Formen der Gruppenbildung, auch diese strikt gebunden an das zweiwertige Hervorhebungsverhältnis und aus ihm abzuleiten, doch führen sie dazu, dass sich das einfache Abwechseln von betont und unbetont zu einer hohen Komplexität der Formen erhebt.
Gehen wir noch einmal von dem aus, was sich im Experiment mit den identischen, gleichmäßig aufeinander folgenden Tönen feststellen lässt. Üblicherweise zwar hören wir sie in jenen Zweier-Gruppen, doch können sich uns auch Dreier-Gruppen ergeben. Statt des – sich durchwegs leichter einstellenden – EINS-zwei EINS-zwei beziehungsweise eins-ZWEI eins-ZWEI können wir die Töne auch hören, als gingen sie im Dreier-, im Walzertakt: EINS-zwei-drei EINS-zwei-drei. Wenn wir sie so hören, unterscheiden wir die Elemente noch immer nach den lediglich zwei Werten des Hervorhebungsverhältnisses, betont und unbetont, nur tritt zu dem unbetonten Element ein zweites hinzu.
Kann auch ein drittes unbetontes folgen, ein viertes oder ein fünftes? EINS-zwei-drei-vier oder EINS-zwei-drei-vier-fünf und so fort? Nein, das leistet unser Reflex nicht, er ist festgelegt auf jene zwei Möglichkeiten: die Gruppe aus zwei oder die Gruppe aus drei Elementen. Diese Wahl also unterliegt in gewissem Maß unserer Willkür: In den Experimenten – und der Leser mag sie jederzeit an einem geeigneten Klangmaterial nachvollziehen – gelingt es den Probanden in der Regel ohne große Mühe, zwischen beiden Möglichkeiten gleichsam umzuschalten, die Töne entweder in Zweier- oder in Dreier-Gruppen zu hören. Für welche von beiden wir uns entscheiden, ist uns nicht ausschließlich durch unseren Reflex vorgegeben; er jedoch gibt uns die Wahl als solche vor.
Zweier- und Dreier-Gruppe sind seine gleichsam elementaren Gruppen – seine einzigen: In keinem Fall ordnet er zu einem betonten Element mehr als zwei unbetonte oder etwa ein betontes zweites. Das klingt noch immer belanglos, ist aber von großer, großer Bedeutung, denn an nichts wird sich genauer bestimmen lassen, wie die taktrhythmische Synthesis in uns arbeitet. Mit Hilfe dieser beiden Fragen: Wie kann sich aus dem zweiwertigen Hervorhebungsverhältnis eine Gruppe mit drei Elementen ergeben? Und weshalb ist keine elementare Gruppe mit mehr als drei Elementen möglich?
Die Antwort auf die letztere Frage fällt nicht schwer. Die Takt-Synthesis nimmt ihre Gruppenbildung ja nicht bloß je einmal vor, nur an einem Paar von Tönen, um anschließend bei den nächsten sogleich wieder zu pausieren; nein, sie wird fortlaufend über die gesamte Tonreihe hinweg wirksam. Wenn wir eine geeignete Folge von Tönen hören, verbindet sie jeweils alle zu Gruppen und belegt sie auch fortlaufend alle mit ihrer Unterscheidung von hervorgehoben gegen nicht-hervorgehoben. Ich deute es einmal graphisch an. Eine gleichmäßige Folge identischer Töne sähe beispielsweise so aus:
… x x x x x x x x x x …
Und nun wirkt unsere taktrhythmische Synthesis ein und macht daraus – ich kürze die unhandlichen Begriffe »hervorgehoben« und »nicht-hervorgehoben« entsprechend ab –:
… h-n h-n h-n h-n h-n …
Sollte sie nun statt der Zweier-Gruppen solche aus vier Elementen bilden, oder eine andere Gruppe von mehr als drei, müsste sie jeweils mindestens zwei Elemente überspringen und für diese Zeit gleichsam aussetzen:
… h-n x x h-n x x h-n …
Ein solches Aussetzen und Überspringen widerspräche jedoch der reflexhaften Einwirkung der Synthesis, die hier, kontinuierlich einwirkend, vielmehr die fortgesetzte Folge von Zweier-Gruppen ergibt: h-n h-n h-n, oder, ebenso möglich: n-h n- h n- h.
Oder aber von Dreier-Gruppen:
… h-n n h-n n h-n n h- …
Wie aber kommt es dazu? Der Takt-Synthesis widerspricht zwar das Überspringen von zwei Elementen, da sie ja gerade als deren Verbindung arbeitet. Nicht aber widerspricht ihr, aus demselben Grund, das Überspringen von nur einem Element. Eben weil ihr Hervorhebungsverhältnis zweiwertig ist, kann sie es nur auf jeweils zwei Elemente legen, kann sie also nur bei jeweils zwei Elementen wirksam werden. Ein einzelnes Element, wenn aus irgendeinem Grund kein benachbartes Element für die Gruppenbildung zur Verfügung steht, lässt sich folglich, so ganz alleine, nicht mehr zu einer Gruppe verbinden – womit auch? Auf ein einzelnes Element also kann die Synthesis in diesem Sinne nicht zugreifen: Sie muss es tatsächlich überspringen – und es ergibt sich die Dreier-Gruppe:
… h-n x h-n x h-n x …
Wenn diese Erklärung zutrifft, besteht also ein gewisser Unterschied zwischen den beiden nicht betonten Elementen, der auch wahrzunehmen sein müsste: Das eine von ihnen ist Element der Hervorhebungsgruppe h-n, das andere, da es nicht zum Element einer solchen synthetischen Gruppe gemacht wird, steht gewissermaßen für sich. Es wird ganz einfach nicht hervorgehoben, während das andere, als Bestandteil der Gruppe h-n, nicht-hervorgehoben ist im synthetischen Verhältnis zu dem h-Element, nämlich bestimmt ist als dasjenige, gegenüber welchem dies h-Element hervorgehoben wird. Der Unterschied scheint spitzfindig und abstrakt, und doch gehört er in aller Wirklichkeit zum Inhalt – und damit zur Leistung – unserer Wahrnehmung. Den Fall, dass wir Töne in der Dreier-Gruppe hören, hat Woodrow so beschrieben:
Eine Folge, die in deutlichem Walzer-Rhythmus gehört wird, kann zusätzlich zu dem Hauptakzent auf dem ersten Element einen sehr leichten Akzent auf dem dritten Element haben.
Unsere Synthesis setzt erstes und zweites Element ins Hervorhebungsverhältnis: h-n, wir hören das erste betont gegenüber dem zweiten und hören dieses zweite also in gewisser Weise ›gedrückt‹ gegenüber dem ersten. Das dritte Element dagegen wird durch die Synthesis übergangen, also weder betont noch ›gedrückt‹, und damit kann es uns, wenn auch nur sehr leicht, stärker scheinen als das zweite, ›gedrückte‹: EINS-zwei DREI. Man mag sich einmal einen solchen Walzer-Takt still vor sich hinsummen und wird sehr wohl den leichten Unterschied zwischen »zwei« und »DREI« empfinden.
Die Dreier-Gruppe erweist sich auf diese Weise als bedingter Sonderfall der genuinen Zweier-Gruppe, und das erklärt, weshalb sie sich uns nicht ebenso leicht ergibt wie diese. Denn dafür, dass die Synthesis ein Element überspringt, müssen offenkundig besondere Bedingungen eintreten. Eine einfachste nur wäre die, dass wir innerhalb der Wahlmöglichkeit zwischen Zweier- und Dreier-Gruppe diese hören wollen; eine andere, wichtigere Bedingung