download

 

Das Pathfinding-Netz, Teil 5/10           Linz, 10.02.2002  

Autor: MMag. Manfred Gotthalmseder               m.gotthalmseder@eduhi.at

 

(Diese Seite ist urheberrechtlich geschützt. Werden Inhalte und Ideen zitiert,

so müssen Autor, Quelle und Datum der Veröffentlichung angeführt werden.

Bei Übernahme größerer Textstücke ist beim Autor anzufragen).

 

 

Regeln zur zeitlichen Voraussage. 1

Der Unterschied zwischen Vorstellungen und Wahrnehmungen. 1

Zwei Arten zeitlicher Vorankündigung: Mit und ohne Verbindungen. 3

Das Uhr-Modell 4

Das Pendel-Modell 5

Das Sanduhr-Modell 9

Das Reihenfolge-Modell 10

Wann, und womit beginnt die Zeiterfassung?. 13

Wie unterscheiden wir Lautstärke und Tempo?. 17

Die Ordnung auditiver Verbindungen durch das Prinzip der Blockierung. 20

Wie werden Reizverläufe erfasst?. 23

Was gilt mehr, Nähe oder Ähnlichkeit?. 25

Die Verarbeitung der zeitlich kodierten Signale im visuellen System.. 26

Die Verarbeitung zeitlicher Signale des auditiven Systems. 29

Die Verbindung nicht zeitgleicher Signale: 33

Zukunftsvorstellungen versus parallele Welt 35

Regeln zur zeitlichen Voraussage

Der Unterschied zwischen Vorstellungen und Wahrnehmungen

Vorstellungen dienen dem Gehirn vor allem, um planendes Handeln zu ermöglichen. Planendes Handeln ist deshalb so schwer zu erklären, weil es Voraussagen erfordert. David Loye schreibt: „Wer den modus operandi der Voraussage schlüssig erklären kann, würde eine geistige Transformation auslösen, die noch weit über die Konsequenzen der kopernikanischen, newtonschen, einsteinschen und freudschen Revolution hinausreicht.“ (Holler 1996, S.328 Link). Na das sollte ja Motivation genug sein, für die nächsten Seiten!

Ein wesentlicher Unterschied zwischen Vorstellungen und Wahrnehmungen ist, dass in Vorstellungen Zeitabläufe schneller durchdacht werden. Das liegt vor allem daran, dass Wiederholungen nicht seriell gedacht werden müssen. So bleibt unsere Vorstellung von einer Bergwanderung an ein paar markanten Punkten hängen, wo wir das Gehen unterbrachen, für eine Jause, ein Foto, einen Blick über die Landschaft. Wir brauchen uns nicht jeden Schritt nacheinander vorzustellen. „Gehen“ ist uns ja bereits ein Begriff. So ist unsere Vorstellung einer Tageswanderung nach einer Minute abgeschlossen. Die Zeiterwartung ist demgegenüber eine andere Sache. Wir erwarten nicht in einer Minute am Berg zu sein.

Alles Handeln muss im richtigen zeitlichen Ablauf erfolgen, sonst wird das Verhalten fehlschlagen. Das bedeutet die Knoten in unserem Verbindungsnetz müssen zeitsensibel sein. Manche Ereignisse, wie zum Beispiel ein Musikstück, bestehen  sogar nur  aus Zeitmustern. Es sind immer Schalldruckverschiebungen, aber deren zeitliche Frequenzänderungen  ergeben die Melodie.

Zwei Arten zeitlicher Vorankündigung: Mit und ohne Verbindungen

Voraussagen müssen nur dann über Verbindungen getroffen werden, wenn ein Reiz durch einen anderen angekündigt wird. Es gibt aber auch Dinge, die ohne Ankündigungsreiz eintreten. Zum Beispiel das Geräusch eines weinenden Babys, das aus der Nebenwohnung durch die Mauer dringt. Trotzdem kann eine gewisse Erwartungshaltung gegenüber solchen Reizen eingenommen werden, die sich aus der Häufigkeit ihres Auftretens ergibt. Dies könnte durch eine höhere oder niedrigere Grundgereiztheit der Zellen repräsentiert sein. Die Grundgereiztheit des Neurons für Erdbeben ist z.B. höher, wenn unser künstliches Wesen in San Francisco wohnt, als in Österreich.

Dieser Erwartungs-Grundreiz kann auch in einer Frequenz schwanken. Zum Beispiel erwarte ich zu jeder vollen Stunde die Glocke der Kirchturmuhr. Dazu brauche ich kein Vorankündigungssignal von einem anderen Reiz. Die Zeit gibt den Impuls. Damit Neuronen ihren Erwartungsgrundreiz schwanken lassen können, müssen sie an einer inneren Uhr teilhaben oder selbst Zeit speichern, zum Beispiel indem sie Reizlängen aufnehmen wie ein Kondensator den Strom.

Eine Speicherung von Zeit ist eigentlich für jede zeitliche Voraussage notwendig. Es gibt mehrere Möglichkeiten Zeit zu verarbeiten. Aus meiner Sicht liefern aber bestimmte Fähigkeiten und Schwächen des Menschen, was seine Zeiteinschätzung betrifft, ein klares Bild davon, wie das Gehirn Zeit verarbeitet, bzw. wie nicht. Auch der Aufbau des Gehirns liefert einen Hinweis. Ich will im Folgenden darauf näher eingehen.

Das Uhr-Modell

Es ergibt sich die Frage, ob es im Gehirn eine Uhr gibt, die für die allgemeine Verarbeitung zeitgebundener Information zuständig ist. Es scheint, als wäre dies nicht der Fall. Zwar ist bekannt, dass der Hirnstamm, den Schlafrhythmus, den Nahrungsrhythmus, sowie den sexuellen Rhythmus regelt (Kolb, Wishaw 1996, S.41 Link), aber dieses genetische Programm hat wohl wenig mit der Verarbeitung zeitgebundener Information, wie der Musik zu tun.

Eine Uhr besteht aus einem Pendel und einer Zähleinheit, die eine genormte Zeitspanne abzählt. Es gibt keinen Hinweis auf eine Zeiteinheit im Gehirn. Weiters gibt es keinen Hinweis auf einen Zählbeginn. Wo und wann sollte die Uhr zu zählen beginnen?

Gegen eine Uhr spricht auch, dass wir Zeiträume mit zunehmender Länge immer ungenauer erfassen. Wir erinnern uns an Feste, von denen wir nicht einmal mehr das Jahr angeben können, andererseits kann ein Schlagzeuger eine Genauigkeit des Taktes erfassen, der ihm sogar ermöglicht ein gutes und ein schlechte Metronom zu unterscheiden, obwohl die Fehler bei diesen Geräten im Bereich unter tausendstel Sekunden liegen.

Zeitlängen mit zunehmender Präzision zu erfassen umso kleiner sie sind, käme einer logarithmischen Skala gleich. So könnte man Zeitlängen als Teil eines Jahres erfassen, wobei man nur folgende Teile verwendet: 1, ½, 1/3, ¼, 1/6, 1/8, 1/12, 1/16, 1/24, 1/32, 1/48, 1/64, 1/96, 1/128, 1/192, 1/256, 1/512, 1/768, 1/1024… Setzen wir diese Serie 64 Schritte fort, so kommen wir auf ein 6442450944-tel des Jahres, das ist etwa eine 500stel Sekunde. Ich kann mir aber nicht vorstellen, dass jede Zelle über einen 64 Bit Speicher verfügt, um Zeit zu erfassen. Eine Uhr bildet Zeit in Form einer linearen Skala ab, die einen fixen Startpunkt (Christus Geburt) kennt. Wenn das Ziel des Gehirns letztlich darin besteht Zeitlängen durch eine logarithmische Skala zu erfassen, muss es einen direkteren Weg geben, als erst Ereignisse mit Uhrzeit zu versehen, und dann die Abstände umzurechnen. Es wurde auch noch kein Ort im Gehirn gefunden, der einer solchen Umrechnung für alle zeitlichen Ereignisse dienen könnte.

Weiters sprechen die starken Schwankungen des subjektiven Zeitempfindens gegen eine Uhr im Kopf. Wenn wir im Krankenhaus liegen und unter Langeweile und Schmerzen auf den Besuch warten, dauert eine Stunde wesentlich länger, als bei guter Stimmung auf einer Party.

Das Pendel-Modell

Wenn es schon keine ganze Uhr im Kopf gibt, weil kein absolutes Zeitmaß festgelegt werden kann, so ergibt sich die Frage, ob nicht vielleicht jedes einzelne Neuron seine eigene innere Frequenz darstellen kann.

Die Fourieranalyse von Tönen zeigt, dass jedes beliebige Geräusch aus einer Summe verschiedener übereinandergelagerter Sinuskurven dargestellt werden kann, also als Frequenzspektrum (Goldstein 1997, S.201 Link). Auch die Rezeptoren im Ohr liefern an das Gehirn die Töne in einzelne Frequenzen zerlegt. Man hat auch schon versucht, die Fourieranalyse auf die Codierung von Bildern anzuwenden (Fergus u.a. 1987 Link). Allerdings stellt sich die Frage, wozu das gut sein soll.

Tatsächlich erhält das Gehirn die Klanginformtionen vom Ohr in Frequenzen zerlegt (Müsseler, Prinz 2002 Link). Aber es würde auch im auditiven System nirgends hin führen, bei dieser Art der Verarbeitung zu bleiben. An Stelle eines Kanals müsste es nun eine Vielzahl von Kanälen abspeichern. Ein Musikstück zerfällt für unsere Ohren in einzelne Instrumente. Die Wellen des Frequenzspektrums sind aber durchaus nicht einzelnen Instrumenten zuzuordnen, denn jedes Instrument beinhaltet eine ganze Palette von Wellen (Möckel u.a. 1995 Link), die sich mit denen anderer Instrumente decken. Wie sollte die zersplitterte Information wieder in die einzelnen Instrumente getrennt werden? Das Gehirn muss also die Frequenzen, die im Ohr getrennt vorliegen, auf höherer Ebene auch wieder zueinander bringen, um sie zum Beispiel einem Instrument zuzuordnen.

Noch ein weiterer Hinweis spricht dafür, dass die Frequenzanalyse nur eine Funktion der Rezeptoren des Ohres ist, nicht ein Verarbeitungsmechanismus des Gehirns. Sinuswellen, die nur einen Halbton auseinanderliegen, erscheinen als disharmonisch. Überlagern wir hingegen Frequenzen, die jedes zweite oder dritte mal gemeinsam schwingen, so entsteht eine Harmonie.

Im Fall einer Frequenzanalyse müsste sich der Halbton genauso leicht darstellen und abspeichern lassen, wie die Harmonie, denn beides besteht nur aus zwei Wellenlängen. Für das Gehirn sieht das anders aus. Es verarbeitet die Sache wohl so ähnlich wie die folgenden zwei Muster. Das „harmonische“ Muster hat den kleineren Rapport. Das ist entscheidend für die leichte Abspeicherung und Fortsetzung (WSA 2001.04.23 Link).

Disharmonie

 

Harmonie

 

Das bedeutet, das Gehirn will nicht mehrere Wellenlängen parallel denken, sondern es will den Gesamteindruck zu einer Sache vereinen. Dass in höheren Arealen des Hörsystems Zellen auf bestimmte Periodizitäten ansprechen kann als Beweis für dieses Modell gesehen werden (Langer 1998 Link). Das passt auch gut zum genannten Ziel des Gehirns, denn wenn dieses darin besteht, die wahrscheinlichste Zukunft vorauszuahnen, dann ist damit eine Zukunft, und nicht mehrere parallele Zukünfte gemeint. Natürlich laufen in der Welt immer viele Ereignisse parallel ab, aber wir müssen deren Zusammenspiel kennen, um zu wissen, wie wir handeln sollen. Wir dürfen sie nicht als dauerhaft getrennt betrachten, denn unsere Handlungen sollen an die wahrscheinlichste der möglichen Zukünfte ausgerichtet werden.

Ich behandle die Problematik der Frequenzanalsyse hier unter der Überschrift Pendel-Modell. Die Art der Zeitverarbeitung, die ich als „Pendel-Modell“ bezeichne ist ident mit der Idee, Frequenzen als Zeitmessfaktor zu verwenden. Gegen das Pendel-Modell spricht die Begrenztheit der Gültigkeit von Pendeln oder Frequenzen. In der Welt treten viele Dinge in serieller Regelmäßigkeit auf. Zum Beispiel beginnt ein Hund zu bellen, und es lässt sich voraussagen, dass er noch eine Weile weiterbellt. Aber dann hört er auf, und das Pendel im Gehirn produziert einen Voraussagefehler nach dem anderen. Nach einigen solchen Fehlern würde die Voraussage wieder verlernt, und die gesamte Erfahrung gelöscht.

Noch etwas spricht gegen das Pendel-Modell. Was sollte denn diesem Modell zufolge abgespeichert werden, wenn nicht die Pendel-Frequenz? Diese müsste äußerst exakt abgespeichert werden, denn eine geringfügig andere Frequenz würde im Zusammenspiel mit den gleichzeitig ablaufenden restlichen Frequenzen, die abgespeichert werden, nicht mehr übereinstimmen. Die Erfahrung zeigt, dass wir keine exakten Wiederholfrequenzen abspeichern. So ist es zum Beispiel sehr  schwierig, das Tempo eines Musikstückes absolut zu erinnern. Viel leichter ist es hingegen, das Tempo, das der Dirigent einzählt, fortzusetzen.  Genauso verhält es sich mit Frequenzen. Wir können eine bekannte Melodie  relativ zu einem vorgegebenen Ton fortsetzen, aber nur wenige können die Melodie immer in der gleichen Höhe anstimmen, haben also ein absolutes Gehör (WSA 2002.02.21 Link). Durch das Pendel-Modell ist dieses Phänomen nicht zu erklären. Würden Ereignisse in Form von überlagernden Frequenzen (Pendellängen) abgespeichert, so müssten diese Längen exakt vermerkt werden, sonst hat ihre Überlagerung nichts mehr mit dem ursprünglichen Ereignis gemein.

Das Sanduhr-Modell

Anders als das Pendel, erfasst die Sanduhr eine Zeitlänge, nicht eine Frequenz. Die Sanduhr startet nach ihrem Ablaufen also nicht automatisch mit dem nächsten Durchgang. Es wird nicht erwartet, dass der Hund in unserem obigen Beispiel ewig weiterbellt.

Auch muss die Sanduhr durch irgendetwas gestartet werden. Das kann ein anderes Ereignis sein. Wir erleben die Welt als eine Verkettung von Ereignissen, die einander auslösen.

Eine Sanduhr funktioniert nach dem Prinzip des Füllens und Umfüllens. Das ist ein Prinzip, das auch für Neuronen vorstellbar ist. In der Elektronik könnten Kondensatorähnliche Bauteile diese Aufgabe übernehmen. Die Füllmenge der Sanduhr muss nicht vorgegeben sein, sondern könnte von einem davor ablaufenden Ereignis übertragen werden. Das würde erklären, wie wir es vermögen, den Takt fortzusetzen, den der Dirigent vorgibt.

Abgespeichert würden dann nicht direkt die Füllmengen, sondern Relationen bzw. Differenzen von Füllmengen. Es würde durch Verbindungen festgelegt, welche Ereignisse miteinander in Bezug stehen und eine Zusatzinformation, die „Füllmenge“ würde die Zeitlängen der Ereignisse relativ zueinander beschreiben.

Wenn wir nun erkannt haben, dass Füllmengen ausreichen, um Zeit zu repräsentieren, dann ist auch klar, dass wir als Zeiteinheit etwas brauchen, das wir als Füllstoff verwenden können, wie die Sandkörner der Sanduhr. Wenn wir diese Idee auf das Gehirn umlegen, so ist es das Signal des Neurons, das als Fülleinheit dienen kann. Ist ein Neuron für eine gewisse Zeitspanne aktiv, so sendet es innerhalb dieser Zeit eine Anzahl an Impulsen. Sie sind die Füllmenge, die die Zeit repräsentiert, in der das Neuron aktiv war. Tatsächlich gibt es aus der Neurophysiologie einen klaren Hinweis auf dieses Prinzip. Bei der Erforschung der neuronalen Reaktionen im auditiven System, ist man darauf gestossen, dass oft die Zeiteinheit von 0,4 ms auftritt, bzw. deren Vielfache. 0,4 ms ist die maximale Impusrate der Neuronen (Bleeck 1996 Link). 

Nun ergibt sich noch die Frage, wie das Gehirn dann Frequenzen verarbeiten kann, die weit schneller schwingen als dieses Maß. Zur Beantwortung dieser Frage will ich an das Frequenzspektrum erinnern, in das der Schall bereits im Ohr zerlegt wird. Die Tonale Anwendung wird bis auf die Hirnrinde übertragen. Klang präsentiert sich dort also als Klangbild (Ehret 1997, Seifert 2002, S.40 Link). Die Maximale Verarbeitungsrate dieser Klangbilder ist 0,4 ms. Die Bildinformation lässt aber erkennen, welche hohen Frequenzen vorliegen.

Das Reihenfolge-Modell

Das Sanduhr-Modell hat uns darauf gebracht, die Zeitlänge eines Signals als Menge an Impulsen zu definieren, die eine Zelle in dieser Zeit sendet. Woran erkennen wir nun, dass diese Zeitlänge zu Ende ist? Die Zelle sendet irgendwann nicht mehr. Irgendwann wird sie wieder senden. Woran erkennen wir die Lücke dazwischen?

Bei der Verarbeitung visueller Reize, haben wir uns der „Antizellen“ bedient, die immer negativ zu einer Zelle arbeiten. Das heißt sie senden dann, wenn die Zelle pausiert. Wenn wir dort solche Zellen angenommen haben, warum dann nicht auch hier. Die Aktivität der Antizelle repräsentierte dann die Lücke. Ein Rhythmus von Impulsen stellt sich dann als Folge von Signalen und Lücken dar.

Zeitlich Nahes wird bekanntlich eher verbunden, als Entferntes. Also werden auf unterster Ebene erst einmal Verbindungen zwischen benachbarten Impulsen entstehen. Da gibt es zwei Möglichkeiten. Die Folge 1,0, und die Folge 1,1 sowie jeweils deren Negativ (Antizellenreaktion).

Die Folge 1,1 spricht natürlich auch während längerer Signale ständig an. So spricht sie auf vier Impulse zweimal an. Das bedeutet, im Gehirn sollten auch selbstproduzierte Periodizitäten auftreten, die nicht direkt den akustischen Reizen entspechen, sondern die sich aus der maximalen Impusfrequenz erklären. Genau solche wurden gemessen (Langer 1998 Link).

Nun ergibt sich noch die Frage, ob die beiden Einser der Folge 1,1 von der selben Zelle repräsentiert werden, oder von zweien. Grundsätzlich gilt im Gehirn durchaus die Regel, dass ein gleichartiger Stimulus wieder von der selben Zelle repräsentiert wird. Ein Beispiel sind die Balkendetektoren im Sehsystem. Allerdings scheint auch die Regel zu gelten, dass eine Zelle, die gerade erst aktiv war, eine kurze Pause benötigt (Coolspot), bis sie wieder aktiv werden kann (Ehret 1997). Diese Regel haben wir auch benützt, um das Vorwärtsfließen der Kämmsignale zu erklären. Außerdem sind wir davon ausgegangen, dass wenn ein Reiz nicht aufgenommen werden kann, eine neue Verbindung entsteht. Aus all dem ergibt sich folgendes: Der erste Impuls 1 wird von der nächstgelegenen Zelle aufgenommen, die in Zukunft diese 1 repräsentiert. Die zweite 1 kann sie nicht aufnehmen, weil sie eine Pause braucht. Also wird eine weitere Verbindung zu einer Nachbarzelle gegründet. Hält das Signal noch länger an, so ist die erste Zelle wieder aufnahmebereit. Abgesehen davon könnten die 1er Zellen auch zueinander eine Voraussageverbindung aufbauen, weil sie ja oft nacheinander aktiviert sind. Der Widerstand dieser Voraussageverbindung würde die Durchschnittstonlänge repräsentieren.

Zu einer solchen Voraussageverbindung könnte sich auch eine eigene Chunkzelle ausbilden, die dann die Folge 1,1 repräsentiert. Des weiteren könnte eine übergeordnete Einheit die zweimal hintereinander  eintretende Aktivierung dieser Zelle erfassen. Sie erfasst dann die Signallänge 1,1,1,1. Es sind auch übergeordnete Einheiten vorstellbar, die 8, 16, 32 und mehr Impulse erfassen. Das bedeutet, es würden Neuronenverbände entstehen, die sozusagen zählen können. Tatsächlich sind zählende Neuronen im Hörsystem entdeckt worden, wenngleich als Versuchstier der Frosch diente (Standard 2002.09.02 Link). Am Affen hat man Neuronen für das Zählen von Objekten entdeckt (WSA 2002.09.11 Link). 

Das bedeutet, eine einzelne Zelle braucht nicht die Fähigkeit besitzen, eine bestimmte Füllmenge an Signalen zu repräsentieren. Eigentlich hat das hier dargestellte System gar keine neuen Fähigkeiten verlangt. Allein die Erholpause der Zelle hat zur Zeiterfassung geführt. Interessant ist auch, dass automatisch eine logarithmische Skala (2, 4, 8, 16, 32…) entstand. Zeit wird also mit zunehmender Länge immer gröber erfasst. Dies entspricht unserem Denken. 

Was in der räumlichen Verarbeitung die Verbindung ist, ist in der zeitlichen Verarbeitung die Folge bzw. Reihenfolge. Es wird sich zeigen, dass die statistischen Regeln zur Verbindungsfindung und jene zur Speicherung von Folgen viele Parallelen aufweisen. Folgen werden, so wie Verbindungen, sich nur dann dauerhaft im Gehirn verankern können, wenn sie wiederholt auftreten, also öfter bestätigt, als widerlegt werden. Nehmen wir an, das Bellen eines Hundes stellt sich als Folge von Reizen und Lücken dar. Es erfolgen einige Wiederholungen. Dann erfolgt eine längere Lücke, bis zum nächsten Tag, wenn wir den Hund wieder bellen hören. Die längere Lücke wird aber nicht die wiederholt aufgetretenen kurzen Lücken überschreiben, denn sie tritt nur einmal auf, und hat daher weniger Kraft. Anders als beim Pendel-Modell, kann also im Reihenfolge-Modell die Erfahrung im Gehirn durchaus dauerhaft abgespeichert werden.

Wann, und womit beginnt die Zeiterfassung?

Sicher ist, dass auch im Rahmen der Zeiterfassung Verbindungen (Folgen) so lange aufgelöst und durch neue überschrieben werden, so lange sie eine zu geringe Wiederholungsrate besitzen. Das heißt, Voraussagen, die öfter widerlegt werden als bestätigt, zerfallen. Aber gibt es denn Ereignisse (Folgen), die diesen harten Regeln zufolge überhaupt bestehen bleiben können? Welche Folgen könnten das sein? Welche Informationen machen den Anfang?

Um diese Frage zu beantworten, will ich anhand eines kurzen Rückblicks auf das Modell der visuellen Verarbeitung, eine allgemeine Theorie des Erkenntniserwerbs entwickeln, die wir dann auch auf die Zeitverarbeitung übertragen können.

Es scheint so, als lernten Kinder zuerst die Überbegriffe, bevor sie feiner zu differenzieren vermögen. Das bedeutet, wenn sie einmal ein vierbeiniges Tier gesehen haben, erkennen sie das nächste wieder als vierbeiniges Tier. Erst später lernen sie Hund, Katze und Hase zu unterscheiden. In der Kinderzeichnung fand ich ein ideales Beispiel, um zu zeigen, dass das Allgemeine wirklich den Anfang bildet. So könnte man behaupten, in den folgenden Zeichnungen sei erst einmal das Ding, dann der Mensch, dann die Geschlechterdifferenz, dann der Erwachsene Mann und die Frau, und schließlich zwei bestimmte Personen dargestellt. Die Kinderzeichnung schreitet also in ihrer Entwicklung vom Allgemeinen zum Differenzierten. (Aus Fleisch 1988, S.13 Link). Das Kind entwickelt zuerst recht allgemeine Formen, die es in vielen Dingen wiederfindet, wie den Kreis, den Strich, das Quadrat und das Dreieck (Edelmann 1998). Komplexe Formen, wie die mit 12 Jahren gezeichneten Figuren, setzt es aus den bereits bekannten Formen zusammen.

Dass das Wahrnehmungslernen ebenfalls diesen Verlauf nimmt, kann man an bestimmten Beispielen auch noch als Erwachsener erfahren. Wenn nach China übersiedeln, lernen wir die asiatischen Gesichtszüge besser differenzieren. Wenn uns Autos interessieren, lernen wir die Marken besser unterscheiden. Wahrnehmen lernen heißt also differenzieren lernen.

Ich nehme an, Differenzieren beruht im auditiven System, genauso wie im visuellen, auf dem Prinzip, dass Voraussagefehler, an übergeordnete Einheiten weitergegeben werden. Sobald die übergeordneten Einheiten lernen, den unvoraussagbaren Rest vorauszusagen, wird die Wahrnehmung konkreter. Das Differenzierungsvermögen steigt. So können wir z.B. lernen zwischen dem rhythmischen Rauschen der Brandung, dem Brasseln des Regens, oder dem pfeifenden Rauschen des Windes im Wald zu unterscheiden.  Diffuse Eindrücke, wie Rauschen, zeichnen sich ja generell dadurch aus, dass sie Bereiche darstellen, in denen viele erkennende Einheiten ansprechen, aber alle nur in geringem Ausmaß, ohne regelmäßige Wiederholung.

Auch aus der neurophysiologische Erforschung des visuellen Systems kann man erkennen, dass Wahrnehmung vom allgemeinen zum Differenzierten voranschreitet. Die ersten Ebenen, die sich im visuellen System verschalten, dienen der Trennung der Seheindrücke in ganz allgemeine Eigenschaften, in die jeder Seheindruck zerlegt werden kann, wie Farbe, Größe, Bewegung (Hubel 1989) und Flächengliederung. Was einmal gespeichert ist, muss nicht noch einmal gespeichert werden, und ist einmal alles Wiederholte und Allgemeine erfasst, so ist damit ein Rahmen geschaffen, in dem sich auch weniger oft wiederholte, also konkretere Dinge im Gehirn halten können. Sie fußen auf den allgemeinen Eigenschaften, und stellen spezielle Kombinationen solcher dar.

Die genannten Eigenschaften entsprechen den Begriffen, die wir verwenden, um  Seheindrücke sprachlich zu schildern. Deshalb ist anzunehmen, dass sich auch in den untersten Stufen des auditiven Areals Repräsentationen von Eigenschaften finden, mit denen wir Höreindrücke beschreiben. Solche Eigenschaften sind Lautstärke, Tonhöhe (was dem Rapport in Klangwellen entspricht), Tonlänge, Klangfarbe. Mit dem letzten Begriff geht es Analytikern so ähnlich wie mit dem Begriff „Form“ im visuellen Bereich. Er ist unkonkret. Immerhin gibt es die Begriffe hell-dumpf, harmonisch-unharmonisch.

Wie unterscheiden wir Lautstärke und Tempo?

Was die Lautstärke einer auditiven Wahrnehmung betrifft, so ist es wohl die Impulsdichte der Rezeptoren, die diese kennzeichnet. Aber wie unterscheiden wir dieses Impulsdichte von der Frequenz? Dies können wir bei hohen Tönen durch die spezifische Reaktion der Hörrezeptoren des Ohres auf einzelne Frequenzbereiche erklären. Tatsächlich ist dieser spezifische Reaktionsbereich bei tieferen Tönen nicht mehr gegeben (Bleeck 1996 Link).

So stellt sich die Frage dort von neuem: Wie unterscheiden wir eine Serie von Einzelreizen von einem durchgehenden schwachen Reiz? Die Lösung liegt vermutlich in der Antizelle.  Sie ist aktiv, wenn nichts zu hören ist, und gehemmt wenn die Zelle, mit der sie verbunden ist, arbeitet. Leise Töne mögen einen Sinnesrezeptor nur zu einer sehr geringen Impulsrate anregen, aber seine Antizelle reagiert gar nicht, während sie zwischen einzelnen lauten Tönen in der selben Impulsrate „Antiimpulse“ sendet, um die Lücken zu kennzeichnen.

Die Antizelle ist nicht so umfangreich verschalten wie die Zelle, denn Lücken zeichnen sich gegenüber Reizen darin aus, dass sie nur eine einzige Eigenschaft besitzen. Das ist ihre zeitliche Länge. Es gibt keine halben Lücken, denn so lange ein Reiz noch hörbar ist, ist es ein Reiz. Auch hat die Antizelle keine direkte Verbindung zu den Sinnen, sondern wird nur über jene Zelle aktiv, deren ausbleibende Reaktion sie signalisiert. Sie kann aber mit jeder anderen Zelle ganz normal eine Voraussageverbindung eingehen.

 

Was das Erkennen betrifft, so stellt eine andere Lautstärke oder ein anderes Tempo für unser derzeit konzipiertes System ein Problem dar, das anhand einer Musikaufnahme leicht zu beschreiben ist. Stellen wir uns vor, wir spielen die Aufnahme lauter ab. Die Rezeptoren unseres auditiven Systems werden stärker ansprechen, und in der gleichen Zeit mehr Impulse liefern. Nun stellen wir uns vor, wir drehen nicht nur die Lautstärke zurück, sondern reduzieren elektronisch auch die Geschwindigkeit. Die Rezeptoren pulsen nun seltener, weil leiser, aber dafür sind die Töne auch länger geworden, so dass im Endeffekt die gleiche Anzahl an Impulsen bei gleich langen Tönen entsteht.

Das einzige, woran unser System erkennen kann, dass sich etwas verändert hat, ist die Reaktion der Antizellen. Diese reagieren nicht auf Lautstärke, denn Reizlücken haben keine Lautstärke. Sie pulsieren noch mit ihrer üblichen Frequenz. So sind es möglicherweise die Lücken, die die Zeit in das System bringen. Kein Wunder also, dass für unser subjektives Empfinden die Zeit in einer reizarmen Umgebung langsamer fließt. 

Wie erkennen wir eigentlich Melodien, wenn sie in einer anderen Höhe abgespielt werden? Dann sind alle Frequenzen zeitlich verändert. Meine erste Idee dazu, bestand in der Vermutung, dass wir nicht Zeiten und Zeitdifferenzen erfassen, sondern Zeitrelationen. Doch müsste auch diesen eine Zeitmessung zugrunde liegen, denn wovon sollte die Relation gebildet werden. Das Problem mit den Relationen bestünde aber darin, dass wir auf diese Weise überhaupt keine Zeiterinnerung hätten. So ist das ja nicht. Wir stimmen ein Lied durchaus in einem passenden Tempo an. Unserer Zeiterinnerung fehlt es lediglich an Exaktheit. Es gibt noch einen triftigeren Grund, der gegen eine rein relationale Erfassung von Zeit spricht. Anscheinend ist für jedes Baby ein absolutes Hörvermögen erlernbar (WSA 2002.02.21 Link). Also steht die absolute Zeiterfassung am Anfang, und wird verlernt, weil etwas anderes gebraucht wird.

Mein zweiter Lösungsversuch lehnte sich an das Phänomen der Adaption an. Unsere Sinnesorgane adaptieren an Reizstärken, so dass sie immer ein möglichst optimales Ergebnis liefern. Warum sollte unser erkennendes System nicht auch zeitlich adaptieren. Wenn ein Musikstück langsamer gespielt wird, bräuchte das Gehirn lediglich die maximale Impulsrate der Neuronen etwas zu reduzieren, und die Zeitwahrnehmung würde wieder zum selben Ergebnis kommen, wie bei der schneller gespielten Version.

Der neueste, dritte Lösungsversuch besteht darin, zu zeigen, dass wir gar keine eigene Lösung brauchen. Die findet das System von selbst. In der Umwelt kommen Reize nämlich sehr oft in verschiedenen Tempi vor. Oft beschleunigt etwas seine Bewegung, Töne werden höher abgespielt, oder Rhythmen beschleunigen sich. Dabei macht das Gehirn die Erfahrung, dass ähnliche Zeitmuster oft in beschleunigter oder verlangsamter Form aufeinanderfolgen. Zwischen den langsamen und schnelleren Mustern werden sich also ganz automatisch Verbindungen entwickeln, da Aufeinanderfolgendes verbunden wird.

Die Verbindungen werden auf unterster Stufe der Verarbeitung entstehen. Dort befinden sich die Teile, aus denen sich alles Höhere zusammensetzt. Wenn dort die Erfahrung gemacht wird, dass eine Gruppe von kürzeren Teilen mit einer Gruppe von längeren Teilen auf proportionale Weise verbunden werden kann, so ist für alle höheren Einheiten der Wiedererkennungsprozesse  gelöst. Wir erkennen dann Musikstücke auch, wenn sie in einer anderen Höhe und Geschwindigkeit abgespielt werden, wir verlieren das absolute Gehör. Da dann in den höheren Einheiten keine Voraussagefehler mehr entstehen, weil Erkennen geleistet wird, kommt es dort auch zu keinen weiteren unnötigen Verbindungen. Eine Verbindungsflut bleibt aus.

In diesem Modell werden Zeitlängen durch verschiedene Neuronen verkörpert. Es gibt keine einheitliche Uhr. Dieses Konzept hat sich auch ein neues neuronales Modell zur Spracherkennung zueigen gemacht. Mit Erfolg! Es erkennt durch die flexible Zeiterfassung Sprache so gut wie der Mensch (Abo-Ticker 1999.10.04 Link).

Die Ordnung auditiver Verbindungen durch das Prinzip der Blockierung

Wenn wir eine Reizlänge wirklich an der Anzahl der aufeinandergefolgten Impulse erkennen sollten, und sich große Zeitlängen aus kleineren bereits bekannten Zeitlängen zusammenaddieren lassen, dann stehen wir vor dem Problem, dass sich eine große Zeiteinheit auf viele verschiedene Arten aus kleineren zusammensetzen ließe. Stellen sie sich vor, aus wie vielen verschiedenen kleineren Zahlen zum Beispiel eine 8 zusammengesetzt werden kann. Aus 5+3, aus 4+4, aus 6+2, aus 4+2+2 usw. Wie viele Möglichkeiten gibt es dann erst bei wirklich großen Zahlen! Wenn jede dieser Möglichkeiten auch umgesetzt wird, so könnten in diesem Spiel alle Neuronen und Verbindungen des Gehirns verbraucht werden, denn die Zahlenreihe ist unendlich. Was also begrenzt diesen Prozess?

Ist zum Beispiel die Folge 11 vorhanden, und es folgt ein längerer Reiz, z.B. 11111111, dann ist dieser nicht in einem Lernschritt zur Gänze erfassbar, weil ja ein Neuron in diesem Modell immer nur eine Folge aus zwei nacheinander erscheinenden Inputs aufnehmen kann. Es wird also zuerst die zweimal nacheinander erfolgte Aktivierung der 11 an eine neue Chunkzelle weitergegeben (also 1111) und eine Stufe höher wird deren Wiederholung repräsentiert (also 11111111). Dass zwischen der wiederholten Aktivierung der Zellen höherer Verarbeitungsebenen ein größerer zeitlicher Abstand liegt, als bei Zellen der unteren Ebenen ist irrelevant. Eine Zelle spricht in diesem Modell auf die Reihenfolge an, nicht auf die Zeit. Andernfalls stünden wir ja wieder am Anfang unserer Überlegungen, weil dann die Zelle eine innere Uhr bräuchte. Wir haben beschlossen, dass sich die Zeit in diesem Modell indirekt abbildet.

Wichtig ist hier nur folgende Feststellung: Jede andere Form, eine Folge von 8 Reizen darzustellen, z.B. 2+3+3, hätte mehr als zwei Lernschritte benötigt. So kommt die Verschaltungshierarchie 2à4à8 allen anderen zuvor, weil sie schneller erlernt wird. Sie stellt den schnellsten Weg dar, die hohen Zahlen zu erobern. Wenn zum Beispiel die 8er-Serie einmal erlernt ist, und erkannt werden kann, so nehmen diese Neuronen die ankommenden Signale auf. Die Signale gelangen zu keinen anderen Neuronen mehr. Deshalb bilden sich auch keine anderen Verbindungen mehr aus. Das Prinzip besteht also darin, dass der Verbindungszuwachs dadurch begrenzt wird, dass bereits vorhandene Verbindungen die Reize aufnehmen. Damit ist eine Voraussage gelungen, und so werden weitere Lernvorgänge blockiert. Das Prinzip der Blockierung ist durch eine Unzahl an Konditionierungsexperimenten  nachgewiesen (Zimbardo 1995, S.308, Macho 1999, Mischo 2002 Link).

Warum aber wird die Erfassung von Mengen und Zeiten mit deren Länge unexakter? Wie kommt es zu dem Eindruck einer logarithmischen Skala? Die Antwort darauf sollte nun nicht mehr schwer fallen. Wenn sich manche große Zahlen, wie  8, 16, 32, 64 durch sehr wenige Lernschritte erfassen lassen, so werden sie sich zuerst ausbilden, denn sie werden immer auch dann mitaktiviert, wenn eine noch größere Menge auftritt. Solange diese grobe Erfassung genügt, erfolgen keine ausreichend starken Voraussagefehler um weitere Lernvorgänge auszulösen.

Aber was soll das heißen, „keine ausreichend starken Voraussagefehler“? Die Antwort darauf werden wir im Zusammenhang mit der Lenkung der Aufmerksamkeit kennen lernen. Die Aufmerksamkeit wird immer dem stärksten Voraussagefehler zugewandt (wenn nicht gerade etwas trieblich relevantes das System beschäftigt) (Sperling 1998 Link). Dinge sind so lange „genügend“ erfasst, um nicht weiter verarbeitet zu werden, solange es stärkere Anziehungspunkte für die Aufmerksamkeit gibt, deren Verarbeitung im Moment Vorrang hat.

Einen Hinweis auf die bevorzugte Strukturierung von Zeiträumen durch das Prinzip der Verdopplung (2, 4, 8, 16) liefert die Musik. Wir können in den Takt eines Metronoms auch einen halb so langsamen Takt hineinhören. Jeder zweite oder vierte Schlag klingt dann für uns irgendwie anders (Holler 1996, S. 290 Link). Das ist wahrscheinlich deshalb so, weil eben jeder zweite Schlag von einer übergeordneteren Zelle erfasst wird.

Um Voraussagefehler dem jeweils stärksten Reiz zuwenden zu können, müssen diese moduliert signalisiert werden, also schwächer oder stärker, je nach Entsprechung. Nur so ist eine Aufmerksamkeitslenkung zum stärksten Voraussagefehler hin vorstellbar. So darf zum Beispiel ein langes Ereignis, das durch einen extrem kurzen Aussetzer unterbrochen wird, nicht sofort in zwei Ereignisse zerfallen, es soll weiterhin als langes Ereignis erkannt werden. In der Palette möglicher Repräsentationen siegt dann jene, die am stärksten anspricht. Wenn die Unterbrechung zu lange anhält, erkennen wir zwei getrennte Ereignisse, wenn sie kurz ist, betrachten wir es als ein Ereignis mit einer Störung.

Wie werden Reizverläufe erfasst?

Reize treten nicht immer schlagartig ein, dauern an, und enden dann schlagartig, sondern es kommt oft zu fließenden Übergängen. Nehmen wir zum Beispiel das Geräusch eines herannahenden Autos. Es fährt vorbei und verschwindet wieder. Wie kann ein solcher Verlauf als ein einziger Reiz erkannt werden?

Die Lösung für dieses Problem habe ich mir vom visuellen System abgeschaut. Wie erkennen wir Grauverläufe? Ganz einfach. Wir vergleichen benachbarte Bildpunkte und erfassen deren Unterschied. Nehmen wir an, die folgende Grafik stellt einen auf und abschwellenden Sirenenton dar. Ich überblende nun das Verlaufsmuster mit seiner negativen Kopie. Die Bilder werden einander aufheben, so dass Grau entsteht. Nun verschiebe ich die Kopie um ein wenig, so dass zeitlich benachbarte Einheiten übereinander zu liegen kommen. Das Ergebnis ist darunter abgebildet.

 

 

Die Verläufe stellen sich nun als durchgehende helle und dunkle Flächen dar. Je stärker der Verlauf, desto mehr wird sich die Tönung vom Durchschnittsgrau entfernen. Je nach Verlaufsrichtung (abnehmende oder zunehmende Amplitude) wird in der Überblendung ein heller, oder ein dunkler Grauton entstehen. Der Grauton kennzeichnet also die Verlaufsstärke, und die Verlaufsrichtung. Dadurch, dass der Verlauf auf dieser Verarbeitungsebene eine durchgehende Reizstärke (Grauton) erhält, kann er im Weiteren als ein einheitlicher Reiz verarbeitet werden. Auf die Zeit umgelegt bedeutet das, dass auf dieser Verarbeitungsebene ein zeitlich anhaltendes Signal entsteht, dessen Länge und Stärke den Verlauf darstellt. Ich bin überzeugt, dass man im Hörsystem einmal Neuronen entdecken wird, die auf Verläufe ansprechen, weil es sich um eine elementare Eigenschaft von Klängen handelt.

Was gilt mehr, Nähe oder Ähnlichkeit?

Konditionierungsexperimente zeigen nicht nur, dass Nahes eher in Verbindung gebracht wird als Entferntes, sondern auch dass Ähnliches eher verbunden wird als Unähnliches. In einem neuronalen Netz ist ein Reiz im elementarsten Fall einfach ein gereiztes Neuron. Ähnlichkeit wäre damit nur durch die Reizintensität darstellbar. Aber was ist Intensität anderes als Impulse pro Zeiteinheit? (In einem elektrischen System sind es Elektronen pro Zeit). Die Frage reduziert sich also auf jene: Was soll eher verbunden werden, etwas, das eine ähnliche Signalhäufigkeit besitzt, oder etwas das zeitlich und räumlich nahe zueinander auftritt?

Aber diese Frage stellt sich nicht, den die Signalhäufigkeit ist ja in unserem System schon immer mit einberechnet. Der bayesianischen Regel zufolge wird etwas nur dann eine starke Verbindung zueinander aufbauen, wenn es möglichst immer zusammen auftritt. Wenn Reiz A doppelt so häufig auftritt wie B, so kann die Verbindung gar nicht all zu stark sein.

Signalhäufigkeit ist also aus statistischer Hinsicht gleichzusetzen mit Signalstärke. Diese hat Einfluss auf die Stärke einer Verbindung, während die Nähe von Signalen dafür entscheidend ist, ob ein Zusammenhang erkannt wird, ob also eine Verbindung überhaupt zustandekommt. Ist nämlich die Entfernung zu groß, so werden nähere Ereignisse der entfernteren Verbindung den Weg verstellen.

Wenn Signalstärke und Signalhäufigkeit eigentlich ein und die selbe Sache sind, dann kann auch beides im Gehirn durch das gleiche neuronale Verhalten dargestellt werden, nämlich durch die Impulsdichte. Nicht mit Reizstärken, sondern mit Impulsdichten zu arbeiten, hat einen Vorteil. Wenn ein Signal über viele Zellen hinweg weitergegeben wird, so könnte sich seine Signalstärke dabei leicht wandeln, wie die Kopie einer Kopie einer Kopie einer analogen Musikaufnahme. Wird Signalstärke hingegen durch Impulsdichte repräsentiert, so kann nichts passieren. Die Impulsanzahl bleibt gleich, egal wie oft sie kopiert wurde. Dass das Gehirn mit Impulsdichten arbeitet, ist bekannt (Hubel 1989, S.23 Link). Aber die Impulsdichte hat auch einen Nachteil. Sie braucht Zeit. Deshalb muss das Gehirn alle schnellen Abläufe, wie die Unterscheidung von Schallfrequenzen, oder die Wahrnehmung von Bewegungskonturen eigenen Rezeptoren überlassen.

Trotz dieser Überlegungen ist es natürlich immer noch praktischer, sich bei der Konzeption eines Hirnmodells, Signale als unterschiedlich stark vorzustellen, weil Impulsdichte kein so anschaulicher Bergriff ist.

Die Verarbeitung der zeitlich kodierten Signale im visuellen System

Nach all diesen allgemeinen Überlegungen zur zeitlichen Verarbeitung können wir uns nun ein Bild davon machen, wie die zeitlich codierten Signale des visuellen Systems weiter verarbeitet werden. Wenn die visuellen Signale innerhalb der Objektflächen durch den „Abziehbildsignalfluss“ zusammengeflossen sind, entsteht, je nach Objektgröße, ein anhaltendes Signal unterschiedlicher Dauer. Der Ort an dem dieses Signal entsteht, ist das Objektzentrum. Es ist also irgendein Ort innerhalb der Bildfläche. An diesem Ort beginnt nun die Zeitverarbeitung. Das heißt, dass sich auf dieser Verarbeitungsebene Neuronen bilden werden, die auf Reizfolgen reagieren.

Nun ergibt sich die Frage, warum, den Bayesianischen Regeln zufolge, nicht schon auf allen anderen Schichten des visuellen Systems zeitaktive Neuronen entstanden sind. Meine Antwort ist einfach: Solange ein Neuronen eine Verbindung zu einem gleichzeitig aktiven Nachbarneuron eingehen kann, wird es diese Verbindung vorziehen, denn Gleichzeitigkeit bedeutet maximale zeitliche Nähe. Es gilt ja, dass zeitlich Nahes eher verbunden wird, als zeitlich Entferntes.

Aber zurück zu der Ebene, wo die zeitcodierten Signale ankommen. Vordringliche Aufgabe wird es nun sein, deren Länge, und damit die Objektgröße zu erfassen. Dazu wird sich eine Hierarchie an Reizfolgen entwickeln, wie wir sie weiter oben besprochen haben. Das heißt, Zweierserien werden sich zu Vierer, diese zu 16er Serien verbinden. In der zehnten Stufe kann somit ein Neuron entstehen, das bereits eine Reizlänge von 1024 Impulsen repräsentiert. Eine Gruppe aus 10 Neuronen ist also fähig eine breite Palette von Zeiteinheiten zu erkennen. Solche Gruppen werden sich überall auf der Ebene ausbilden, denn verschiedene visuelle Eindrücke werden zu immer neuen Objektzentren führen.

Wenn nun ein zeitcodiertes Signal auf dieser Ebene ankommt, und sich in seinem Umfeld bereits ein Neuron befindet, das seine Reizlänge repräsentiert, und somit sein Signal aufzunehmen vermag, dann wird das Signal an dieses Neuron weitergeben. Das bedeutet, dass sich in dieser Gegend kein zweites Neuron der selben Sorte ausbilden kann. Die Neuronengruppen treten also in eine räumliche Konkurrenz, bis jede einen Fleck für sich erobert hat.

Auf einer übergeordneten Ebene können die zeitaktiven Neuronen ihrerseits Verbindungen zueinander aufbauen. Diese Verbindungen repräsentieren den Abstand der erkannten Objektflächen oder Konturlängen zueinander. Auch dieser Abstand wird sich nicht durch dauerhafte Verbindungen darstellen lassen, weil er, genau wie die Objektformen, durch ständig neue Wahrnehmungen überschrieben wird. Aber der Abstand kann seinerseits über den Abziehbildsignalfluss zeitcodiert werden, und durch eine weitere zeitaktive Ebene können diese Abstände dauerhaft erfasst werden.

Die Neuronen dieser Ebenen sprechen nun bereits auf Signalfolgen an, die extrem selten vorkommen, Signalfolgen, die nur bei einer ganz bestimmten räumlichen Konstellation visueller Reize auftreten. Wenn ein Neuron nur auf einen bestimmten Reiz anspricht, der ansonsten im Alltag nicht vorkommt, dann wird es auch nicht ständig in einer neuen Situation aktiv. Es wird nicht ständig neue Verbindungen eingehen. Das heißt seine Verschaltung wird nicht durch ständig neue Situationen überschrieben. Es erkennt also dauerhaft eine bestimmte räumliche Konstellation. Es erkennt zum Beispiel ein Objekt. Man kann auch sagen, es repräsentiert dieses Objekt im Gehirn.

Damit haben wir eine Vorstellung, wie visuelle Objekterkennung ablaufen kann. Aber ein kleines Problem ist noch offen: Wenn visuelle Eindrücke durch Zeitcodierung erkannt werden, so braucht es natürlich auch eine kurze Zeit, um sie auszuwerten. Für diesen kurzen Zeitraum muss das Bild fixiert werden. Dies geschieht einerseits durch die sakkadische Augenbewegung (Berhill und Stark 1987, S.68 Link), andererseits dadurch, dass das Bild zwischengespeichert wird (Wesenick u.a. 2000 Link).  Wenn sie jemanden bitten, mit seinen Augen einen Kreis zu ziehen, so können sie beobachten, dass sein Auge nicht regelmäßig im Kreis wandert, sondern dazwischen immer wieder stecken bleibt und sprunghaft weiterwandert. Wir fixieren einen Eindruck, bis er ausgewertet ist, und wandern dann erst mit dem Auge weiter.

Die Verarbeitung zeitlicher Signale des auditiven Systems

Was das Hören betrifft, so ist im Gegensatz zum Auge, eine fließende Verarbeitung der Information möglich. Die Verarbeitung beruht auf den selben Regeln, wie die Auswertung der zeitcodierten visuellen Information, sonst wäre es nicht möglich, dass ein neugeborener Hamster, dem der Sehnerv ins auditive System verpflanzt wird, mit diesem System normal zu sehen lernt (Frost 2000 Link), oder Gehörlose obere Areale des Hörsystems für andere Leistungen nutzen (Abo-Ticker 1999.01.14 Link). Die Grundstruktur der Gehirnrinde muss im Ursprung durchgehend von ähnlicher Beschaffenheit sein. Welche Verschaltungen sich dann ausbilden, hängt davon ab, was darauf an Reizen projiziert wird, und wie diese Projektion aussieht.

Einen weiteren Hinweis für die Ähnlichkeit der Verarbeitung auditiver und visueller Information, liefern die Gestaltprinzipien, also die bekannten Regeln, nach denen sich etwas zu einer Gestalt abgrenzen lässt, wie Nähe, Ähnlichkeit, gute Fortsetzung usw. Sie gelten für beide Informationsarten gleich (Holle 1997, Purwins u.a.2000 Link).

Was das Hören betrifft, so sind im Ohr eigene Rezeptoren für verschiedene Frequenzbereiche nebeneinander angeordnet. Genau auf diese Weise projizieren sie ihre Reize über Zwischenstationen auf die Gehirnrinde (Kolb 1996, S.96 Link).

Benachbarte Frequenzbereiche sind in Alltagsgeräuschen meist gleichzeitig aktiv, also werden sich stabile nachbarschaftliche Verbindungen bilden. Diese bilden dann einen Voraussagefehler, wenn die gleichzeitige Aktivierung nicht gegeben ist. So wird eine erste Verarbeitung entstehen, die einer besseren Trennung der Frequenzbereiche dient (ähnlich der ersten Verarbeitung im visuellen System, die dem Hervorheben von Konturen dient). So viel ist auch schon Neurophysiologisch bestätigt (Kolb 1996, S.96/97 Link).

Nun ergibt sich die Frage, ob ein Neuron auch in der Frequenz senden muss, die es repräsentiert. Die Antwort ist, dass es das weder muss, noch kann. Wir hören nämlich Frequenzen weit oberhalb der maximalen Impulsrate von Neuronen. Das Neuron repräsentiert die Frequenz durch seine Position am Projektionsfeld. Das genügt. Die Stärke (Impulsrate) mit der ein solches Neuron sendet, repräsentiert nicht die Frequenz, sondern steht diese für die Lautstärke, in der die Frequenz relativ zu anderen Frequenzen gerade zu hören ist. Ziel des auditiven Systems ist es nun, an den zeitlichen Auftrittsmustern verschiedener Frequenzen zu erkennen, was gerade zu hören ist.

Tatsächlich sind für das Gehirn die Auftrittsmuster relevant, und nicht das vorhandene Frequenzspektrum (Ehret 1997 Link). Ein Ton eines natürlichen Instrumentes besteht nicht aus einer Frequenz, sondern aus einem Spektrum an Frequenzen. Wir erkennen aber das Muster, in dem diese Frequenzen ein gemeinsames Vielfaches bilden. Dieses Wiederholungsmuster macht die Tonhöhe aus (Langer 1998 Link). Der Ton braucht nicht einmal eine Frequenz zu enthalten, die der Tonhöhe entspricht. Es zählt nur die Wiederholungsrate des Gesamtmusters aller enthaltenen Frequenzen. (Bleeck 1996, Seifert 2002, S.47 Link)

Dass im Ohr Töne in ein Frequenzspektrum zerlegt werden, stellt lediglich einen Weg dar, Information verarbeiten zu können, die schneller ablaufen, als die maximale Frequenzrate der Neuronen. Die zeitlich nicht mehr repräsentierbare Information wird dem Gehirn als ein Reaktionsbild geliefert, also örtlich codiert. Das ist der Sinn des Frequenzspektrums. Das Spektrum wird auf einen länglichen Bereich der Gehirnrinde projiziert. Was damit weiter geschieht ist erst heute, durch einen neuen Fluoreszenzfarbstoff erforschbar, der bei geöffneter Schädeldecke auf die Gehirnoberfläche aufgetragen, dann aufleuchtet, wenn ein nahegelegenes Neuron elektrisch aktiv wird (Ehret 1997 Link).

Es ist nun anzunehmen, dass als erstes erfasst wird, wann und wie lange ein Neuron an einem Platz des Spektrums aktiv ist. Es werden sich Neuronen bilden, die für bestimmte Signallängen stehen. Außerdem werden sich solche Neuronen mit benachbarten Neuronen verschalten, die die Länge eines anderen Frequenzbereiches erfassen, weil diese oft zeitgleich aktiv sein werden. Es wird zu Voraussagefehlern kommen, wenn diese nicht zeitgleich aktiv sind.

Diese Voraussagefehler werden ihrerseits Verbindungen eingehen, und somit spezifischere Signalkonstellationen verkörpern. Ich bin der Überzeugung, dass auf diese Weise eine Hierarchie an Verschaltungen entsteht, deren höhere Einheiten auf ganz bestimmte Reizkonstellationen ansprechen, zum Beispiel auf einen Klavierton. Um einen Klang zu erkennen, ist nicht nur ein Frequenzmuster notwendig, sondern vor allem spielt auch der Klangverlauf eine Rolle (Müsseler,  Prinz 2002 Link)

Für all das bedarf es aus meiner Sicht keiner eigenen Regeln. Die Lösungen, die ich weiter oben zum Erkennen von Reizlängen und Reizfolgen erarbeitet habe, sollten auch hier greifen. Das Problem der Zeiterfassung ist eine Sache, die sowohl im Bereich kleiner Zeiträume, wie der Töne eines Musikstückes, wie auch an größeren Zeiträumen abgehandelt werden kann, wie es die Ereignisfolgen eines gewöhnlichen Wochentages sind. Man wird immer auf die selben Regeln stoßen, weil Statistik in allen Größenbereichen gilt!

Egal in welchem Zeitmaßstab wir denken, es wird immer Zeitfolgen geben, die häufiger auftreten, und die sich deshalb als erste in einer dauerhaften Form abbilden können, also nicht mehr überschrieben werden. Aber im Zeitmaß eines Tages ist dies leichter zu erkennen, als in den Zeitmaßstäben der Musik.

So können wir an Kleinkindern beobachten, dass sie schon früh bestimmte Tagesabläufe kennenlernen, wie zum Beispiel der Wechsel von Tag und Nacht, das Erscheinen der Mutter, wenn man schreit, das Ritual des Windelwechselns, des Fläschchenwärmens, des Schlafengehens, des Kinderwagenfahrens. Ich kann mich erinnern, wie verwundert sich mein kleiner Neffe beschwert hat, als er des Nachts mit dem Kinderwagen am Flughafen herumgeführt wurde. Das war nicht das übliche Ritual!

Die Verbindung nicht zeitgleicher Signale:

Genaugenommen ist ein wichtiges Problem der Zeitverbindungen noch ungelöst geblieben. Zeitverbindungen bestehen zwischen Zellen, die nicht zeitgleich, sondern nacheinander aktiv werden. Aber wie lange sollen sie verbindungsfähig bleiben? Antwort: Sie dürfen eigentlich immer Verbindungen empfangen und durch ein Rücklaufsignal beantworten. Die Bayesianische Statistik verhindert ohnehin, dass Verbindungen zwischen Zellen bestehen bleiben, die ungleich häufig aktiv sind. Bei Zellen die gleich häufig aktiv sind, ergibt sich automatisch immer eine Verbindung zum zeitlich nächstliegenden Reiz.

Kämmsignale zur Verbindungsfindung sollten Zellen prinzipiell nur zum Zeitpunkt ihrer Aktivierung aussenden, und zwar nur dann, wenn es noch keine Verbindung gibt, an die das Signal weitergegeben werden kann. Das garantiert die Funktionstüchtigkeit des Prinzips der Blockierung. Die Kämmsignale breiten sich aus, bis sie eine verbindungsfähige Zelle finden. Im Fall eines Zeitunterschiedes liegt die Aktivierung der Zelle schon zurück. Sie hat daher jetzt kein Kämmsignal ausgesandt. Deshalb stelle ich mir vor, dass das Rücklaufsignal nicht in der Verbindungsmitte entsteht (wie bei zeitgleichen Verbindungen), sondern direkt bei der kontaktierten Zelle (grün).

Es entsteht also eine einseitige Verbindung, die den Zeitpfeil repräsentiert. (Zeit verläuft nur in eine Richtung. Das nennt man den „Zeitpfeil“). Es ist ja auch nicht relevant, die zeitliche Mitte eines Tones in einem Musikstück vorauszusagen, sondern seinen Anfang. Zeitketten werden in der Erinnerung von Anfang zum Ende durchflossen. Deshalb ist es gut, wenn bereits die Verknüpfungsbildung von Zeitketten etwas anderes abläuft. Die Chunkzelle entsteht dann einfach dort, wo später die Vorstellungssignale starten sollen. Vorstellungen und die damit verbundenen Voraussagefehler sind natürlich auch in der zeitlichen Verarbeitung das wichtigste Prinzip zur Organisation von Information. Zellen erwarten ein Signal. Trifft dieses nicht wie erwartet ein, so senden sie eine Fehlermeldung nach oben (positiver Voraussagefehler), wo neue Chunkzellen, und neue Verschaltungen entstehen.

Zukunftsvorstellungen versus parallele Welt

Wenn wir Erfahrungen machen, so entstehen Verbindungen im Gehirn. Diese Verbindungen sind nicht nur räumlicher, sondern, wie wir jetzt gesehen haben, auch zeitlicher Natur. Genau diese Verbindungen werden auch aktiv, wenn wir die Dinge noch einmal in der Vorstellung oder im Traum durchleben (Abo-Ticker 2001.07.10, WSA 2000.11.16, Stickgold u.a. 2002 Link). Aber Vorstellungen müssen noch in zwei Arten getrennt werden, denn es gibt zwei Arten von Zeiterwartung. Einerseits die Reihenfolge. Sie ist die einzige Art der Zeiterwartung, die auch in unseren Vorstellungen noch vorhanden ist. Wir können uns in unseren Vorstellungen an den Zeitpunkt begeben, wo das Haus, das wir gerade zu bauen begonnen haben, schon fertig ist. Aber auch in unseren Vorstellungen gibt es eine Reihenfolge von Dingen, die nacheinander eintreten. Wir wissen durchaus, dass vor der Fertigstellung der Reihe nach viele Dinge erledigt werden müssen, und dass wir noch viele Nächte unruhig schlafen werden, bevor es soweit ist.

Die andere Art der Zeiterwartung bezeichne ich als die „parallele Welt“. Um Wahrnehmungen im richtigen Tempo vorauszusagen, und Handlungen im richtigen Tempo durchführen zu können, braucht es eine Signalweitergabe mit an die Welt angepasstem Tempo, also eine langsamere Art von Signal, als jenes unserer Vorstellungen, ein Signal, das die Zeitabläufe so langsam durchwandert, wie sie in der Welt vorkommen. Es ist nicht so, dass wir alles was wir erleben wirklich wahrnehmen. Das Meiste ist vorausgesagt, und wird nurmehr teilweise nachgeprüft. Es gibt lustige Experimente, die dies zeigen. So wurden zum Beispiel Leute auf der Strasse nach dem Weg gefragt. Während der Unterhaltung marschierten Träger mit einer Tür zwischen den Gesprächspartnern durch. Dabei wurde der Wegsuchende durch eine andere Person ersetzt. Die Veränderung blieb meist unbemerkt  (WSA 2000.11.17 Link). Nicht nur Zeitpunkt, sondern auch Ort sind Basis unserer Voraussagen. Voraussagen entstehen über die assoziativen Verknüpfungen. So wurde Personen ein Dia einer Küchensituation gezeigt, und danach kurzzeitig Bilder eines Brotes, eines Briefkastens oder einer Trommel angeboten. Das Brot konnte durch das vorherige Dia deutlich besser erkannt werden (Goldstein 1997,  S.24 Link)

Wenn die Voraussagen in Echtzeit stattfinden, spreche ich von Zeiterwartung. Da Zeitlängen durch eine Hierarchie von Verschaltungen auf die maximale Impulsrate der Neuronen zurückgeführt werden, muss das Erwartungssignal auch diese gesamte Verschaltungshierarchie durchwandern. Wir erwarten zum Beispiel, dass ein Auto eine gewisse Zeit braucht um vorbeizufahren. Der Unterschied zwischen der Zeiterwartung, die parallel  zur wahrgenommenen Welt stattfindet und Vorstellungen ist der, dass in Vorstellungen wiederholte Reize nicht wiederholt gedacht werden müssen. Wenn wir daran denken auf einen Berg zu gehen, so brauchen wir nicht jeden Schritt zu denken.

Ich nehme an, dass das Gehirn zu jedem Reiz auch seine häufig auftretende Länge zu erfassen versucht. Nehmen wir als Wahrnehmungsbeispiel ein Motorengeräusch. Wir erwarten, dass es von einem vorbeifahrenden Auto stammt, und nach einer kurzen Zeit wieder ausklingt. Reißt es schlagartig ab, so entspricht dies einer Unterschreitung unserer Erwartung, die im Gehirn zu einem hemmenden Signal führen könnte. Demgegenüber könnte sich eine Überschreitung der Zeiterwartung, wenn also das Motorgeräusch nicht ausklingt, durch ein aktivierendes Signal vermitteln.

Höhere Verarbeitungsebenen können dann Voraussagen für diese besonderen Wahrnehmungen bilden. So könnten wir zum Beispiel bereits erahnen, dass dieses anhaltende Motorengeräusch vom Wagen des Briefträgers kommt, der jeden Morgen eine Weile stehen bleibt, ohne den Motor abzustellen. Wir haben also zuerst die Ausnahme erkannt, und dann über den größeren Zusammenhang eines vollen Tages, wieder eine Regel entdeckt, die die Ausnahme voraussagbar macht. So funktioniert Erkenntniserwerb.

Wenn das Gehirn alle vorangekündigten Reize unterdrückt, gehen dann nicht all diese Daten verloren? Nein, was hier stattfindet ist lediglich Datenkomprimierung. Wenn jemand an der Autobahn wohnt, hört er die Fahrgeräusche irgendwann kaum mehr. Seine Aufmerksamkeit widmet sich weniger voraussagbaren Ereignissen, die in seinem Leben von Bedeutung sein können. Das Autobahngeräusch gehört offensichtlich nicht dazu.

Es sind immer die Veränderungen in der Umwelt, oder auch in uns, die uns zum Handeln zwingen. Deshalb ist das Gehirn so organisiert, dass es das Gleichbleibende ausfiltert, und die Veränderung signalisiert. Wir brauchen während einer Tageswanderung nicht unentwegt daran erinnert werden, dass Licht da ist. Wichtig ist nur, dass es uns auffällt, wenn es zu dämmern beginnt. Diese Veränderung ist ein Signal für uns, uns einen Unterschlupf zu suchen.