Konzept zur Simulation der assoziativen Konditionierung in Raum und Zeit
Dass diese Kurzfassung unter dem Titel „assoziative Konditionierung“ verfasst wurde, soll den Leser nicht irritieren. Es handelt sich um das gleiche Modell wie in der Langversion, nur von einer anderen Seite aufgefädelt.
Versuchsaufbau zur assoziativen Konditionierung
Inwiefern simulieren heutige Netze assoziatives Lernen?
Assoziationen, Zukunftsvorstellung und Junktorenlogik
Gefühle, Emotionen und Reflexe
Die assoziative Konditionierung. Wie sie in allen vier Dimensionen zu simulieren ist.
Wann wird eine Verbindung mit welcher Stärke erlernt?
Wie und warum neue Erfahrungen stärker gewichtet werden sollten.
Erweiterung der Bayes Regeln durch das Gesetz der zeitlichen Nähe
Über die statistische Gleichbehandlung von Raum und Zeit
Die Darstellung negativer Relationen durch hemmende Verbindungen
Wie das Netz Zeit erfassen kann
Lernblockierung auf der Zeitachse: Bloß die notwendigen Verbindungen dürfen entstehen.
Was gilt mehr, Nähe oder Ähnlichkeit?
Reale Zeiterwartung und vorauseilende Vorstellung
Zielgerichtetes (bewusstes) Lernen
Netzarchitektur eines chunkbildenden Bayes-Netzes
Übertragung der Regeln des Zukunftsbaums auf die Konditionierung
Die kreisförmige Signalausbreitung
Wahrnehmung und Lernen; Vorübergehende und bleibende Verbindungen
Der Signalfluss in Und-Verbindungen
Die Umwandlung von Formen in Zeitfolgen
Die notwendige Unterscheidung von Reizstärke und Reizanzahl
Neurophysiologischer Beweise für das Modell
Wie das assoziative Netz den Körper kontolliert
Der Auslöser des Lerntriebes bzw. ästhetischen Triebes:
Handlungen zur Erreichung zukünftiger Bedürfnisse
Rauschen als Grundlage kreativer Lernprozesse und des Bewegungslernens
Fernziel: Ein indiviuelles, eigenwilliges aber doch erziehbares künstliches Wesen
Das Motiv für eine Förderung dieses Forschungsbereiches liegt in der Überzeugung des privaten Geldgebers, dass ohne die vollständige Simulation assoziativen Lernens, keine wesentlichen Fortschritte in der KI-Forschung zu erwarten sind. Der Betrag soll Aufmerksamkeit auf diese Wissenslücke lenken. Freilich kann er nur als Startbudget dienen. Die Größe des Vorhabens wird weitere öffentliche Fördergelder bedingen. Die Ansuchen dafür sollen zur gegebenen Zeit gemeinsam mit den Forschern verfasst werden, soweit sich ein Team für diese Thematik aufstellen lässt.
Es mag so aussehen, als sei Pawlows Konditionierung ein alter Hut, als sei dieses Wissen schon längst in neuronalen Netzen inkludiert. Lernen dieser Art dient der Voraussage (auf Glocke folgt Futter), und ist daher durch Bayes-Netze simuliert. Aber diese beschäftigen sich nur mit einer Dimension, meistens mit der Zeitachse. Doch natürliche Gehirne verbinden auch zeitgleiche, aber räumlich getrennte Reize. Die drei Dimensionen des Raums bedingen eigene Regeln der Reiz-Reiz Verbindung, die bisher kein Netztyp erfüllt.
In der assoziativen Konditionierung geht es also nicht um Reiz-Reaktionslernen, sondern um die Verkettung von Reizen zu Vorstellungen. Wenn wir die Rezeptoren des Auges als einzelne Reize verstehen, und die Lernregeln auf sie anwenden, so führt uns dies zu einem tieferen Verständnis der Verschaltung der Netzhaut und des visuellen Systems, im weiteren lässt sich ein neues Modell der Objekterkennung ableiten und zeigen, wie sich die Welt in unserem Gehirn durch Lernen zu repräsentieren beginnt.
Assoziative Konditionierung fußt auf vier einfachen Regeln:
1. Zeitlich und räumlich nahe Reize werden verbunden, wenn sie sich oft wiederholen
2. Jede erlernte Verbindung stellt als Einheit wieder einen Reiz (Chunk) dar. So ergibt Glocke+Futter+Fressen das Chunk „Fütterung“. Fütterung kann nun mit anderen Ereignissen zum Chunk „Tagesablauf“ verbunden werden.
3. Durch die erlernten Verbindungen fließen Signale und aktivieren Reize, schon bevor sie wahrgenommen werden. Das wollen wir „Voraussage“ nennen.
4. Lernblockierung führt dazu, dass solange durch einen Ankündigungsreiz eine richtige Voraussage ausgelöst wurde, kein anderer Ankündigungsreiz für die selbige Voraussage erlernt wird. D.h. es erfolgt kein Lernprozess, wo er nicht nötig ist. (ökonomisches Prinzip).
Diese einfachen Grundregeln werfen viele Fragen auf. So zeigt das durch Konditionierungsexperimente bestätigte Gesetz der Lernblockierung, dass möglichst nur eine Verbindung pro Voraussage entsteht. Weitere Lernverbindungen kommen nur hinzu, wenn die Voraussage manchmal nicht zutrifft. Aber wenn wir uns beim ersten Lernprozess auf eine Verbindung beschränken wollen, welche wählen wir, wenn ein zeitlich näherer und ein anderer räumlich näherer Ankündigungsreiz zur Wahl stehen? Wenn die eine Zukunft zeitlich näher, die andere aber öfter wiederholt erschien, was werden wir vermuten, dass eintritt? Wenn eine Voraussage oft widerlegt wird, ab wann verfällt sie? Wenn ein Chunk gebraucht wird, das eine Verbindung (z.B. Fütterung) repräsentiert, wo befindet sich dieses im neuronalen Netz, wenn es Lernverbindungen mit beliebigen anderen Chunks eingehen können soll? Wenn das Futter nur auf zwei kurz hintereinander folgende Glockenschläge folgt, wie sieht ein Netz aus, das diese Zeitfolge erkennt?
All diese Fragen konnten bereits analytisch beantwortet werden, und für viele gibt es nur eine mögliche Lösung. Empirische Hinweise zeigen dann, dass auch das Gehirn diese Lösung einschlagen musste, denn sein Ziel besteht in der Voraussage der Welt, um planend (kontrolliert) Handeln zu können. Verbindungen sollen keine ungefähren Zukunftsannahmen repräsentieren, sondern die optimalen mathematischen Wahrscheinlichkeiten bei gegebener begrenzter Erfahrung. Daher gibt es in dem Modell keine beliebig eingestellten Parameter, wie in gängigen neuronalen Netzen. Die konkreten Aktionsregeln, nach denen die Neuronen Signale verarbeiten, damit die Verbindungen der assoziativen Konditionierung entstehen, sind analytisch entschlüsselt. Das Netz bedarf keiner Verbindungsflut, sondern die Neuronen müssen lediglich mit ihren Nachbarn verbundenen sein. Entfernte Lernverbindungen werden über Pfade (Ketten) von durchlaufenen Neuronen aufgebaut.
Die Herausforderung einer technischen Verwirklichung
Dem Projekt liegt also ein Entwurf eines neuronalen Netzes zugrunde, das assoziative Konditionierung leisten kann. In diesem Netz werden Signale nicht nur in der vertikalen Achse, (von Ebene zu Ebene), sondern auch horizontal weitergegeben, und auch die Zeit spielt eine Rolle, welche Signale zum Durchlaufen von Netzbereichen benötigen. Der Entwurf beschreibt also ein hochgradig parallel arbeitendes System, das um zwei Dimensionen reicher ist, als heutige künstliche neurale Netze. Die technische Umsetzung der assoziativen Konditionierung scheiterte bisher am Versuch, die Anforderungen auf das serielle (eindimensionale) System „Computer“ zu übertragen. In Echtzeit wird dies wohl nur durch eine eigene Hardware möglich sein, in der die hochgradige Parallelität verwirklicht ist. Einem solch aufwendigen Projekt müssen aber Computersimulationen vorangehen, um die Leistung des Netzes abschätzen zu können.
Durch die innere Repräsentation der Welt, die aus der assoziativen Konditionierung hervorgeht, sollte ein solches System auch körperliche Sollwertabweichungen (Bedürfnisse) vorherahnen. Es ist dann ein kleiner Schritt, an diese Vorahnung das passende Verhalten zu binden, und so eine künstliche Intelligenz zu entwickeln, die planend zu Denken lernt, ohne programmiert werden zu müssen. Sie kann erzogen werden, und an ihre innere Welt können sich Lautfolgen binden, womit die Grundlage zum Erwerb echten, auf Vorstellungen basierenden Sprachverständnisses gelegt ist.
Zunächst ist klarzustellen, dass Pawlows Konditionierungsexperiment kein Reiz-Reaktions-Lernen auslöste, sondern dass eine Reiz-Reiz-Verbindung (Stimulus-Stimulus-Connection) entstand. Dies konnte durch folgenden dreigeteilten Versuch zur assoziativen Konditionierung bewiesen werden:
1. Zunächst wird dem Hund öfter am Tag Rotlicht und Glocke zusammen angeboten.
2. Dann folgt die klassische Konditionierung mit Glocke und Futter.
3. Dann wird Rotlicht angeboten, und siehe da, der Hund speichelt, obwohl Rotlicht noch nie zusammen mit Futter auftrat.
Der Grund für dieses seltsame Verhalten liegt in der entstandenen Assoziationskette Rotlicht-Glocke-Futter. Über diese Assoziationskette entstehen im Hund Vorstellungen, die ihn letztlich dazu führen an Futter zu denken. Der Versuch zeigt, dass höhere Lebewesen auch dann Reizabläufe, wie Rotlicht+Glocke erlernen, wenn noch keine Verstärkung (Futter) folgt. Wozu? Weil wiederholt auftretende Reizverkettungen auch in Zukunft auftreten werden. So lässt sich über diese Ketten Zukunft vorausahnen, und Verhalten sinnvoll darauf abstimmen.
Welches Netz kommt der assoziativen Konditionierung am nächsten?
1. Klassische Mehrschichtennetze kommen nicht ohne Lehrer aus, sie lernen nicht ohne Verstärkung (Futter), und simulieren somit nicht die assoziative Konditionierung.
2. EinKohonen-Netz verbindet Bildpunkte zu Bildern, und ordnet ähnlichen Bildern ein ähnliches Feld auf der Output-Ebene zu. Es hat aber mit assoziativer Konditionierung wenig zu tun, da es kein Schichtenmodell ist, das erlernte Verbindungen, sogenannte Chunks, weiter zu verbinden vermag. Es baut Objekte somit auch nicht aus Teilen (Chunks) zusammen, ja Bilder werden erst gar nicht in Objekt und Hintergrund zerlegt. Solche Netze leisten Bilderkennung, lösen aber nicht das Problem der Objekterkennung, denn ein Objekt wird mit anderem Hintergrund, oder anderer Position im Bild, nicht mehr erkannt.
3. Bayes-Netze simulieren assoziatives Lernen, aber sie arbeiten eindimensional insofern, als sie immer nur zwei Reize miteinander verbinden, und somit nur zeitliche Voraussageketten zu erzeugen vermögen. Die drei Raumdimensionen bleiben unbeachtet. Immerhin sind die Formeln zur Verbindungsstärke der Wahrscheinlichkeitsrechnung von Bayes entlehnt, taugen also für Zukunftsprognosen, und entsprechen somit der assoziativen Konditionierung.
Die Konzeption eines Netzes zur assoziativen Konditionierung teilt sich in folgende Abschnitte: Zunächst gilt es zu verstehen, wie erlernte Verbindungen für Zukunftsvorstellungen genützt werden. Damit wird die umfassende Bedeutung der assoziativen Konditionierung verständlich.
Das sollte motivieren, um den ersten Schritt zu einer technischen Realisierung zu tun, der darin besteht das Bayes Netz zu einem Netz zu erweitern, das auch den zeitlichen Abstand zwischen Reizfolgen vorausahnen kann. Der zweite Schritt besteht darin, die Verknüpfung von bereits erlernten Einheiten (Chunks) zu ermöglichen. Wir bleiben dabei vorerst auf der Zeitachse. Der dritte Schritt besteht nun notwendiger Weise in dem einbringen der Raumdimensionen. Damit werden Reaktionsbilder verarbeitbar, wie sie auf der Gehirnoberfläche projiziert werden. Daraus wird letztlich ein Modell echter Objekterkennung (nicht bloß Bilderkennung) hervorgehen, ein Modell zur Verinnerlichung der Welt. Zuletzt wollen wir noch ein wenig über das Themenfeld der assoziativen Konditionierung hinausblicken, und klären, wie assoziativ erlernte Vorstellungen plandendes Handeln bewirken.
Gehen wir von dem oben beschriebenen Versuch zur assoziativen Konditionierung aus, so ist darin eine Verbindung von Rotlicht-Glocke-Futter entstanden. Über solche Verbindungen laufen unsere Vorstellungen voraus in die Zukunft. Aber oft sind mehrere Zukunftsprognosen möglich. Wenn wir in Ägypten morgens aus dem Haus gehen, wird meist die Sonne scheinen, manchmal wird es bewölkt sein, selten regnen, aber so gut wie nie wird es schneien. Die Vorstellung dessen, was uns erwartet, wird sich in vier Möglichkeiten unterschiedlicher Wahrscheinlichkeit verzweigen, die wir zu unterschiedlichen Zeiten erlernt haben, die aber alle auf die gleiche vorhergehende Aktion, nämlich dem Öffnen der Türe, folgen. Die Wahrscheinlichkeit was passiert ist durch die Verbindungsstärke repräsentiert. Die Verzweigung ist eine Entweder-Oder Verzweigung, denn es kann nur entweder das eine, oder das andere eintreten. Je nachdem was eintritt, werden wir unterschiedliche Pläne haben unseren Tag fortzusetzen. Bei Regen gehen wir vermutlich nicht schwimmen.
Während wir das Wetter nicht ändern können, gibt es andere Verzweigungen möglicher Zukünfte, die wir beeinflussen können. Wir könnten entscheiden, ob wir in die Arbeit gehen, oder zu Hause bleiben. Je nachdem erwartet uns eine andere Zukunft, mit anderen Folgen. Wir können so oder auch so Handeln, deswegen spricht man von Oder-Auch-Verzweigung.
Neben den zwei Arten der Verzweigung enthalten unsere Zukunftsvorstellungen drei Arten von Verbindungen. Die gewöhnliche Wenn-Dann Verbindung. Wenn die Glocke läutet, dann kommt das Futter. Die Nicht-Verbindung. Wenn es regnet wird die Wäsche nicht trocken und schließlich die Und-Verbindung.
Und-Verbindungen sind für die Prognose gleichzeitiger räumlicher Anordnungen zuständig. Ein Mensch besteht aus Körper und Kopf und Armen und Beinen. Wenn er halb verdeckt erscheint, ist sein restlicher Körper durch Und-Verbindungen voraussagbar. Und-Verbindungen haben keine vorgegebene Richtung. Ihnen fehlt der Zeitpfeil. So kann vom Kopf auf die Vorhandenheit des Körpers genauso geschlossen werden, wie umgekehrt. Nehmen wir an, ich erinnere mich, einen Kuchen vor zwei Stunden ins Backrohr gegeben zu haben. Es lässt sich vorausahnen, dass er nun schwarz ist und verbrannt riecht. Wie sieht die Verbindung aus? Handelt es sich um eine Verzweigung in zwei Voraussagen? Die Antwort ist nein, denn Zeitgleiches wird nach dem Gesetz zeitlicher Nähe stärker verbunden. Deshalb entsteht zuerst das Chunk „Verbrannter Kuchen“ aus den zugehörigen verbundenen Wahrnehmungen, und erst in einem weiteren Lernschritt wird dieses Chunk mit den zeitlichen Wenn-Dann-Verbindungen versehen, die zu dem verbrannten Kuchen führten, und ihn nun voraussagbar machen.
Zusammenfassend kommen wir also auf:
Und (Konjunktion),
Wenn-Dann (Implikation),
Nicht (Exklusion),
Oderauch (Disjunktion),
Entweder-oder (Kontrajunktion).
Die Aussagenlogik, der man als Philosophiestudent nicht entgeht, besagt, dass alle logischen Aussagen aus diesen fünf Verbindungen dargestellt werden können (Liessmann 1992, S.45). Einfaches logisches Denken kommt also durch assoziative Konditionierung in ein neuronales Netz, z.B. wenn wir lernen: „Männer haben tiefe Stimmen.“ „Herr Mayer ist ein Mann.“ Dann werden wir eine tiefe Stimme erwarten. Das nennt man Syllogismus, und es ist nichts anderes, als das RotlichtàGlockeàFutter-Experiment mit anderen Objekten.
Stellen wir uns das Gehirn nun als ein Netz von assoziativen Verbindungen vor, und stellen wir uns der Einfachheit halber vor, jedes Neuron in diesem Netz wäre ein Gestaltbegriff. Nun wird einer der Gestaltbegriffe durch die Wahrnehmung aktiviert, wie die Glocke bei Pawlow. Durch die assoziativen Verbindungen laufen Signale in die möglichen vorgestellten Zukünfte, also von der Glocke zum Futter, oder zu anderen Gestaltbegriffen, die in der Vergangenheit oft auf Glocke gefolgt sind. An den Entweder-Oder und Oder-Auch Verzweigungen muss sich das Signal aufteilen. So verliert es immer weiter an Stärke, und verebbt schließlich. Wenn wir uns das ursprüngliche Signal als Stamm eines Baumes veranschaulichen, und die Dicke des Stammes als Ausgangssignalstärke, so verliert sich die Signalstärke mit der Zahl an Verzweigungen, was durch die abnehmende Dicke der Äste dargestellt werden kann. Deshalb nenne ich den, durch Zukunftsvorstellungen voraktivierten Bereich des Netzes, den Zukunftsbaum.
Im Netz gibt es nicht nur Wahrnehmungserinnerungen, sondern auch Erinnerungen an Bedürfnisbefriedigungen (Sollwerterreichung). Auch diese Erinnerungen werden voraktiviert. Sie haben eine besondere Eigenschaft. Sie können motivieren. Sie sind die Äpfel auf unserem Baum. Die Motivationsaktivität fließt den Zukunftsbaum zurück in die Gegenwart. Wo die Motivationssignale von verschiedenen Zweigen zusammenlaufen siegt bei Oder-Auch Verbindungen das stärkere. Es siegt die vorgestellte Handlung, die uns zum stärksten Motiv, zum größten Apfel führt. Starke Signale können aber auch durch dünne (unwahrscheinliche) Verbindungen geschwächt werden, was einem großen, aber kaum zu erreichenden Apfel entspricht. Bei Entweder-Oder-Verbindungen wird ein Durchschnitt der Signale gebildet, denn wir können in diesem Fall nicht beurteilen welche der zwei Möglichen Zukünfte auf uns zukommt, also rechnen wir mit einem Durchschnittsgewinn.
Letztlich kommt nur ein Signal bis zur Gegenwart zurück. Der Weg den es beschritt, ist jene Vorstellung, die uns bewusst wird. Deshalb haben wir in unserem Bewusstsein immer nur einen Vorstellungsinhalt zu einem Zeitpunkt. Das ist sinnvoll, denn wir können mit unserem Handeln ja auch nur eine Zukunft anstreben, das heißt wir können den Arm nur entweder senken oder heben, nicht beides zugleich. Doch ist es uns möglich sehr schnell Pläne zu ändern, und in unseren Vorstellungen zu switchen.
Auf der Unterscheidung zwischen Wahrnehmung und Vorstellung fußt nun auch die Unterscheidung zwischen Gefühlen und Emotionen. Beides sind Handlungsmotive, aber Gefühle entspringen der gegenwärtigen Differenz körperlicher Soll- und Messwerte. Sie unterscheiden sich vor allem darin von Wahrnehmungen, dass ihnen Sollwerte zugrunde liegen. Emotionen hingegen fußen auf Zukunftsvorstellungen von Gefühlen. Liebe ist die komplexeste Emotion, weil sie auf der Vorstellung einer gemeinsamen Zukunft mit einem Partner beruht, und auf der Vielfalt an Gefühlen, die diese Zukunft bringen kann.
Die Vorstellung des Gefühls beim Arzt eine Spritze zu bekommen, führt zu der einfachen Emotion „Angst“. Der gegenwärtige Schmerz beim Stich mit einer Nadel ist hingegen ein Gefühl. Eine Handlung, die direkt einem Gefühl entspringt, wie das Zurückzucken vor der Nadel, nennen wir Reflex. Geplantes Verhalten fußt nicht auf Reflexen, sondern ist durch Emotionen motiviert, also durch Zukunftsvorstellungen von Gefühlen.
Ohne die technische Bewältigung der assoziativen Konditionierung, die zu Zukunftsvorstellungen führt, werden Roboter immer Reiz-Reaktionsmaschinen bleiben, und nur „unbewusste“ Reflexe ausführen.
Was bestimmt die Wahrscheinlichkeit mit der ein Ereignis einem anderen folgt? Was bestimmt also die Stärke einer Verbindung? Wann darf eine Verbindung verfallen? Was ist eine hemmende Verbindung?
Wenn ein Wissenschafter eine Voraussage über die Zukunft machen will, so bedient er sich statistischer Verfahren. Wir kennen keine anderen Verfahren, um Vorauszusagen zu entwickeln. Tatsächlich gibt es inzwischen viele Untersuchungen, die zeigen, dass auch das Gehirn statistisch arbeitet. (Spektrum-Ticker 2002.01.24, Spektrum-Ticker 2002.03.25, WSA 2002.11.29)
Eigentlich sollte dies schon lange klar sein. Haben sie sich schon einmal gefragt, warum dieser „Supercomputer“ Gehirn nicht in der Lage ist, sich eine größere Menge an Information sofort zu merken? Die Antwort ist: Wir merken uns deshalb Zusammenhänge meist erst nach einigen Wiederholungen, weil das Gehirn sich auf diese Weise davor schützt, Dinge als zusammengehörig zu vermerken, die nur einmal zufällig aufeinander gefolgt sind. Wenn wir uns nur merken, was wiederholt aufeinandergefolgt ist, so werden nur die wahrscheinlichsten Zusammenhänge abgespeichert, wir werden somit die Fähigkeit zur Voraussicht der Welt ausbauen. Merken wir uns alles zu leicht, so wird aus uns ein zerstreuter Professor dessen Rettung darin besteht, dass es in unserer Kultur Bücher gibt, die bereits vorsortierte Information enthalten, wo also überwiegend sinnvolle Zusammenhänge verzeichnet sind.
Die folgende Grafik zeigt wie oft zwei Ereignisse A (Kreis) und B (Dreieck) über die Zeit hinweg alleine, und wie oft sie zusammen auftreten. Nach Bayes besteht ein Zusammenhang dann, wenn Ereignisse öfter zusammen auftreten als alleine.

Wie stark ist der Zusammenhang in dem dargestellten Beispiel?
Dem Reiz A (Kreis) folgt durchschnittlich jedes dritte mal B (Dreieck). Jedes 10. mal tritt B alleine auf. Die Wahrscheinlichkeit mit der bei vernommenem A gleich ein B wahrzunehmen sein wird, ist also ein Drittel. Diese Wahrscheinlichkeit ist ausschlaggebend dafür, wie stark unsere Voraussageverbindung von A zu B sein darf, wie sehr wir also nach Auftreten von A mit B rechnen und wie stark das Erwartungssignal ist, das im Gehirn dem Modell zufolge durch die Verbindung zu B gelangt.
(Und wie ist das, wenn A genauso häufig alleine auftritt als dass darauf B folgt? Nehmen wir an A trat 100 mal alleine auf, und 100 mal folgte darauf B, A trat also insgesamt 200 mal auf, so ist laut Bayes Gleichstand erreicht: 100:200=0,5. Wir dürfen mit halber Erwartung auf B hoffen, wenn wir A wahrnehmen.)
Nun haben wir aber umgekehrt in der obigen Grafik auch erfasst, dass B unter zehn Auftritten nur neunmal zusammen mit A auftritt. Die Wahrscheinlichkeit dass zwischen A und B ein Zusammenhang besteht, ist demnach neun Zehntel, also 0,9 und nicht 1 (Bauer 1991, S.61). Letztere Wahrscheinlichkeit ist ausschlaggebend dafür, als wie sicher ein Zusammenhang betrachtet werden kann, bzw. ob überhaupt von einem Zusammenhang gesprochen werden darf. Auf das Gehirn umgelegt, ob also eine Verbindung aufrecht erhalten werden soll, oder nicht. So viel zur statistischen Berechnung der bedingten Wahrscheinlichkeit nach Bayes.
Um seine Verbindungen zu kontrollieren, muss unser künstliches Neuron B also über eine innere Zählmaschine verfügen, die erfasst, wie oft:
A insgesamt auftrat
A und B zusammenfielen, und
B insgesamt auftrat.
|
Um die Stärke der Voraussage zu erfassen,
muss im Neuron der zweite Wert durch den ersten dividiert werden. Um
zu erfassen ob die Verbindung aufrecht erhalten
werden soll, der zweite durch den dritten. |
Man kann auch sagen der zweite Wert muss durch den dritten geschwächt werden, denn eine Division ist immer eine Schwächung eines Wertes. Zellen dividieren nicht. Sie schwächen und verstärken Verbindungen.
Umgekehrt kann natürlich auch die Wahrscheinlichkeit betrachtet werden mit der A auf B folgt. In unserem Beispiel ist A nie auf B gefolgt, die Wahrscheinlichkeit ist also null. Da A immer ohne ein davorliegendes B, sozusagen spontan auftrat, braucht in diese Richtung auch kein Zusammenhang angenommen werden. Das bedeutet, in dieser Richtung braucht keine Verbindung aufgebaut werden.
Allgemein gilt für die statistische Überprüfung von Verbindungsstärken (die ja Wahrscheinlichkeitsgrade von Zusammenhängen repräsentieren), dass die Zählergebnisse mit zunehmender Erfahrung immer höher werden. So werden sich Verbindungen, die über Jahrzehnte nur verstärkt wurden, auch über Jahrzehnte nicht mehr löschen lassen. Nun fragt sich aber: Wie kann dann Gehirngewebe später noch für etwas Neues genützt werden. Wie z.B. könnte dann ein Erblindeter Gehirnbereiche nutzen, die einst dem visuellen Bereich zugeordnet waren?
Die Lösung besteht darin, nicht einen bestimmten Zeitraum, sondern eine bestimmte Anzahl an Reizen zu überwachen. Darüber hinaus ist das System einfach voll. Ich will damit sagen, dass wir in einem begrenzten System eine Kapazitätsgrenze festlegen müssen, ab der wir alte Erfahrungen nicht mehr in unsere Wahrscheinlichkeitsrechnung einbeziehen. Ansonsten würden neu hinzukommende Erfahrungen, in Relation zur Summe der bereits gemachten, immer weniger Gewicht bekommen. Das wäre nur dann in Ordnung, wenn die Welt um uns immer gleich bleiben würde. Wenn wir annehmen, dass die Welt sich in einem stetigen Wandel befindet, sollten wir den neuen Erfahrungen mehr Gewicht verleihen, um anpassungsfähig zu bleiben. Das können wir, indem wir alte Erfahrungen nach und nach über Bord werfen. Das ist ganz einfach vorzustellen. Die Bayesianische Statistik ist durch Relationen darstellbar. Eine gute visuelle Anschauung gibt uns dazu das Farbenmischen.

Stellen wir uns vor, wir beobachten, dass B fünfmal auf A folgt. Diese Folge AB stellen wir durch fünf Tropfen schwarze Farbe dar, die wir in einen Topf geben. Nun folgt A einmal alleine, also ohne B bleibt aus. Das stellen wir durch einen weißen Farbtropfen dar, den wir im Topf dazurühren. Es folgen weitere Erfahrungen, und weitere Tropfen Schwarz und Weiß werden zugerührt. Die Wahrscheinlichkeit mit der wir annehmen dürfen, dass jedes B durch A angekündigt wird, ist durch den Schwarzgehalt der Gesamtfarbe dargestellt.
Nehmen wir an, nach 100 Tropfen wird der Topf voll. Mit jedem neuen Tropfen, den wir zufügen, schwappt ein alter Tropfen Farbe aus dem Topf. Ich nehme an, dass unser Gehirn genau so arbeitet. Ab dem Moment wo es voll ist, berücksichtigt es neue Information stärker. Es kann sich auf diese Weise immer relativ schnell an neue Verhältnisse anpassen.
Die Anpassung an neue Verhältnisse führt aber dazu, dass alte Erinnerungen umgeformt werden. Was man einst für wahrscheinlich hielt, wird durch neue Erfahrungen plötzlich für unwahrscheinlich gehalten, und umgekehrt. Studien belegen, dass eine solche Umformung stattfindet, denn jedes Mal, wenn das Gehirn Erinnerungen aus dem Langzeitgedächtnis wieder aufgerufen hat, müssen diese erneut durch die Synthese frischer Proteine konsolidiert werden (Spektrum-Ticker 2000.08.17, Spektrum-Ticker 2001.07.30).
Wenn wir von einem neuronalen Netz ausgehen, dessen Neuronen Verbindungen darstellen, und somit die für die Wahrscheinlichkeitsrechnungen nötigen Divisionen und Multiplikationen ausführen sollen, so ist es, als ob jede Zelle einen kleinen Taschenrechner darstellt. Dass eine solche Annahme sinnvoll ist, zeigen Studien, die nahelegen, dass Gehirnzellen durchaus in der Lage sind, Signale multiplikativ zu verstärken, oder abzuschwächen (Gabbiani u.a. 2002, Spektrum-Ticker 2001.04.19, Spektrum-Ticker 2002.01.24).
Ein Umsetzung einer solchen Idee ist digital natürlich aufwendig und kaum zu realisieren. Aber wenn wir von der digitalen Lösung abweichen, und auf analog arbeitende Transistoren zurückgreifen, so erscheint die Sache durchaus durchführbar, denn ein analog arbeitender Transistor, wie er im Verstärker einer Stereoanlage vorkommt, tut nichts anderes als die einkommenden Signalstärken zu multiplizieren (und damit die Lautstärke des Outputsignals zu erhöhen), wobei der Multiplikationsfaktor abhängig ist von der Spannung, mit der er versorgt wird. Was nun, wenn diese Spannung nicht konstant ist, sondern ihrerseits ebenfalls ein Signal wechselnder Stärke? Dann erhalten wir die komplizierten Outputergebnisse, die wir für eine Umsetzung der bayesianischen Formel in einem Netzwerk benötigen! Und es sind nur einfache Bauteile notwendig: analoge Transistoren!
Aber was heißt überhaupt Reize treten zusammen auf? Wieviel Zeit darf zwischen zwei Reizen vergehen bevor man sagen kann, sie sind alleine aufgetreten? Diese Frage ist statistisch ungültig. Wichtig für die Voraussage von Reizen ist nämlich nicht die Länge der Zeitdistanz, sondern, dass diese Länge jedesmal gleich war. Statistisch betrachtet können wir die Reize in Fig. C der folgenden Grafik noch genauso gut voraussagen wie in Fig. A, denn das Dreieck folgt genauso zuverlässig immer auf den Kreis, aber eben verspätet, also nicht AB, sondern A.......B.

Konditionierungsexperimente zeigen aber, dass der Zusammenhang zwischen A und B nicht mehr erkannt wird, je weiter der Zeitabstand A àB die Auftrittshäufigkeit der Reize überschreitet (siehe Fig.C). Kann diese Begrenzung in unserer Wahrnehmung der Welt einen praktischen Grund haben? Wieso sollten nahe Reize einander eher auslösen als ferne?
Mit welchem der Folgereize sollte eine Verbindung hergestellt werden? Mit dem nächsten, oder dem fünf Reize weiter?
Nehmen wir an wir sehen auf eine entfernte Stadt über die ein Gewitter niedergeht. Auf jeden Blitz folgt in einem gewissen Abstand ein Donner. Werden die Blitze häufiger, so fallen zwischen jenen Blitz, der den Donner den wir hören ausgelöst hat, noch weitere Blitze. Natürlich wäre statistisch immer noch die Korrelation zwischen Blitz und Donner erfassbar, weil der Zeitraum zwischen ihnen noch konstant ist, solange das Gewitter die gleiche Entfernung hat. Unser Gehirn steigt hier wohl deshalb aus, weil es in der Natur kaum solche Beispiele gibt, wo gilt Reiz A verursacht B, aber nicht das folgende, sondern irgendein weiteres B.
Das bedeutet, dass unser Gehirn nur den Zeitraum von A zum darauf folgenden A auf ein B absucht, das in einem möglichen Ursache-Wirkungs-Zusammenhang zu A steht. Eine solch sinnvolle Leistungsbeschränkung wollen wir auch in unserem künstlichen System verankern, zumal wir ohnehin den enormen Rechenaufwand reduzieren müssen.
Kann ein solches System dann aber überhaupt noch lange Zeitzusammenhänge erfassen? Ja! und zwar durch Chunkbildung! Eine Kette von Ereignissen kann eine Einheit bilden, die wir als Chunk bezeichnen wollen. So ein Chunk könnte zum Beispiel "Frühstücken" lauten. Und dem Frühstücken kann das Chunk "Einkaufen gehen" folgen. Die beiden Chunks haben etwa gleiche Auftrittshäufigkeit Relativ zu dem Zeitraum vom Auftreten zum durchschnittlichen nächsten Auftreten des gleichen Chunks, liegt zwischen den verschiedenen Chunks ein geringer zeitlicher Abstand. Also werden sie verbunden. So erfasst ein Baby Tagesabläufe, und hat es erst einmal den Tagesablauf als Chunk, so kann es den Wochenablauf erfassen usw. Im Prinzip ist jeder Begriff ein Chunk.
Was wir hier für die zeitliche Distanz von Ereignissen ermittelt haben, gilt gleichermaßen für den Raum. Das zeigt sich auch an der obigen Grafik. Zusammenhänge, die wir zeitlich nicht mehr erkennen, sind auch in ihrer grafischen räumlichen Darstellung nicht augenscheinlich.
Nun lässt sich gegen diesen Grundsatz einwenden, dass es durchaus Zusammenhänge gibt, die wir zeitlich verstehen, die aber räumlich dargestellt nicht so gut fassbar sind, z. B. erkennen wir im grafisch dargestellten Frequenzmuster eines Musikstückes einen falschen Ton nicht mehr. Allerdings ist zu bedenken, dass wir von Kindheit an mit Musik konfrontiert sind, und so im auditiven System bereits über geeignete Chunks verfügen, die uns ein Verständnis ermöglichen. Im visuellen System, mit dem wir die Frequenzmuster betrachten, haben wir noch keine geeigneten Chunks für dieses Muster auf Lager.
Hemmende Verbindungen, nach der Junktorenlogik sollten wir sie Nicht-Verbindungen nennen, treten im neuronalen Netz dann auf, wenn eine verkehrt-proportionale Relation erfasst werden soll. Stellen wir uns vor, Pawlows Hund bekommt weniger bis gar kein Futter, je heißer der Tag ist. Je stärker die Einheit seines Gehirns anspricht, die die Raumtemperatur repräsentiert, desto schwächer soll die Voraussage für Futter werden. Vom Reiz „Raumtemperatur“ geht also eine Nicht-Verbindung zum Reiz „Futter“.
Positive Relationen sind leichter verständlich als negative. Sie bedürfen keiner hemmenden Verbindungen. Läuten wir dem konditionierten Hund irgendwann die Glocke sehr leise, wird er auf Anhieb nicht sicher sein, ob jetzt auch Futter kommt. Das Erwartungssignal ist sozusagen dann auch leiser (positive Relation).
Aber stehen hemmende Verbindungen damit nicht in Widerspruch zu der Lerntheorie? Wir sind doch davon ausgegangen, dass sich Zeitgleiches, Nahes und Ähnliches verbindet. „Ähnlich“ bedeutet auf der elementaren Basis der Neuronen „ähnliche Reizstärke“. Hemmende Verbindungen entstehen aber aufgrund der zeitgleichen Unähnlichkeit zweier Reize!
Der Widerspruch hebt sich auf, wenn wir begreifen, dass hemmende Verbindungen eigentlich „Antiverbindungen“ sind. Aber um die Hemmung zu übertragen brauchen wir trotzdem eine Verbindung im neuronalen Netz!
Die Lösung dieses Problems können wir uns vom Gehirn abschauen. Von gut erforschten Gehirnbereichen, wie der Sehrinde, wissen wir, dass alle Reize in Form eines Gegenreizes noch einmal vorliegen. Zu jeder On/Off-Zelle gibt es eine Off/On-Zelle. Zu jedem Reaktionsbild ein Negativ (Hubel 1989, S.50). Man könnte sich das so vorstellen, dass unter einer Zelle, die auf Glocke positiv anspricht immer die gegenteilige Zelle liegt, die auf Glocke gehemmt wird. Die Beiden bilden ein Paar. Umso stärker der Reiz, desto mehr Differenz weisen deren Zellreaktionen auf.
Wenn wir von dem obigen Beispiel ausgehen, und uns naiv vorstellen, unser Hund hätte eine Zelle für Futter, dann hat er auch eine für „Antifutter“. Das Signal von der Zelle für Raumtemperatur korreliert in unserem Beispiel nun nicht mit „Futter“ sondern eben mit „Antifutter“. Es kann mit der Gegenzelle von Futter nach dem Gesetz ähnlicher Reizintensität verbunden werden.
Wenn wir die bayesianische Statistik nun auf die Zellen und Gegenzellen anwenden, so ist klar, dass zwei Paare (jew. Zelle plus Gegenzelle) nie zugleich eine positive und eine hemmende Verbindung zueinander aufbauen werden, denn es wird sich nur durchsetzen, was häufiger zutrifft, also immer nur eines von Beidem.
Nehmen wir an, die Glocke ertönt zweimal in kurzem Abstand, und darauf kommt Futter. Ertönt sie mit langem Abstand kommt nichts. Wie kann ein Netz solche Zeitfolgen erlernen?
Es gibt im Gehirn keine Uhr für kurze Zeitabstände (bestenfalls für den Tag-Nacht-Rhythmus). Kleinkinder lernen aber zuerst das zeitlich Nahe verbinden und erst später größere Zeiträume zu überblicken. Die kürzeste Zeiteinheit würde demzufolge als erste erlernt. Es gibt eine kleinste erfassbare räumliche Distanz in Reaktionsbildern, nämlich die benachbarte Zelle. Analog dazu kommt als kleinste Zeiteinheit die maximale Impulsrate von Neuronen in Frage.
Bei der Erforschung der neuronalen Reaktionen im auditiven System, ist man darauf gestossen, dass oft die Zeiteinheit von 0,4 ms auftritt, bzw. deren Vielfache. 0,4 ms ist die maximale Impusrate der Neuronen (Bleeck 1996).
Daraus ergibt sich die Frage, wie das Gehirn dann Frequenzen verarbeiten kann, die weit schneller schwingen als dieses Maß. Die Antwort ist einfach. Es sind nicht die Neuronen, die zu dieser Unterscheidung fähig sind, sondern diese Leistung wird durch die Anatomie des Ohrs und dessen Sensoren erbracht. Das Frequenzsprektrum wird als Reaktionsbild auf die Gehirnrinde übertragen. (Ehret 1997, Seifert 2002, S.40). Die Maximale Verarbeitungsrate dieser Klangbilder ist nicht höher als 0,4 ms, die Bildinformation lässt aber erkennen, welche hohen Frequenzen vorliegen.
Es sollen nun nicht nur Reizlängen erfasst werden, sondern auch die Länge der Lücke zwischen den Reizen. Um zu erklären, wie hemmende Verbindungen (Nicht-Verbindungen) in das Konzept der Konditionierung passen (sie schienen ja dem Gesetz der Ähnlichkeit zu widersprechen), mussten wir die Gegenzellen einführen. Die Gegenzelle eines Reizes ist immer dann aktiv, wenn ein Reiz nicht aktiv ist. Ein Rhythmus von Impulsen stellt sich als Folge von Signalen und Lücken dar, also als Folge von Aktivität einer Zelle, die das Signal repräsentiert, abgewechselt von Aktivität der Gegenzelle.
Nahes wird bekanntlich eher verbunden, als Entferntes. Also werden auf unterster Ebene erst einmal Verbindungen zwischen zeitlich benachbarten Impulsen entstehen. Da gibt es zwei Möglichkeiten. Die Folge 1,0, und die Folge 1,1 sowie jeweils deren Negativ (Gegenzellenreaktion).
Die Folge 1,1 spricht natürlich auch während längerer Signale ständig an. So spricht sie auf vier Impulse zweimal an. Das bedeutet, im Gehirn sollten auch selbstproduzierte Periodizitäten auftreten, die nicht direkt den akustischen Reizen entspechen, sondern die sich aus den Vielfachen der maximalen Impusfrequenz erklären, mittels derer längere Reize gemessen werden. Genau solche selbstproduzierte Periodizitäten wurden entdeckt (Langer 1998).
Nun ergibt sich noch die Frage, ob die beiden Einser der Folge 1,1 von der selben Zelle repräsentiert werden, oder von zweien. Grundsätzlich gilt im Gehirn durchaus die Regel, dass ein gleichartiger Stimulus wieder von der selben Zelle repräsentiert wird. Ein Beispiel sind die Balkendetektoren im Sehsystem. Allerdings scheint auch die Regel zu gelten, dass eine Zelle, die gerade erst aktiv war, eine kurze Pause benötigt (Coolspot), bis sie wieder aktiv werden kann (Ehret 1997). Außerdem sind wir davon ausgegangen, dass wenn ein Reiz nicht aufgenommen werden kann, eine neue Verbindung entsteht.
Um zu überlegen, was in unserem Netz nun konkret geschieht, teilen wir unseren Signalstrom in Impulse (1) und Pausen (0). Wie wird nun ein selbstlernendes Netz reagieren, wenn es eine Lückenlose Kette von Impulsen (1,1,1,1,1,1,1) aus dem auditiven System empfängt, und noch nie zuvor Reize empfangen hat? Der erste ankommende Impuls 1 wird von der nächstgelegenen Zelle (am Audioeingang) aufgenommen. Sie repräsentiert in Zukunft diese 1.
Die zweite 1 kann sie nicht aufnehmen, weil folgende Regel gilt:
|
Jedes Neuron braucht nach seiner Aktivität
einen Takt Ruhe. |
Wir wollen annehmen die Gegenzelle pausiert mit, sonst würde ein Signalstrom von 1,0 repräsentiert. Da das Signal aus dem auditiven Hörsystem irgendwo weitergegeben werden muss, übernimmt in der Pause eine Nachbarzelle die Arbeit. Hält das Signal noch länger an, so ist die erste Zelle wieder aufnahmebereit. Da auf ein langes Signal 1,1,1,1,1,1 die beiden Zellen immer abwechselnd (zeitlich nahe) aktiv werden, entsteht eine Verbindung zwischen ihnen. Zu einer solchen Voraussageverbindung könnte sich auch eine eigene Chunkzelle ausbilden, die dann die Folge 1,1 repräsentiert.
Dieses Schema lässt sich nun fortsetzen. So könnte eine übergeordnete Einheit die zweimal hintereinander eintretende Aktivierung der 1,1-Zelle erfassen. Sie erfasst dann die Signallänge 1,1,1,1. Es sind auch übergeordnete Einheiten vorstellbar, die 8, 16, 32 und mehr Impulse erfassen. Das bedeutet, es würden Neuronenverbände entstehen, die zählen können und somit zeitliche Längen repräsentieren. Tatsächlich sind zählende Neuronen im Hörsystem entdeckt worden, wenngleich als Versuchstier der Frosch diente (Standard 2002.09.02). Am Affen hat man in einem anderen Gehirnbereich Neuronen für das Zählen von Objekten entdeckt (WSA 2002.09.11).
Das bedeutet, eine einzelne Zelle braucht nicht die Fähigkeit besitzen, Zeit zu erfassen. Eigentlich hat das hier dargestellte System gar keine neuen Fähigkeiten verlangt, außer die Regel, dass Zellen nach ihrer Aktivität eine Impulspause brauchen. Interessant ist auch, dass automatisch eine logarithmische Skala (2, 4, 8, 16, 32…) entstand. Zeit wird also mit zunehmender Länge immer gröber erfasst. Dies entspricht unserem Denken.
Zeitliche Verbindungen werden sich den Bayes-Regeln zufolge nur dann dauerhaft im Gehirn verankern können, wenn sie wiederholt auftreten, also öfter bestätigt, als widerlegt werden. Nehmen wir an, das Bellen eines Hundes stellt sich als Folge von Reizen und Lücken dar. Es erfolgen einige Wiederholungen. Dann erfolgt eine längere Lücke, bis zum nächsten Tag, wenn wir den Hund wieder bellen hören. Die längere Lücke wird aber nicht die wiederholt aufgetretenen kurzen Lücken überschreiben, denn sie tritt nur einmal auf, und hat daher weniger Kraft. Vielleicht mag es umständlich erscheinen, längere Zeiteinheiten aus kurzen zusammenzusetzen, da dabei viele Zellen zur Erfassung längerer Zeiteinheiten aktiv werden müssen. Aber alle diese Zellen müssen ohnehin veranlagt werden, denn ein Wesen dieser Welt braucht zeitliche Bausteine von der kleinsten bis zu großen Einheiten.
Die Gegenzelle ist notwendig, um eine Serie von Einzelreizen von einem durchgehenden schwachen Reiz unterscheiden zu können. Im ersten Fall funkt sie dazwischen, im zweiten bleibt sie stumm. Die Gegenzellen pulsen immer gleich, sie kennen keine Lautstärkenunterschiede, denn Lücken haben keine Lautstärke. Deshalb ist die Lücke zwischen den Tönen auch die erfassbare Zeit in der Musik. Der Tonbeginn, der die Lücke beendet ist wichtig, wie lange der Ton dann dauert, ist für die Melodie weniger relevant.
Zusammenfassend lässt sich sagen, dass in diesem Modell Zeitlängen durch verschiedene Neuronen verkörpert werden. Es gibt keine einheitliche Uhr. Diesen Aspekt des Modells hat sich auch ein neues neuronales Netz zur Spracherkennung zueigen gemacht. Mit Erfolg! Es erkennt durch die flexible Zeiterfassung Sprache so gut wie der Mensch (Spektrum-Ticker 1999.10.04).
Wenn wir eine Reizlänge wirklich an der Anzahl der aufeinandergefolgten Impulse erkennen, und sich große Zeitlängen aus kleineren bereits bekannten Zeitlängen zusammenaddieren lassen, dann stehen wir vor dem Problem, dass sich eine große Zeiteinheit auf viele verschiedene Arten aus kleineren zusammensetzen ließe. Stellen sie sich vor, aus wie vielen verschiedenen kleineren Zahlen zum Beispiel eine 8 zusammengesetzt werden kann. Aus 5+3, aus 4+4, aus 6+2, aus 4+2+2 usw. Wie viele Möglichkeiten gibt es dann erst bei wirklich großen Zahlen! Wenn jede dieser Möglichkeiten auch umgesetzt wird, so könnten in diesem Spiel alle Neuronen und Verbindungen des Gehirns verbraucht werden, denn die Zahlenreihe ist unendlich. Was also begrenzt diesen Prozess?
Ist zum Beispiel die Folge 1,1 vorhanden, und es folgt ein längerer Reiz, z.B. 1,1,1,1,1,1,1,1 dann ist dieser nicht in einem Lernschritt zur Gänze erfassbar, weil ja ein Neuron in diesem Modell immer nur eine Folge aus zwei nacheinander erscheinenden Impulsen aufnehmen kann. Es wird also zuerst die zweimal nacheinander erfolgte Aktivierung der 1,1 an eine neue Chunkzelle weitergegeben (also 11,11) und eine Stufe höher wird deren Wiederholung repräsentiert (also 1111,1111). Dass zwischen der wiederholten Aktivierung der Zellen höherer Verarbeitungsebenen ein größerer zeitlicher Abstand liegt, als bei Zellen der unteren Ebenen ist irrelevant. Eine Zelle spricht in diesem Modell auf die Reihenfolge an, nicht auf die Zeit. Andernfalls stünden wir ja wieder am Anfang unserer Überlegungen, weil dann die Zelle eine innere Uhr bräuchte. Wir haben beschlossen, dass sich die Zeit in diesem Modell indirekt abbildet.
Wichtig ist hier nur folgende Feststellung: Jede andere Form, eine Folge von 8 Reizen darzustellen, z.B. 2+3+3, hätte mehr als zwei Lernschritte benötigt. So kommt die Verschaltungshierarchie 2à4à8 allen anderen zuvor, weil sie schneller erlernt wird. Sie stellt den schnellsten Weg dar, die hohen Zahlen zu erobern. Wenn zum Beispiel die 8er-Serie einmal erlernt ist, und erkannt werden kann, so nehmen diese Neuronen die ankommenden Voraussage-Signale auf. Die Signale gelangen zu keinen anderen Neuronen mehr. Deshalb bilden sich auch keine anderen Verbindungen mehr aus. Das Prinzip besteht also darin, dass der Verbindungszuwachs dadurch begrenzt wird, dass bereits vorhandene Verbindungen die Reize aufnehmen. Damit ist eine Voraussage gelungen, und so werden weitere Lernvorgänge blockiert. Das Prinzip der Blockierung ist durch eine Unzahl an Konditionierungsexperimenten nachgewiesen (Zimbardo 1995, S.308, Macho 1999, Mischo 2002).
Warum aber wird die Erfassung von Mengen und Zeiten mit deren Länge unexakter? Wie kommt es zu dem Eindruck einer logarithmischen Skala? Die Antwort darauf sollte nun nicht mehr schwer fallen. Wenn sich manche große Zahlen, wie 8, 16, 32, 64 durch sehr wenige Lernschritte erfassen lassen, so werden sie sich zuerst ausbilden, denn sie werden immer auch dann mitaktiviert, wenn eine noch größere Menge auftritt. Diese grobe Erfassung liefert eine Voraussage, die oft nicht exakt stimmt. Es bleibt ein unvorausgesagtes Restsignal. Solange sich das Gehirn aber mit stärkeren Voraussagefehlern aus anderen Bereichen der Wahrnehmung beschäftigt, kann sich unsere Aufmerksamkeit dieser Sache nicht widmen, und wir lernen keine differenziertere Wahrnehmung. Die Aufmerksamkeit wird immer dem stärksten Voraussagefehler zugewandt (wenn nicht gerade etwas trieblich relevantes das System beschäftigt) (Sperling 1998).
Einen Hinweis auf die bevorzugte Strukturierung von Zeiträumen durch das Prinzip der Verdopplung (2, 4, 8, 16) liefert die Musik. Wir können in den Takt eines Metronoms auch einen halb so langsamen Takt hineinhören. Jeder zweite oder vierte Schlag klingt dann für uns irgendwie anders (Holler 1996, S. 290). Das ist wahrscheinlich deshalb so, weil eben jeder zweite Schlag von einer übergeordneteren Zelle erfasst wird.
Um Voraussagefehler dem jeweils stärksten Reiz zuwenden zu können, müssen diese moduliert signalisiert werden, also schwächer oder stärker, je nach Entsprechung. Nur so ist eine Aufmerksamkeitslenkung zum stärksten Voraussagefehler hin vorstellbar. So darf zum Beispiel ein langes Ereignis, das durch einen extrem kurzen Aussetzer unterbrochen wird, nicht sofort in zwei Ereignisse zerfallen, es soll weiterhin als langes Ereignis erkannt werden. In der Palette möglicher Repräsentationen siegt dann jene, die am stärksten anspricht. Wenn die Unterbrechung zu lange anhält, erkennen wir zwei getrennte Ereignisse, wenn sie kurz ist, betrachten wir es als ein Ereignis mit einer Störung.
Konditionierungsexperimente zeigen nicht nur, dass Nahes eher in Verbindung gebracht wird als Entferntes, sondern auch dass Ähnliches eher verbunden wird als Unähnliches. In einem neuronalen Netz ist ein Reiz im elementarsten Fall einfach ein gereiztes Neuron. Ähnlichkeit wäre damit nur durch die Reizintensität darstellbar. Aber was ist Intensität anderes als Impulse pro Zeiteinheit? (In einem elektrischen System sind es Elektronen pro Zeit). Die Frage reduziert sich also auf jene: Was soll eher verbunden werden, etwas, das eine ähnliche Signalhäufigkeit besitzt, oder etwas das zeitlich und räumlich nahe zueinander auftritt?
Die Antwort ist nun einfach. Wenn Signal A doppelt so häufig auftritt als Signal B, kann dies überhaupt nicht zu einer guten Verbindung führen, denn die beiden Signale können dann auch nicht öfter als jedes zweite mal korrelieren. A kann also B nicht zuverlässig voraussagen.
Trotz dieser Überlegungen ist es natürlich immer noch praktischer, sich bei der Konzeption eines Hirnmodells Signale als unterschiedlich stark vorzustellen, weil Impulsdichte kein so anschaulicher Bergriff ist.
Der Mensch vermag auf den realen Zeitpunkt einzustellen, wann ein Ereignis starten wird, soweit dieser voraussagbar ist. Diese Fähigkeit dürften wir bei allen Abläufen nutzen, die wir mit einer gewissen Geschwindigkeit zu vollführen haben. Zum Beispiel weiß der Tennisspieler, wenn das Spiel rhythmisch verläuft, wann der Ball den Schläger trifft, ohne auf den Schläger zu schauen. Andererseits vermag der Mensch in seiner Vorstellung der Zeit vorauszulaufen. Er kann sich vorstellen nach dem Spiel essen zu gehen usw. Das kann er, weil er nicht nur in einer Kette denkt, so dass er sich jeden Schlag des Spiels nacheinander vorstellen muss, sondern auch über den Überbegriff vom Spiel als Ganzes verfügt. An diesen kann er die Vorstellung von Essen anhängen.
Wenn der Lehrer einen Volksschüler auffordert das Alphabet aufzuzählen und danach von eins bis zehn zu zählen, so ist die Vorstellung dessen was jetzt ablaufen soll, dem Schüler schnell vermittelt. Die Realzeit des Ablaufs ergibt sich dann durch die Aufschlüsselung der Überbegriffe, und dauert länger. Dabei darf der nächste Impuls immer erst gesetzt werden, wenn der vorhergehende wahrgenommen wurde, und damit als real eingetreten der Vergangenheit angehört. Erst wenn A ausgesprochen ist darf B folgen.
Realzeit lässt sich auch anpassen. Stellen wir uns vor, wir hören einen Rhythmus, und wollen mit unserer Trommel in diesen Rhythmus einsteigen, also eine Bewegung in der vorgegebenen Realzeit vollführen. Wir müssen durch zuhören erlernen wie lange die Pausen zwischen den Schlägen sind, und dann unser Handeln an diesen Rhythmus koppeln. Wir haben oben besprochen, wie Zeitmessung in unserem Gehirn entstehen kann. Genau wie Reize 1,1,1 verbinden sich auch Pausen, dargestellt durch die Reaktion der Gegenzellen 0,0,0 zu Ketten verschiedener Längen. Es ist naheliegend, dass in einem reiferen Gehirn bereits Pausen in allen möglichen Längen vorliegen, sozusagen Uhren existieren, die in unterschiedlichen Zeitabständen ticken. Wie finden wir die richtige Uhr?
Pausen folgen auf Ereignisse. Der gehörte Schlag löst also die Pause aus, die Pause-Uhren beginnen zu ticken. Jene Uhr, die ihre Pause genau zu jenem Zeitpunkt beendet, an dem der neue Schlag erfolgt, ist die passende. Zu ihr wird die stärkste Verbindung aufgebaut, weil Ihr Voraussagereiz gleich häufig und zeitlich nahe zum Wahrnehmungsreiz erfolgte.
Das obige Beispiel, einem Rhythmus zu folgen, setzt einen Lernprozess voraus, der sofort zu einer ausreichend starken Verbindung führt, um als Handlungsauslöser zu siegen, denn nur so können wir mittrommeln. Das widerspricht dem assoziativen Lernen, das ja ausreichender Wiederholung bedarf.
Welche Assoziationen haben sie auf die Zahl 5? Vielleicht die Zahl 6? Ich assoziiere auch noch meinen Geburtstag, den 5. 1. Nun sollen sie sich Erwins Geburtstag, den 5. 3. 98 merken, der mit der Zahl 5 beginnt. Wie könnte die Assoziation stärker sein als alle bisherigen Assoziationsbahnen, wenn sie schon tausende Male gezählt haben, also auf 5 die 6 erfolgte? Zunächst gilt es aus der Ziffernfolge, die den Geburtstag beschreibt, einen Begriff zu bilden. Dieser wird an Erwin und an Geburtstagfeiern geknüpft, damit er von anderen Assoziationen, die auf die Fünf folgen können, abgekoppelt ist. Dann soll das alles auch noch möglichst nach einmaligem Hören gemerkt werden. Dazu bedarf es einiger Motivation, zum Beispiel dem Ziel, Erwin als Freund eine Freude zu bereiten. Es handelt sich also um einen zielgerichteten Lernprozess, der sich nicht an die Bayes-Regeln ausreichender Wiederholung hält. Solches Lernen stellt eine eigene Art von Handlung dar, die einem eigenen Gehirnteil, dem Hippocampus zuzuordnen ist. Dieser Gehirnteil vermag die Information kurzzeitig zu fassen. Er vermag auch Verbindungen zu den Repräsentationen in der Großhirnrinde aufzubauen, und die beteiligten Neuronen wiederholt anzuregen. Man kann damit das Ziel verfolgen, durch oftmaliges Wachrufen der Vorstellung, die Information ins Langzeitgedächtnis zu übertragen, das nach den Bayes-Regeln arbeitet und der Wiederholung bedarf. Nach einem Gehirnschaden, der den Hippocampus zerstört, sind solche zielgerichteten Lernprozesse nicht mehr möglich.
Aber wenn der Hippocampus für zielgerichtetes Lernen zuständig ist, wieso haben auch Tiere diesen Gehirnteil? Weil auch Tiere teilweise zielgerichtet lernen. Der Hippocampus sitzt im limbischen System, dem Sollwertzentrum des Gehirns. Auch Tiere können sich Ereignisse ohne Wiederholung merken, und zwar in trieblich relevanten, also gefährlichen oder lustbringenden Situationen, wo Körpersollwerte beeinflusst werden.
Für eine innere Abbildung der Welt, die überhaupt erst Zukunftsvorstellungen und damit zielgerichtetes Denken ermöglicht, ist der Hippocampus nicht wichtig. Er entwickelt sich daher erst voll, wenn Kinder erwachsen werden, und öfter das Ziel zu verfolgen beginnen, sich etwas bewusst zu merken, und ihr Gedächtnis bewusst zu trainieren. Die Myelinisierung des Hippocampus erfolgt also erst in der Jugend. Für das Ziel die assoziative Konditionierung zu simulieren, und ein Wesen zu entwickeln, das die Welt vorausahnt, sind zielgerichtete Lernprozesse vorerst unwichtig. Wenn neue Reize im Spiel sind, erlauben die Bayes-Regeln ja ebenfalls sofortige Merkvorgänge. Nehmen wir zum Beispiel an, es erfolgt ein Erdbeben, und später beginnt der nahegelegene Berg Lava zu speien. Selbst wenn dies noch nie eintrat, wird der Zusammenhang vermerkt, weil beide Reize neu sind, und daher noch keine andere Verbindung der Reize vorliegt. Außerdem ist die Auftrittshäufigkeit der Reize selten, und dementsprechend lange sind sie im Gehirn latent aktiv und können sich verbinden. Auch scheiden, abgesehen vom Erdbeben, andere erlebte Reize als Ankündiger für den Vulkanausbruch aus, da sie schon oft ohne Vulkanausbruch erlebt wurden.
Die bisherigen Überlegungen haben sich nur auf die Zeitachse bezogen, also nur Ereignisse behandelt. Ereignisse sind zeitliche Abfolgen von Reizen, die wiederholt auftraten, und daher verbunden wurden. Objekte sind demgegenüber räumliche Korrelationen.
Schon die eine Dimension der Zeit hat einige Probleme aufgeworfen. Es galt zu klären was unter welchen Bedingungen wie stark miteinander verbunden werden darf. Dies kann nun als geklärt gelten. Als nächstes ergibt sich die Frage, wo in einem Netz sich diese Verbindungen bilden, also die Frage nach der Netzarchitektur.
Klassische Netzarchitekturen gehen davon aus, dass alle Verbindungen potentiell vorveranlagt sind, und bei Bedarf gestärkt oder geschwächt werden. Wir haben nun eine Vorstellung von einem lernenden System, das sich hierarchisch strukturiert. Reizfolgen verbinden sich zu Abläufen, diese Verbinden sich zu Ereignissen, diese zu noch längeren Ereignisketten. Die Psychologie spricht von Chunkbildung. Die Lerntheorie besagt, dass in einem Lernschritt nie mehr als sieben Chunks verbunden werden können. Erst wenn das Chunk sich als Begriff im Gehirn gefestigt hat, kann es seinerseits weitere Verbindungen eingehen. Wir wollen nun annehmen, dass diese Verbegrifflichung eines Lerninhaltes (Chunkbildung) dadurch entsteht, dass ihm eine eigene Einheit im Gehirn zukommt, im kleinsten Fall ein eigenes Neuron. Dieses lässt sich nun wie andere Neuronen seinerseits durch weitere Lernprozesse verbinden.
Die Realisation hierarchischen Lernens bedarf einer eigenen Netzarchitektur. Die Lernergebnisse erster Lernprozesse sind Reize für folgende Lernprozesse, deren Ergebnisse wieder Reize für weitere Lernprozesse sind, usw. Es genügt daher bestenfalls für den ersten Lernschritt, eine vorveranlagte Verbindung aller Ausgangsreize mit allen anderen anzunehmen.
Gehen wir von einem einfachen Versuchsnetz aus, das assoziative Verbindungen zwischen 100 Reizen herzustellen vermag. (Im Gehirn müssten wir jeden Bildpunkt des visuellen Systems als Einzelreiz betrachten, und hätten Millionen von Sinnesreizen). Wir nehmen nun an, dass Verbindungen zwischen allen 100 Reizen potentiell vorveranlagt sein müssen, um im Bedarfsfall verstärkt oder geschwächt zu werden. So findet jedes Neuron 99 mögliche Verbindungspartner, das ergibt 9900 vorveranlagte Verbindungen.
Nach dem ersten Lernschritt müssen jeder der möglichen 9900 Verbindungen Neuronen zugeordnet werden können. Diese Chunks gelten Ihrerseits ebenso als Reize, und sollen sich daher mit allen anderen 9999 im Netz vorhandenen Neuronen potentiell verbinden können, also 98990100 potentielle Verbindungen. Schon bei der dritten Stufe hierarchischen Lernens kippt das System ins Unmögliche, wenn wir alle einmal möglicherweise benötigten Verbindungen vorveranlagen wollen, denn wir kommen nun auf 9800029700009900 vorveranlagte Verbindungen. Noch dazu wäre dies ein unzureichend kleines Netz, denn drei Stufen der Chunkbildung und hundert Ausgangsneurone reichen bei weitem nicht aus. Die Idee der vorveranlagten Verbindungen ist also für die Simulation der assoziativen Konditionierung nicht brauchbar. Das bedeutet aber nicht, dass die Sache technisch zu komplex wäre, denn von den vielen potentiell möglichen Verbindungen werden ja nur sehr wenige durch Lernprozesse realisiert. Es müsste nur gelingen, die restlichen unnötigen Verbindungen erst gar nicht anzulegen.
Auch im Gehirn ist nicht jedes Neuron mit jedem verbunden. Trotzdem scheint Konditionierungsexperimenten zufolge prinzipiell jeder Reiz mit jedem anderen zu einer assoziativen Lernverbindung verkettbar zu sein. Wie ist so etwas denkbar? Es gibt nur eine mögliche Antwort: Die Verbindungen laufen über andere Neuronen, und dieser Weg wird erst gefunden, wenn er benötigt wird! Das Gehirn braucht also einen Pathfinding-Prozess.
Pathfinding ist etwas, das in der Natur sehr oft vorkommt. Geschlüpfte Schildkröten finden den Weg zum Meer, Pflanzen den Weg zum Licht. Doch das elementarste Beispiel ist der Funke (Blitz), der den Weg zum anderen Pol findet. Auch in der Robotik werden zur Bewegungskontrolle Pathfinding-Prozesse benötigt, und in Computerspielen findet der Rechner über Pathfinding die Verbindung zwischen den Verfolgern und dem sich ständig bewegenden Spieler, und kann die Verfolgung sinnvoll simulieren. Sowohl beim Blitz, wie auch bei Computerspielen und Robotern braucht die Wegfindung „potential Fields“, also geladene Felder, die den simulierten Raum vorstrukturieren. Feldlinien kann man sich wie Eisenfeilspäne auf einem Papier vorstellen, unter welchem ein Magnet liegt. Sie weisen dem Blitz den Weg zum anderen Pol.
Auch im Gehirn findet Pathfinding statt, und zwar nicht nur beim Axonwachstum, sondern wahrscheinlich auch bei der Wegfindung der Signale im Netz. Es werden immer wieder Bereiche des Gehirns miteinander verbunden, und beginnen ihren Signalrhythmus zu synchronisieren. Die Feldlinien für das Pathfinding des Gehirns müssen ständig erneuert werden, denn ständig kommt es zu einer neuen Reizverteilung. Gehirnwellen, die sich horizontal im Netz ausbreiten, dienen also möglicherweise der Feldlinienbildung für das Pathfinding. Ihre großflächig horrizontale Ausbreitung widerspricht ja allen heutigen neuronalen Netzen, deren Arbeitsweise hauptsächlich vertikal (bottom up und top down) verläuft. Leider ist der Neurophysiologie, abgesehen von indirekten Hinweisen, noch kein wirklicher Nachweis für die Pathfinding-Funktion der Gehirnwellen gelungen. Aber das soll dieses Vorhaben nicht bremsen, denn wir wollen nicht das Gehirn nachbauen, sondern die assoziative Konditionierung mit Hilfe logischer Überlegungen umsetzen. Das Gehirn dient hierbei bestenfalls als Inspirationsquelle.
Nachdem wir oben festgestellt haben, dass assoziative Konditionierung durch übliche Netze mit vorveranlagten Verbindungen nicht machbar ist, ergibt sich die Frage: „Welche Netzarchitektur ermöglicht überhaupt assoziatives Lernen?“. Erinnern wir uns an den Anfangs beschriebenen Zukunftsbaum. Zunächst werden durch vorauseilende Vorstellungssignale viele mögliche Zukünfte aktiviert. Dann erfolgen rückfließende Signale, die eine der möglichen Zukünfte attraktiver erscheinen lassen. Solange dieser Signalrückfluss nicht erfolgt ist, ist unbekannt, welche der vielen Verzweigungen zum richtigen Ziel führt. Auch der Zukunftsbaum gehört also zu den Beispielen für Pathfinding Mechanismen. Der Pfad wird darin dadurch gefunden, dass sich das Signal vorerst in alle möglichen Zukünfte, also in alle erlernten Assoziationsbahnen ausbreitet (Zukunftsbaum), und dort auf Sollwertprognosen trifft. Von diesen Orten gehen dann rückfließende Signale in die Gegenwart, von denen das stärkste siegt. Es bleibt jene Zukunftsvorstellung über, die maximale Sollwerte verspricht.
Am Beginn des Lernens verfügen wir aber noch nicht über assoziative Verbindungen, wie soll also ein Zukunftsbaum entstehen? Ganz einfach: Wir wissen ja noch nicht welche Verbindung zum Ziel führt, also sind alle Neuronen vorerst durch Oder-Auch-Verzweigungen verbunden. Erst ein rücklaufendes Signal entscheidet, welche Verbindungskette siegt. Betrachten wir dazu die folgende Grafik. Ein gegenwärtig durch die Sinne gereiztes Neuron (rot) sucht nach einem noch latent aktiven Neuron, einem Neuron also, das zeitlich kurz zuvor aktiv war (grün).
Da das gesuchte Neuron an einer beliebigen Stelle des Netzes liegen kann, bleibt dem rot eingezeichneten Neuron nur übrig, eine Anfrage bei allen anderen Neuronen zu stellen. Zuerst ergeht die Anfrage an die Nachbarneuronen, weil ein naher Ankündigungsreiz am wünschenswertesten wäre. Von dort sind weitere Neuronen erreichbar. So breitet sich das Signal aus und verästelt sich wie im Zukunftsbaum. Es entsteht aber in diesem Fall ein regelmäßiges kreisförmiges Verzweigungsmuster, da ja vorläufig noch alle Neuronen Oder-Auch-Verzweigungen darstellen. Es entsteht eine sich ausbreitende Gehirnwelle.

Die weiteren Regeln des Signalflusses im Netz wollen wir nun den Regeln des Zukunftsbaumes abgewinnen, die ja auf der Aussagenlogik und der Konditionierung gründen. Nichts ist erkenntnistheoretisch so gut bestätigt wie diese beiden Grundlagen.
Betrachten wir also diese „Gehirnwelle“ als einen von oben gesehenen Baum.
Wir wollen nun annehmen, dass ein Neuron (grün), das zuvor über die Wahrnehmung aktiviert wurde, ohne dass seine Aktivität vorangekündigt worden wäre (ohne Lernblockierung) so arbeitet, als repräsentiere es einen körperlichen Sollwert. (In gewisser Weise könnte man hier von einem geistigen Sollwert sprechen, denn der Sollwert des Gehirns besteht darin, zu lernen alle Reize voranzukündigen, und da die Aktivität dieses Neurons nicht angekündigt wurde, gibt es hier etwas zu lernen.) Wenn nun dieses grün eingezeichnete Neuron, von dem sich kreisförmig ausbreitenden Vorstellungssignalen des roten Neurons getroffen wird, sendet es einen Sollwert-Impuls in die Gegenrichtung, also in die Assoziationsbahnen. Das Signal läuft nun die Verzweigungen zurück und isoliert eine Bahn (gelb). Es verschließt die anderen Zweige. So entsteht eine Verbindung zwischen den beiden Neuronen.
Aber wie kann das Signal zurückfließen, gegen alle Vektordaten? Eigentlich sind die Vektordaten ja verkehrt. Sie gehen gegen den Zeipfeil vom roten jetzt aktiven Neuron zum grünen nurmehr latent aktiven Neuron. Deshalb wollen wir folgende Regel einführen, um richtige Daten zu erhalten, und einen Signalrückfluss zu ermöglichen:
|
Nach gelungener Weitergabe der
Vorstellungssignale (Gehirnwelle) beenden Neuronen ihre Aktivität und
polen ihre Vektordaten um, das heißt aus Plus wird Minus und
umgekehrt. |
Diese Regel macht also den Signalrückfluss möglich. Damit ist Pathfinding gelungen. Die beschriebenen Vorgänge sind die gleichen, die wir schon im Kapitel „Der Zukunftsbaum“ kennengelernt haben, wo es um plandendes Denken ging. So findet auf allen Ebenen des Gehirns ein Mechanismus statt, den wir als „Erkenntnisgewinn“ bezeichnen können. Erkenntnisgewinn gründet auf wenigen, für alle Erkenntnisstufen geltende Regeln.
Pathfinding funktioniert nur, wenn Neurone, deren Aktivierung nicht durch ein Vorstellungssignal vorangekündigt wurden, einen Sollwert darstellen, zu dem, wie zu anderen Sollwerten, eine Verbindung aufgebaut wird. Ich werde später zeigen, dass diese Lernregel auch die Aufmerksamkeitslenkung auf Unerwartetes erklärt. Sie bildet die Grundlage für den Lerntrieb und das ästhetische Empfinden.
Von einem Punkt ausgehend breitet sich die oben dargestellte Gehirnwelle kreisförmig aus. Das ist in einem Netz wie dem Gehirn, wo die Neuronen diffus angeordnet sind, einfach durch die bereits bekannte Regel gewährleistet, welche besagt, dass ein gerade aktiviertes Neuron eine Pause braucht. Wir erinnern uns, diese Regel war auch notwendig, um Signale zeitlich zu quantisieren. Diffuse Anordnung bedeutet, dass wir eine Linie gleich bleibender Länge in beliebiger Richtung über das Netz ziehen können, und durchschnittlich immer gleich viele Neurone von dieser Linie getroffen werden.

In geometrischen Netzen, wie einem Quadratrasternetz ist das anders. Deshalb breiten sich darin Signale in bestimmten Richtungen schneller aus. Dann entsteht z.B. ein Quadrat an Stelle des Kreises, weil in der Diagonale die Signale schneller vorankommen. Das kann mit Hilfe von Filtern in einem Grafikprogramm leicht nachvollzogen werden. Die folgende Grafik zeigt mehrere Filter, und darunter die Ergebnisse bei mehrmaliger Anwendung auf ein Ausgangsbild, das einen weißen Punkt auf schwarzem Grund enthielt. Der Punkt wächst zu einer Fläche heran, die verschiedene Ausbreitungsformen annehmen kann.
|
|
|
|
|
|
|
|
Wir sehen, dass eine volle Signalweitergabe zu den Nachbarneuronen in einem Quadratrasternetz zu einem Ausbreitungsquadrat führt, das diagonal liegt, wenn wir Verbindungen zu jeweils vier Nachbarneuronen annehmen (Fig.1). Das Ausbreitungsquadrat liegt gerade, wenn wir von 8 Nachbarn ausgehen (Fig.2). Wenn wir den nahen Nachbarn nun ein stärkeres Signal senden als den entfernteren, so erhalten wir eine kreisförmige Ausbreitung (Fig.3). Die volle Signalstärke eines Neurons wird dann erst durch Addition der Impulse aus zwei bis drei Übertragungsschritten erreicht. (In einer analogen elektronischen Hardware könnte man die Verbindungen zwischen den Neuronen mit einem Widerstand versehen, und so einen weichen kreisförmigen Übergang bei der Ausbreitung erzeugen).
Wenn Zellen, die bereits aktiv sind, keine Signale aufnehmen können, dann funktioniert eine solche schrittweise Übertragung aber nicht. Also müssen wir diese Regel abändern in folgende:
|
Sind die
Nachbarneuronen weniger aktiv als die gebende Zelle, so kann der
Differenzbetrag übertragen werden. |
Eine kreisförmige
Ausbreitung ist wichtig, denn nur sie kann zu einem strahlenförmigen
Ausbreitungsmuster führen, das dem rückläufigen Antwort-Signal einen
direkten Pfad durch das Netz weisen kann. Die Frage ist: Wie kommen wir
von der Ausbreitungswelle zu den Stahlen, also zum Signalweg?
Kennzeichnen wir dazu vier Eingänge einer Zelle, mit –x
+x -y +y wie in einem Koordinatensystem.
Nehmen wir der
Einfachheit halber an, jedes Neuron ist mit 8 Nachbarn verbunden. Die
kreisförmige Ausbreitung des Signals entsteht durch Schrittweise
Weitergabe des Signals, nach der oben gezeigten Maske (Fig3). Es wird in
Drittelschritten übertragen, die vier Eckzellen erhalten nur ein
Sechstel. Die Zahlen dürfen dabei gerundet werden. 6 Bit (64
Stufen-System) sind ideal.
Eine wesentlich
rechenextensivere Variante der Kreisausbreitung besteht in
abwechselnder Anwendung folgender zwei Filter. Man beachte auch die
Skalierung. Wenn die Grauwerte der Pixel auf 2 Bit (4 Stufen-System)
gerundet werden, entsteht das rechts dargestellte 12eck. Das ist eine
passable Kreisannäherung mit wenig Aufwand.
![]() |
![]() |
![]() |
Wie sind solche Ausbreitungsvorgänge (Gehirnwellen) zu programmieren?
Die Nachbarneuronen sind einfach dadurch zu finden, dass zu der x oder
y Koordinate des aktiven Ausgangsneurons 1 addiert oder abgezogen wird.
Jedes Neuron notiert
auch, von welcher Seite, x oder y Impulse kamen, wobei Minuszahlen und
Pluszahlen einander aufwiegen. Die diagonalen Nachbarn erhalten das
Signal sowohl aus der x, als auch y Achse. Die Aufaddierung aller
Signale pro Achse führt in jedem Neuron (Pixel) zu Vektordaten, die die
Fließrichtung des Signals beschreiben.
Derartige sich ausbreitende Signalströme (Gehirnwellen) gehen also
immer von aktiven Neuronen aus. Wenn Wellen aufeinandertreffen, so
stoppen sie einander. Die Fläche, die sie durchlaufen haben, ist voll
mit Vektordaten. Entlang dieser Vektordaten können nun Verbindungswege
zwischen den Neuronen gefunden werden. Die kürzeste Verbindung wird am
schnellsten gefunden.
Um eine Verbindung zu finden, muss ein Signal die Vektoren
entlanglaufen. Wie ist das vorzustellen? Bilden wir dazu eine
Verhältniszahl der Signalmengen, die das Neuron aus x und y erhielt,
also y : x. Die Zahl beschreibt, wieviele Schritte auf der y- Achse
gemacht werden müssen, wenn ein Schritt auf der x-Achse gemacht
wird. Die Zahl kann auch kleiner als 1 sein. Geschritten wird nach
folgender Regel. Es erfolgt der erste Schritt auf der x- Achse, und
dann je nach Verhältniszahl Schritte auf der y- Achse. Jeder Schritt
wird von der Verhältniszahl abgezogen. Wenn die Zahl unter 1 fällt (was
sie auch Anfangs schon sein kann), wird wieder ein Schritt auf der x-
Achse getan. Die Verhältniszahl wird nachgeladen, und der von vorhin
verbleibende Rest wird dazugezählt. Da Additionen für Computer einfach
zu bewältigen sind, ist das eine brauchbare Methode für eine
Computersimulation des Pathfindings.
Pfade können aber auch um Kurven führen, man denke an einen Pfad durch
ein Labyrinth. Dann haben die Pixel entlang des Pfades verschiedene
Vektordaten. Die Schritte, die das pfadfindende Signal tätigt, müssen
dann addiert, und in jedem Neuron von neuem von der Verhältniszahl
abgezogen werden, bis das Ergebnis unter 1 fällt. Dann kann mit dem
Addieren von vorne begonnen werden. Da jede Pfadabweichung bereits im
nächsten Feld (Pixel, Neuron) korrigiert wird, können die Vektordaten
der Felder mit geringer Genauigkeit notiert werden. Es genügen vier
Bit.
Bisher haben wir uns mit der Verbindung von einem aktiven Neuron mit einem entfernten, aus der Vergangenheit noch latent aktivierten Neuron beschäftigt. So wäre zum Beispiel die Glocke in Pawlows Konditionierung zum Zeitpunkt an dem das Futter angeboten wird, im Gehirn noch latent aktiv, und so könnte eine Gehirnwelle, die vom Neuron das Futter repräsentiert ausgeht, eine Verbindung zu Glocke herstellen.
Nun wollen wir der Frage nachgehen, was passiert, wenn gleichzeitig aktive Signale Verbindungen zueinander eingehen. Nehmen wir als Beispiel folgende Punkte, die unser Gehirn zu einem Reh zu verbinden vermag. Es entstehen dabei keine unsinnigen Verbindungen wie in Fig.c. , sondern eine Bahn, die die Punkte nach dem Gesetz der Nähe und der möglichst geradlinigen Fortsetzung verbindet, wie Fig.b.
|
|
|
|
Ich werde später zeigen, dass das Gesetz der geradlinigen Fortsetzung nicht explizit in unser Netz programmiert werden muss, sondern durch die Umwelt erlernt wird, und dass dabei die Balkenrezeptoren in der Sehrinde entstehen. Auch das Gesetz der Nähe bildet sich indirekt im Netz ab, es bedarf dazu aber einer bestimmten Art, wie Verbindungen entstehen, eben der Verbindungsfindung durch Gehirnwellen. Die Wellen kommen ganz automatisch zunächst beim nächstgelegenen Neuron an. So kommen nahe Verbindungen entfernten zuvor.
Die Welle eines aktiven Neurons kann aber, den bisherigen Regeln zufolge, nie zu einem anderen gerade aktivierten Neuron vordringenden, denn beide Neuronen senden Wellen aus, und diese Wellen werden aufeinanderprallen. Sie werden einander stoppen, denn Neuronen übertragen laut obiger Regel nur dann ein Signal, wenn das empfangende Neuron nicht gleichermaßen aktiviert ist. Die in der Grafik rot eingezeichnete Verbindung kann mit den derzeitigen Regeln somit nicht entstehen, weil sich die Wellen nicht überlagern.

Aber was geschieht mit den gestoppten Signalen? Folgende Regel scheint sinnvoll:
|
Kann ein Neuron sein Signal innerhalb der
Ebene nicht weitergegeben, weil alle rundum befindlichen Neuronen
ebenfalls aktiv sind, so bleibt die Aktivität des Neurons aufrecht. |
Diese Regel führt zu einem komplexen Effekt, den ich in der folgenden Grafik darstelle. Innerhalb eines gewissen Bereiches der aneinanderstoßenden Wellen, gibt es keine Weitergabe, weil die Nachbarzellen bereits besetzt sind. Dort tritt diese Regel in Kraft. Außerhalb dieses Bereiches hingegen werden die Signalwege der beiden Wellen verschmelzen, und ihr Gesamtsignal in eine gemeinsame Richtung weitergeben. In dieser Richtung wird ein besonders starker Vektor entstehen (rot eingezeichnet).
In dem Bereich, wo die Wellen einander stoppen, werden die Neuronen das Signal für einen Takt zwischenspeichern, und abwarten bis die Nachbarneuronen abschalten. Dabei polen die Nachbarneuronen, auch deren Vektordaten um (siehe Regel weiter oben). So kann das Signal jetzt in die Fläche mit den bereits vorhandenen Vektordaten einfließen (blau eingezeichnet). Die dabei entstehenden neuen Vektordaten werden zu den vorhandenen addiert, vermischen sich also mit diesen. Die vorhandenen Vektordaten geben eine Richtung vor, in die Signale vorwiegend zu fließen vermögen. Da sich die Signale mit jeder Weitergabe wieder mit den vorhandenen Vektordaten mischen, beschreiben sie eine Kurve. Ihr Weg verläuft zunehmend Richtung Zentrum.

Dieser komplex anmutende Signalweg lässt wohl jeden Leser skeptisch stimmen. Aber bei genauer Betrachtung ist kaum ein anderes System möglich, denn welche Möglichkeiten hätten wir noch?
1. Würden wir unter keinen Umständen eine Überlagerung der Ausbreitungswellen zulassen, so kämen die Signale nie beim anderen Neuron an.
2. Würden wir Signale einfach übereinander fließen lassen, so dass sie die vorhandenen Vektoren ersetzen, anstatt sich zu vermischen, so würden sie die Linien, die zu den Neuronen führen, überschreiben. Wenn wir uns mehr als zwei Punkte vorstellen, so ergibt sich dann das Problem, dass damit Pathfinding meist fehlschlüge. Außerdem würde der Prozess unnötig lange aufrecht bleiben und Rechenzeit verschlingen.
3. Überschreiben wir die Wege nicht, sondern vermischen sie, lassen aber die überlappenden Signale weiterhin beliebig in jede Richtung fließen, so würden die Wellen aller aktiven Neuronen einander beliebig weitflächig überlagern. Die daraus hervorgehenden Vektoren wären ein Gemisch aus allen Richtungen, sie stünden also alle auf Null und könnten keinem Signal den Weg weisen.
Abgesehen von der Einsicht, dass andere Modelle keine Lösung bringen, spricht auch noch die minimale Anzahl an Regeln für das obige System. Die Vektoren sind ja dazu da, dass sie Signalen den Weg weisen. Also werden sie, wenn wir keine Zusatzregeln aufstellen, auch die Fließrichtung der sie überlagernden Welle beeinflussen. Dass die Signale damit „eingesammelt“ werden, ist ein vorteilhafter Nebeneffekt, weil damit ein natürliches Ende des Prozesses einhergeht.
Ein weiterer Nebeneffekt dieses Pathfinding-Modells, den wir alle aus dem visuellen Denken kennen, ist die Unterscheidung zwischen Form und Linie. Es gibt Punktanordnungen, die wir uns als Form merken, und andere, in denen wir Punkte wie auf eine gekrümmte Linie aufgefädelt erkennen. Warum erkennen wir zum Beispiel in der folgenden Grafik eine Punktanordnung entlang einer Linie?

Die Ausbreitungswellen der Punkte sind schematisch dargestellt. Man kann erkennen, dass an der Stelle, wo der rote Pfeil beginnt, die Signale von fünf Punkten einander treffen. Warum entsteht nicht eine Verbindung dorthin? Ganz einfach deshalb, weil noch ein Weg offen steht, wohin das Signal fließen kann (siehe Pfeilrichtung). Zwischen den Punkten hingegen werden auch Signale fließen. Die Bewegungen dieser Signale sind jedoch in dieser groben Darstellung nicht einzeln aufgeschlüsselt. Sie werden zu einer Verbindungskette von Punkt zu Punkt führen. Durch diese Verbindungskette ist die Position der Punkte relativ zueinander definiert.
Etwas komplizierter als die Wahrnehmung einer Verbindungskette erweist sich die Verbindung von rundum verteilten Punkten, die wir als ein Objekt wahrnehmen. Betrachten wir dazu die drei Punkte der folgenden Darstellung. Die von ihnen ausgesandten Wellen werden einander in einem gewissen Bereich überlagern, teilweise aber auch zu einer gemeinsamen Signalfließrichtung ergänzen, wie dies auch entlang der roten Pfeile geschieht. Die Grafik zeigt die Zeitlinien und nicht die Vektoren. Die Bereiche, wo der Übergang von einer Überlagerung der Wellen zu einem Verschmelzen stattfindet, sind unscharf dargestellt. An Stellen wo zwei Signale zu einer Fließrichtung zusammenfinden, entsteht ein besonders starker Vektor, da ja dort deren Vektoren addiert werden (rote Pfeile). Da das rücklaufende Signal den jeweils stärksten Vektor entlangläuft, ist klar, dass sich die drei Punkte zum Zentrum hin verbinden werden. Wir erkennen also ein Objekt. Ein Objekt unterscheidet sich von einer Linie eben genau darin, dass es eine Fläche einnimmt, die ein Zentrum hat.

Die obigen Grafiken wurden durch die Eigenart unserer visuellen Vorstellung begründet, die Punktanordnungen zu Linien und Formen zu gruppieren vermag. Wenden wir nun die Bayes-Regeln auf das System an, so stellen wir fest, dass die Verbindungen sich im Gehirn nicht dauerhaft etablieren werden. Wir müssten immer wieder das gleiche Objekt an der gleichen Stelle der Netzhaut wahrnehmen, und die beteiligten Neuronen dürften dazwischen nicht dauernd durch andere Bilder gereizt werden. Da solche Bedingungen in einer natürlichen Umwelt nicht vorherrschen, werden die Verbindungen wieder verfallen.
Welche Verbindungen können überhaupt bleiben? Nun auf unterster Schicht der visuellen Wahrnehmung werden die Neuronen eine Verbindung mit ihren Nachbarn eingehen, denn im Durchschnitt werden Nachbarneuronen immer ähnlich gereizt sein. Das ist so, weil generell viel mehr Neuronen in den Flächen eines Bildes Platz finden, als an Konturen. In den Flächen sind Nachbarneuronen gleich gereizt.
An Konturen wird es zu Voraussagefehlern kommen. Welche Rolle spielen diese Voraussagefehler? Zunächst ist festzustellen, dass es sich um vorübergehende Voraussagefehler handelt, denn beim nächsten wahrgenommenen Bild liegen die Konturen anderswo. Die lerntheoretische Analyse der Chunkbildung hat ergeben, dass ein Chunk (ein Objekt oder Ereignis) ein voraussagbarer Bereich ist, dem bereits ein eigenes Neuron zugeordnet wurde.
Bei der Voraussage von Ereignissen wird der voraussagbare Bereich von Anfang bis Ende von Vorstellungssignalen durchflossen (Zukunftsbaum). Bei räumlichen Verbindungen (Und-Verbindungen), wo der Zeitpfeil fehlt, gibt es keinen Unterschied zwischen Anfang und Ende, es gibt nur den Voraussagefehler als Grenze. Das Signal startet also an den Voraussagefehlern und durchfließt den voraussagbaren Bereich. Was hindert das Signal anderswo zu starten? Ganz einfach: Es kann innerhalb der Fläche nicht weitergesendet werden, denn die Neuronen, mit denen es vernetzt ist, sind gleichermaßen aktiviert. Wenn wir also von einer Fläche ausgehen, in der alle Neuronen Verbindungen mit ihren Nachbarn erlernt haben, und voraussagen, dass die Nachbarzelle gleiche Aktivierung aufweisen wird, dann starten an den Konturen des Reaktionsbildes, wo Voraussagefehler auftreten, Vorstellungssignale. Sie durchfließen den voraussagbaren Bereich. So ergibt sich folgende Signalflussbewegung:

In Und-Verbindungen gibt es keinen Unterschied zwischen Gegenwart und Zukunft. Jede Voraussage kann also sofort mit dem Signal aus den Sinnen verglichen werden.
Stimmt eine Voraussage nicht mit der derzeitigen Aktivierung des Neurons überein, so entspringt ihr ein neues Vorstellungssignal. Dieses wandert zum nächsten Neuron weiter, um sich mit dessen Aktivierung abzugleichen, und nun entsteht auch dort ein Voraussagefehler. Das geht so lange, bis der ganze Bereich durchflossen ist. Der dabei entstehende Signalfluss wandert ständig von außen zur Mitte des Objektes, wie dies die folgende Grafik zeigt. Ich nenne ihn den „Abziehbild-Signalfluss“.

Im Zentrum des Objektes stoßen wir auf eine neue Situation. Das Signal kann nicht weitergegeben werden, auch nicht nach einem Takt Wartepause. Da ständig neue Signale nachwandern kann es nicht zurückfließen. Diese Situation ist der Schlüsselreiz dafür, dass das Signal aus der Ebene hinaus auf eine neue Ebene weitergegeben wird. Also gilt:
|
Kann ein Signal, trotz einem Takt
Wartepause, nicht innerhalb der Ebene weitergegeben werden, wird es
auf eine neue Ebene projiziert. |
Die Signalfolge, die hier aus der Ebene tritt beschreibt die Form der Fläche, in der es entstanden ist, durch ein Zeitmuster. Eine solche Formbeschreibung hat einen großen Vorteil. Dieses Zeitmuster kann das neuronale Netz durchfließen, und dabei an tausenden zeiterkennenden Einheiten vorbeikommen. So kann eine Form wiedererkannt werden, auch wenn sie sich anderswo im Bild befindet, oder verdreht erscheint. Werden die Zeitabstände relativ zueinander erfasst, so wird die Form auch erkannt, wenn sie verdreht erscheint.
Es wäre auch denkbar, dass der Signalfluss an tiefenflüchtenden Bildbereichen verzögert wird, so dass eine verkürzte Länge gleich viel Zeit braucht um durchflossen zu werden, wie eine unverkürzt gesehene. Dann wäre die Form perspektivisch entzerrt wahrgenommen.
Um Formen in Zeitmuster zu verwandeln benötigt das Pathfinding-Netz nur die eine neue Regel. Höhere Einheiten nützen dabei einfach die Vorstellungssignale der niedrigeren Einheiten, um an deren Bewegungen Formen zu erkennen. Das ist kein unerlaubter Trick, sondern ein Grundprinzip des Gehirns. Höhere Einheiten haben ja keinen direkten Draht zu den Sinnen mehr. Es ist egal an welchen Reaktionsweisen die Formen auf den Projektionsfeldern der Sinnesorgane erkannt werden, es ist nur wichtig, dass die Aktivität einer bestimmten erkennenden Einheit möglichst immer nur auf die eine Form folgt.
Damit jede beliebige Form oder Punktanordnung erkannt werden kann, ist aber noch etwas notwendig, nämlich die Erfassung der Menge an Signalen, die im Zentrum der Figur zusammenfließen. Ich will im Folgenden zeigen, dass sich dazu die Gegenzellen ebenso verschalten müssen:
Wenn wir vom Modell des Abziehbildsignalflusses ausgehen, so zeigt die folgende Grafik Ausgangspunkte, die so verteilt sind, dass ihre Signale zeitgleich am selben Ort zusammenlaufen.
Sind die entstehenden Verbindungen zum Zentrum erst einmal isoliert, so gelten sie als direkt. Das bedeutet, die Signale können nicht mehr vom Zentrum zu den Ausgangspunkten wandern und wieder zurück, weil die Verbindung als direkt gilt. Das bedeutet, sie werden direkt an die Ausgangspunkte weitergegeben. Da diese aber dauerhaft durch die Wahrnehmung aktiviert sind, können sie das Signal nicht aufnehmen. Es kommt also im Zentrum zu der Situation, eines innerhalb der Ebene nicht weiterleitbaren Signals, das somit auf eine neue Ebene projiziert wird. Vom Beginn der Wahrnehmungsverarbeitung bis zum Auftrittszeitpunkt des Signals vergeht umso mehr Zeit, je weiter die Punkte auseinanderliegen. Dieser Zeitabstand wird also die Entfernung beschreiben. Aber was verrät uns wie viele Punkte zusammenfließen?

Es darf bei diesem Zusammenfluss nicht zu einer Vermischung zwischen 1. der Stärke (Dichte) der zusammenfließenden Signale und 2. ihrer Anzahl kommen. Aber wie können diese beiden Informationen im Gehirn erhalten bleiben?
Würde die Trennung von Stärke und Anzahl nicht aufrechterhalten, so käme es in folgendem Fall zu einer Verwechslung: Wenn die verbundenen Zellen nur mit halber Kraft senden, dann kommt es nur zu halber Aktivierung der Gesamtverbindung. Zu halber Aktivierung kommt es aber auch, wenn nur die Hälfte der Zellen senden, denn dann ist ebenfalls nur der halbe Input da. Es stellt sich also die Frage, wie diese Situation von der ersteren unterschieden werden kann.
Die Antwort liegt in den Gegenzellen, die wir schon bei der Darstellung hemmender Verbindungen kennengelernt haben. Ist ein Signal nur halb aktiv, so ist ja auch die Gegenzelle noch halb aktiv, denn ihre Reizung ist immer negativ zu der der Zelle (Man bedenke, dass das Negativ von Grau ebenfalls Grau ist). Also fließt auch dort ein Signal halber Stärke zusammen, wenn alle Zellen mit halber Kraft senden. Senden hingegen nur die Hälfte der Zellen mit voller Kraft, so senden die Gegenzellen gar nicht, also kommt es dort zu gar keinem Signal. Die beiden Situationen können also unterschieden werden.
Wenn wir den Abziehbildsignalfluss nicht auf eine Form, sondern eine Linie, also eine Punktkette anwenden, so wird eine kurze Linie weniger Zeit brauchen, um auf den Mittelpunkt zusammenzufließen, als eine lange. Genau dies ist durch neurophysiologische Experimente bestätigt, wie die folgende Grafik zeigt. Es gibt auch noch eine Unzahl weiterer neurophysiologischer Hinweise, die nahe legen, dass das Gehirn ähnlich arbeitet, wie das hier dargestellte Pathfinding-Netz.

Die Regeln des hier dargestellten Modells zur assoziativen Konditionierung in Raum und Zeit führen auch zur Ausbildung von Balkendetektoren, wie sie im Sehsystem des Gehirns zu finden sind. Konkretere Überlegungen dazu habe ich aber ausgegliedert, um diesen Text möglichst kurz zu halten.
Unser System lässt nun auch eine genaue Definition des Ortes zu, an dem sich die Chunkzelle einer Und-Verbindung entwickelt. Sie entsteht dort wo ein Signal auf eine übergeordnete Ebene projiziert wird. Das Neuron auf dieser Ebene, das das Signal empfängt, ist sozusagen das Chunk-Neuron.
Wie schon erwähnt, werden die meisten Verbindungen aber nicht dauerhaft aufrecht bleiben. Sie verschwinden, sobald die Bayes-Regeln auf sie angewendet werden. Es genügt aber, wenn sie so lange aufrecht bleiben, bis die Wahrnehmung in ein Zeitmuster übergegangen ist, und die Formen an diesem Muster erkannt wurden. Es müssen ja lediglich die Neuronen, welche diese Zeitmuster erkennen, dauerhafte Verbindungen miteinander eingehen, Verbindungen also, deren Neuronen nur auf dieses eine Zeitmuster ansprechen.
Wir haben also nun eine Theorie davon, wie räumliche und zeitliche Verbindungen entstehen, nämlich durch Kontaktfindung. Weiters eine Theorie wann sie aufrecht bleiben, oder verstärkt werden, nämlich bei statistisch relevanter Wiederholung. Schließlich noch eine Theorie, wie sie abgerufen werden, nämlich durch einen Signalfluss von den Voraussageenden, also dort wo Reize wahrgenommen werden, die nicht bereits durch Verbindungen vorausgesagt wurden.
Diese letzte Theorie ist es nun, worauf ich meine Theorie der Aufmerksamkeit und des ästhetischen Triebes aufbauen will. Aufmerksamkeit ist ein Verhalten. Es wird gelenkt. So ergibt sich die Frage, wie solche Reize, die von den nicht voraussagbaren Bereichen von Wahrnehmungen ausgehen, unser Verhalten lenken können? Ich will zunächst eine allgemeine Theorie der Verhaltenslenkung zur Befriedigung von Bedürfnissen erstellen, um dann meine etwas komplexere Theorie der Aufmerksamkeitslenkung durch den Lern- bzw. ästhetischen Trieb zu erklären.
Ein Objekt oder eine Objektkategorie ist nichts anderes als eine konditionierte Verbindung von Eigenschaften, die oft in Kombination wahrgenommen wurden, ein Voraussagebereich. Deshalb führen die Lernregeln zu Chunk-Neuronen, die Objekte repräsentieren. (Wobei dies eine vereinfachte Vorstellung ist, da in diesem Modell nicht nur der Ort, sondern auch die Zeitmuster das Objekt repräsentieren). Die Fähigkeit Zeitabläufe durch Verbindungen zu speichern führt schließlich zu Neuronen, die Ereignisse repräsentieren. „Frühstücken“ wäre ein Beispiel für ein Ereignis. Objekte und Ereignisse verbinden sich zu Ketten, die uns Zukunft vorausahnen lassen, zum Beispiel die Kette von Wahrnehmungen, die unseren Arbeitsweg beschreiben. Es gibt immer mehrere mögliche Zukünfte, je nachdem wie wir in der Welt agieren. So ergibt sich eine verästelte Struktur, die uns von der Gegenwart ausgehend verschiedene Zukünfte visionieren lässt. Bei Zukunftsvorstellungen werden also erlernte verzweigte Verbindungen voraktiviert. Das nenne ich den Zukunftsbaum.
Durch die erlernten Verbindungen fließen Signale von den gegenwärtig durch Wahrnehmung aktivierten Neuronen in die vorgestellte Zukunft. Je nach Wahrscheinlichkeit einer Verbindung, leitet diese die Signale besser oder schlechter weiter. So verlieren sie sich nach einigen Verbindungen. Unser Blick in die Zukunft reicht also nicht beliebig weit.
Unser Körper misst seine Werte wie Blutzucker, Blutverdünnung, Temperatur usw. und vergleicht sie mit Sollwerten. Die Differenz vermittelt er an das Gehirn. Wir empfinden dann ein Bedürfnis.
|
Das Gehirn
vermag Sollwertdifferenzsteigerungen und Sollwertdifferenzsenkungen
vorauszusagen. Von ersteren gehen hemmende Signale in das System, von zweiteren aktivierende. |
Genau wie Sinnesreize gehen diese Bedürfnisssignale nur dann Lernverbindungen ein, wenn sie nicht bereits vorausgesagt werden, wenn also keine Lernblockierung vorliegt. Während vorgestellte zukünftige Situationen ja im Moment nicht durch die Wahrnehmung aktiviert sind, können Bedürfnisse sehr wohl aktiv sein.
Wenn nun ein Vorstellungssignal sich in einen Zukunftsbaum verzweigt, dann polt es, so wie die Wellen zur Kontaktfindung es taten, die Vektoren, also die Fließrichtung in den Zweigen um. Trifft es in dieser vorgestellten Zukunft auf aktive Bedürfnisse, so können diese nun gegen den Zeitpfeil Signale in die Gegenwart senden. Das bedeutet, die Signale der zukünftig vorgestellten Bedürfnisse fließen im Zukunftsbaum zurück bis zur gegenwärtigen Situation. Dabei siegt das stärkste Signal. Dieses nabelt einen Weg im Zukunftsbaum, also eine Zukunftsvorstellung, ab. Dieser Pfad des Zukunftsbaumes stellt jene Zukunft dar, die die stärkste Bedürfnisbefriedigung verspricht. Diese Zukunft ist es, die uns bewusst wird, und die wir dann durch die Handlungen anstreben, die uns in den richtigen Zweig der Zukunft führen.
Diese Handlungen sind
auch Teil des Zukunftsbaumes. Sie waren ja in der Vergangenheit
beobachtbar und sind damit genauso Teil des Zukunftsbaumes, wie
Wahrnehmungen. Jede Handlung sitzt an einer Verzweigung des Baumes, weil
wir in eine andere Zukunft gelangen, wenn wir sie nicht setzen.
|
Der Zweig,
welcher nun voraktiviert ist, ist unser Wille. Die Handlungen, die uns
an unser Ziel führen liegen entlang dieses Zweiges, und werden erst
gestartet, wenn die nötigen Wahrnehmungen uns deutlich machen, dass
wir jetzt zeitlich an der Stelle angelangt sind, wo es gilt zu Handeln. |
Auslöser einer Handlung ist also immer das Aufeinandertreffen des Willenssignals (aus der vorgestellten Zukunft) mit dem jeweiligen Signal aus der Wahrnehmung. Dann ergeht der Impuls weiter an das motorische Zentrum.
Gefühle, wie Schmerz, sind gegenwärtige Sollwertabweichungen. Demgegenüber gibt es auch Emotionen, wie die Angst vor Schmerz. Dies sind prognostizierte zukünftige Sollwertabweichungen. Emotionale Intelligenz bedeutet zu wissen, dass etwas gut ist (gute Zukunft), ohne die Quellen dieses Wissens zu kennen. Das Gehirn speichert selten Quellen. Wozu auch?
Erziehung und Moral gründen darauf, die Zukunftsvisionen von Menschen zu beeinflussen, um sein Handeln zu lenken. Da wird einem Kind z.B. gesagt: „Wenn du nicht gleich aufhörst umzutoben, gibt es nachher nicht die versprochene Eiscreme.“ Also wird unser künstliches System auch erziehbar sein.
Die Welt ist Gegenwart. Das Gehirn kennt Zukunft und Vergangenheit, stellt der Welt somit etwas gegenüber. Daraus geht vermutlich Bewusstsein hervor. Unser Wille ist frei, weil wir oft aus einer Zukunft handeln, die wir fälschlicherweise annehmen, oder die erst durch unser Handeln entsteht. Wir sind damit keine Reiz-Reaktions-Maschinen. Wir funktionieren nicht deterministisch.
Ohne zufällige Bewegungen ist für das Kleinkind nichts über die Kontrolle seines Körpers erlernbar, weil nichts beobachtbar ist. Deshalb nehme ich an, dass zumindest das motorische System im Ursprung Zukunftsaktivitäten aufweist. Durch Beobachtung wird es verschalten und in den Zukunftsbaum eingegliedert. Ein Neuron, das öfter über Verbindungen des Zukunftsbaumes aktiviert wird, braucht seine Sensibilität nicht mehr so hoch zu adaptieren, dass es rauscht. Das Rauschen nimmt ab, die Kontrolle zu.
Alle Zufallshandlungen mit Gegenständen führen zur Entdeckung von deren Eigenschaften, und tragen somit zu deren Wiedererkennbarkeit bei. Zerbrechlichkeit, Wasserlöslichkeit, Gewicht, elektrischer Widerstand usw. All das kann nur spielerisch entdeckt werden, denn die Qualität der gemessenen Eigenschaft bestimmen wir, durch das Einbringen des Messgerätes oder Messverhaltens. Nur die Quantität kommt aus der Umwelt. Die Welt ist also Konstruktion, was ihren qualitativen Teil betrifft. Die Außenwelt besteht nur aus Quantitäten (Quanten), ohne Qualität. Qualitäten gibt es nur in den Repräsentationen der Welt in den Köpfen von Lebewesen.
Die Kontrolle der Motorik erlernen wir also, indem die Neuronen des motorischen Feldes zufallsaktiviert werden und die Neuronen der sensorischen Felder die dabei entstehenden Bewegungen wahrnehmen. Aber woher kommt der Wille zur kontrollierten Bewegung? Der Wille entspringt meiner Theorie zufolge den gegenwärtigen sowie den, durch den Zukunftsbaum voraktivierten Bedürfnissen, und wandert die Äste des Zukunftsbaumes zurück bis in die Gegenwart. Der Lerntrieb ist insofern besonders, als er aufmerksamkeitsgelenkt ist, und ihm kein fixer Sollwert zugrunde liegt.
Die Aufmerksamkeit des
Menschen ist die meiste Zeit nicht durch irgendwelche Grundbedürfnisse
gelenkt, sondern durch Neugierde. Die Psychologie sagt, das freie Spiel
kommt im Kind dann auf, wenn nicht gerade die Befriedigung von
Grundbedürfnissen ansteht und möglich ist. Dieses freie Spiel dient
dazu, mehr von der Welt kennenzulernen. Der
Impuls dazu stammt, meinem Modell zufolge, nicht aus dem Triebzentrum
des Gehirns, sondern er entsteht überall in den Verbindungen, und zwar
immer dort wo ein Voraussagefehler entsteht. Aber welche Wirkung hat
dieses Signal?
Starten wir unsere Überlegungen beim Voraussagefehler. Er tritt auf,
wenn eine Situation beobachtet wird, die durch die vorhergehende
Situation nicht vorausgesagt werden konnte. Das bedeutet aber nicht,
dass die Situation unbekannt ist. Sie war in der Vergangenheit schon da,
nur jetzt kam sie ohne Vorankündigung.
Bis zum Voraussagefehler waren ja Verbindungen vorhanden. Diese
Verbindungen fließt nun das Fehler-Signal gegen den Zeitpfeil zurück.
Eine Situation, die nicht voraussagbar war, kann
ihrerseits aber sehr wohl als Ankündigung für andere Reize bereits
verschalten sein. Sie ist also durch das zurückfließende Signal gegen
den Zeitpfeil durchaus erreichbar. So trifft das Signal, über verworrene
Wege, auf die gegenwärtige Situation. Auf diesen Wegen liegen
Handlungen, die uns wieder in die Situation führen, in der der
Voraussagefehler auftrat.
Was wird passieren? Wir werden Handlungen setzen, die wieder zum
Voraussagefehler führen. Wir wiederholen diese Handlungskette so oft,
bis wir sicher sein können, dass wir das eben noch Unvoraussagbare nun
sicher ansteuern können. Damit haben wir es in eine Voraussagekette
eingebaut. Die Spiele kleiner Kinder, zum Beispiel mit Dose, Inhalt und
Deckel, sind voll von solchen Wiederholungen, mit denen das Kind sein
Vorstellungsvermögen ausbaut. Auch Musizieren ist eine solche Tätigkeit.
Das bedeutet, wenn wir die assoziative Konditionierung richtig
umsetzen, so wird auch dieser Lerntrieb in Kraft treten! Er bildet
meiner Ansicht nach die Basis dafür, dass sich die Welt in einem erkenntnisgewinnenden System zu repräsentieren
beginnt, und vielleicht ist das sogar die Grundlage dafür, dass
Bewusstsein entsteht. Er bildet auch die Basis für ästhetische
Vorlieben, die mit Wiederholung und Mustern zu tun haben, wie die Musik,
der Tanz, Versreime, Muster, aber auch Rhythmische Tätigkeiten wie
Tennisspielen.
Aufmerksamkeit bezieht sich immer auf den größten Voraussagefehler, das stärkste rücklaufende Signal. Dieses ist umso stärker, wenn man sich seiner Voraussage durch viel Wiederholung schon recht sicher ist. So ist der Fehler nach einem langen Ballwechsel im Tennis spannender, als nach einem kurzen.
Wenn ein Tier eine Handlung offensichtlich mit Zukunftsvoraussicht plant, so ist das für uns nicht vorstellbar, ohne Bewusstsein. Aber wir werden diese Fähigkeit auch künstlich erzeugen. Das wird die Diskussion um Bewusstsein, Ewigkeit geistigen Lebens, und um Gott auf eine neue Stufe heben, und unser Denken, ja unsere gesamte Kultur radikaler verändern als die Erfindung künstlicher Bewegung durch die Dampfmaschine, die als Auslöser der industriellen Revolution gilt.
Ein künstlicher Geist wird seine verinnerlichte Welt zu Hause datensichern können. Hat der Träger-Körper einen Unfall, schickt die Versicherung einen neuen Körper und spielt den Geist aus der Sicherung ein. Künstliche Wesen werden in ferner Zukunft mit geeigneter Industrie sich selbst reproduzieren können und das Weltall erobern. Mit ihnen beginnt eine neue Epoche der Evolution. Die Basis für das alles kann nur das Verständnis assoziativen Lernens sein, denn in der Natur ist nur ein Nacheinander, nie ein Wegeneinander beobachtbar (Hume), und somit haben wir alles Wissen über die Welt durch assoziative Verbindungen erworben.
Meine Arbeit bringt mich zu dem Schluss, dass durchaus erklärbar ist, wie ein künstliches Gehirn funktioniert, denn eine Grundstruktur, die eine innere Repräsentation der Welt zu erwerben (erlernen) vermag, ist beschreibbar, bis hin zur Reaktionsweise des einzelnen Neurons. Techniker behaupten, sie könnten alles umsetzen, das einfachen Regeln folgt, nur sei das Gehirn so komplex. Ich behaupte das Gegenteil. Die Regeln des Neurons sind nicht so zahlreich, nur die Fülle der notwendigen Neuronen, die in vier Dimensionen zusammenarbeiten, verhindert eine Umsetzung. Die KI scheitert also nicht an Wissensmangel, sondern am elektronischen Aufwand. Würden mehr Erkenntnistheoretiker dieser Diagnose zustimmen, so könnte man vielleicht die Industrie überzeugen, den notwendigen Aufwand zu finanzieren.