Im Jahr 1956 veröffentlichte der Kognitionspsychologe George A. Miller an der Harvard University einen Aufsatz mit dem bewusst gesprächigen Titel The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information. Miller war etwas Seltsames an der menschlichen Kognition aufgefallen: quer durch viele Bereiche — Ziffernabruf, Tonunterscheidung, Geschmacksidentifikation — brach die Leistung bei etwa sieben Elementen ein. Die Zahl sah aus wie ein fundamentales Merkmal der menschlichen Informationsverarbeitung. Spätere Arbeiten (vor allem Nelson Cowans Übersicht von 2001) drückten die Zahl nach unten: eher vier, sobald man das Chunking kontrolliert. Das Arbeitsgedächtnis — der kognitive Notizblock, auf dem Information für die laufende Aufgabe aktiv bleibt — hat eine harte, kleine, erstaunlich stabile Kapazität, und sie begrenzt fast jeden komplexen Denkakt, zu dem ein Mensch fähig ist.
Das Arbeitsgedächtnis ist das aktive Halten und Bearbeiten von Information über eine Spanne von Sekunden bis zu einer Minute — abgegrenzt nach unten gegen passive Kurzzeitspeicherung, nach oben gegen das dauerhafte Langzeitgedächtnis. Alan Baddeleys und Graham Hitchs Architektur von 1974, seither verfeinert, beschreibt es als eine zentrale Exekutive — Aufmerksamkeitssteuerung, Konfliktauflösung, Aufgabenwechsel —, die einen kleinen Satz spezialisierter Puffer koordiniert: eine phonologische Schleife mit subvokalem Wiederholungsmechanismus für verbales Material, einen visuell-räumlichen Notizblock für visuelles und räumliches Material und einen später nachgereichten episodischen Puffer, der über Modalitäten hinweg integriert und das Langzeitgedächtnis anbindet. Die Kapazität liegt zu jedem Zeitpunkt bei rund vier gelernten Chunks. Die scheinbare Erweiterung beim Experten ist meist verkapptes Chunking: wo der Anfänger ein Schachbrett als fünfundzwanzig einzelne Figuren sieht, sieht der Meister eine Handvoll strategischer Chunks, die je ein vertrautes Muster komprimieren — ein Befund, den Chase und Simon in den 1970ern nach de Groots früheren Arbeiten festklopften. Das zelluläre Substrat ist anhaltendes Feuern im präfrontalen und parietalen Cortex — Goldman-Rakics Affenableitungen in den 1980ern zeigten einzelne PFC-Neuronen, die reizspezifische Information über Verzögerungsphasen hinweg hielten, auch ohne dass der Reiz noch da war.
Die schmale Kapazität wirkt sich quer durch die Kognition aus. Maße des Arbeitsgedächtnisses korrelieren mit fluider Intelligenz bei rund 0,5–0,7 — eine der stärksten Beziehungen der Kognitionspsychologie —, und individuelle Unterschiede sagen Leseverstehen, mathematische Leistung und Schulerfolg voraus. Schlussfolgern verlangt, Prämissen zu halten, während man auf ihnen operiert; tief geschachtelte Argumente erschöpfen den Puffer rasch. Komplexe Entscheidungen fallen unter Teilinformation, weil der Rest nicht hineinpasst. Arithmetische Leistung ist, wie Dehaenes Arbeit gezeigt hat, scharf dadurch begrenzt, wie viele Zwischenergebnisse sich gleichzeitig im Kopf halten lassen. Expertise tauscht Chunks aus dem Langzeitgedächtnis gegen Last im Arbeitsgedächtnis ein, weshalb der Fachmann über deutlich verzwicktere Lagen nachdenken kann als der Anfänger im selben Feld — er hat die Speicherung ausgelagert. Arbeitsgedächtnis-Training hat sich am schlechtesten gehalten: Cogmed und n-Back erzeugen kleine aufgabenspezifische Gewinne, die kaum auf allgemeine Kognition übertragen, und die starken Transfer-Behauptungen der frühen 2010er haben sich weitgehend nicht replizieren lassen. Die Kapazität, die Miller 1956 bemerkte, ist im Rückblick das Nadelöhr, durch das der größere Teil bewusster Kognition hindurchmuss — und sie ist weitgehend festgelegt.
Der Begriff prägt heute, wie wir über künstliche Intelligenzen denken: Das Kontextfenster eines großen Sprachmodells ist sein Arbeitsgedächtnis — eine feste, begrenzte Spanne aktiver Token, die einschränkt, worüber es in einem einzigen Durchgang nachdenken kann; das Ringen, dieses Fenster zu erweitern, spiegelt genau jenen Engpass, den Miller benannte. In der Pädagogik macht die Cognitive-Load-Theorie aus der Vier-Chunk-Grenze ein Gestaltungsprinzip: ausgearbeitete Lösungsbeispiele, portionierte Lernsequenzen und ausgelagertes Nachschlagematerial sollen Lernende unter der Decke halten. Klinisch zeigen sich Defizite des Arbeitsgedächtnisses bei ADHS, im gesunden Altern und bei Schizophrenie. Und das kommerzielle Versprechen des Gehirnjoggings, die Grenze anzuheben, ist an gescheiterter Replikation weitgehend zerbrochen — die Kapazität bleibt hartnäckig fix, und gerade deshalb bleibt Expertise, nicht Training, der einzig verlässliche Weg um sie herum.