Zupft man eine Gitarrensaite und dann eine gleiche Saite mit der doppelten Länge, klingt die zweite eine Oktave tiefer — die Länge halbieren heißt die Frequenz verdoppeln. Das Ohr hört beide als denselben Ton im Abstand einer Oktave, eine Beziehung, die Pythagoras (~530 v. Chr.) entdeckte und auf der die westliche Musiktheorie steht. Das Ohr hört Frequenzverhältnisse, keine Differenzen: 440 Hz und 880 Hz erscheinen als derselbe Ton, eine Oktave auseinander; 880 Hz und 1320 Hz, durch dieselbe Differenz getrennt, werden als Quinte gehört, nicht als derselbe Ton. Das Ohr arbeitet logarithmisch, und genau diese Einsicht — verallgemeinert über die wichtigsten Intervalle (Oktave 2:1, Quinte 3:2, Quarte 4:3, große Terz 5:4, kleine Terz 6:5) — ist die mathematische Grundlage unter jedem Akkord und jeder Tonleiter in nahezu jeder musikalischen Tradition.
Tonhöhe und Frequenz sind nicht dasselbe: Frequenz ist eine physikalische Größe (Hz), Tonhöhe ist Wahrnehmung, und der Zusammenhang ist näherungsweise logarithmisch — das Verhältnis zwischen Frequenzen entscheidet, welches Intervall das Ohr hört. Die gleichschwebende Temperatur, seit dem 18. Jahrhundert Standard der westlichen Musik, teilt die Oktave in zwölf gleiche Halbtöne, jeden im Verhältnis 2^(1/12) ≈ 1,0595 — eine kleine Lüge gegenüber den Verhältnissen der reinen Stimmung (3:2 für die Quinte, 5:4 für die große Terz), aber der Tausch, den Bach im Wohltemperierten Klavier (1722) einging: überall leicht verstimmte Intervalle dafür, dass sich in jeder Tonart spielen lässt, ohne umzustimmen. Andere Systeme existieren — die pythagoreische Stimmung, die reine Stimmung, die mitteltönige Stimmung, das 22-Shruti-System der indischen Klassik, die Vierteltöne arabischer Musik, die Skalen Slendro und Pelog des Gamelan —, doch die gleichschwebende Temperatur ist 2025 weltweit dominant, weil es die westliche Popmusik ist. Die Physiologie dahinter ist die Cochlea, das spiralförmige Organ im Innenohr; sie führt eine Art biologische Fourier-Transformation aus, verschiedene Frequenzen erregen verschiedene Stellen der Basilarmembran. Die Anordnung ist physikalisch logarithmisch, deshalb ist die Tonhöhenwahrnehmung logarithmisch, und die kritischen Bandbreiten der Cochlea erklären, warum Intervalle nahe am Einklang rau klingen, warum konsonante Intervalle glatt klingen und warum Musik genau die Frequenzverhältnisse hat, die sie hat. Die pythagoreische Entdeckung war empirisch (Saitenlängenverhältnisse, die konsonante Intervalle ergeben) und wurde lange in Kleinzahlverhältnissen gedeutet, bevor die physikalische Erklärung über die Obertonreihe — jeder Ton enthält Obertöne bei ganzzahligen Vielfachen des Grundtons, konsonante Intervalle teilen viele davon — ausgearbeitet wurde.
Die heutige Musikproduktion ruht auf der gleichschwebenden Temperatur: der MIDI-Standard (1983) verdrahtet die Zwölfton-Gleichstufigkeit fest in jede digitale Audio-Workstation, Auto-Tune (1997) zieht aufgenommene Tonhöhen auf den nächstgelegenen Halbton, Synthesizer sind voreingestellt gleichschwebend gestimmt. Streaming-Dienste führen die überwältigende Mehrheit der aufgezeichneten Musik in gleichschwebender Stimmung, und die KI-Musikgenerierung (Suno, Udio, MusicLM, MusicGen) arbeitet fast ausschließlich darin, weil die Trainingsdaten das tun. Mikrotonale Musik (Harry Partch, Ben Johnston, La Monte Young, die heutige 31-EDO-Szene) bleibt eine lebendige, aber kleine Tradition, und die indische Klassik, das arabische Maqam und der Gamelan halten an ihren eigenen Stimmsystemen fest. Die tiefe Tatsache (logarithmische Tonhöhenwahrnehmung) und die kulturelle Entscheidung (gleichschwebende Stimmung) lohnen beide das Verstehen.