Zufallsvariablen

Eine Funktion von Ergebnissen auf Zahlen — der Schritt, der die Wahrscheinlichkeitsrechnung das ganze Werkzeug der Analysis ausleihen lässt.

Als Nächstes empfohlen → Gesetz der großen Zahlen · MATH

Der Beitrag

Zwei Jahrhunderte nach Pascal und Fermat war die Wahrscheinlichkeitsrechnung die Lehre von Ereignissen — die Münze fällt Kopf, die Karte ist eine Dame, zwei Würfel summieren sich zu sieben. Die Arithmetik trug, aber die Theorie ließ sich nur schwer mit der Analysis verheiraten, die der Rest der Mathematik parallel entwickelte. Der Durchbruch war ein notationeller Kniff, so schlicht, dass man ihn übersehen kann: nicht länger über das Ereignis selbst zu sprechen, sondern über eine Zahl, die vom Ausgang abhängt. Definiere die Anzahl der Köpfe in zehn Würfen, die Summe der Würfel oder die Wartezeit bis zum nächsten Bus als eigenständige Objekte. Tust du das, ergießt sich der Apparat der Analysis — Ableitungen, Integrale, Grenzwerte — durch die offene Tür in die Wahrscheinlichkeit, und das Fach wird zu der vereinigten Disziplin, die wir heute lehren.

Formal ist eine Zufallsvariable X eine Funktion vom Stichprobenraum Ω in die reellen Zahlen, mit der technischen Forderung, dass das Urbild jeder vernünftigen Teilmenge von ℝ in Ω messbar ist. Die technische Forderung ist eine maßtheoretische Feinheit, die widerspruchsfreie Wahrscheinlichkeitszuweisungen sichert; der begriffliche Gehalt ist schlicht eine Zahl, die du ablesen kannst, sobald das Experiment gelaufen ist. Zufallsvariablen treten in zwei Hauptarten auf. Diskrete Zufallsvariablen nehmen Werte in einer abzählbaren Menge an: die Anzahl der Köpfe in N Würfen, die Zahl der Kunden, die in einer Stunde eintreffen, die Farbe einer gezogenen Karte, codiert als 1–4. Stetige Zufallsvariablen nehmen Werte in einem Kontinuum an: die Größe einer zufällig gewählten Person, die Wartezeit bis zum nächsten Erdbeben, der schwankende Kurs einer Aktie. Beide Arten werden durch ihre Verteilungsfunktion F(x) = P(X ≤ x) beschrieben, die angibt, wie wahrscheinlich die Variable unterhalb eines gegebenen Wertes bleibt. Aus der CDF leitet man die Wahrscheinlichkeitsmassenfunktion (diskret) oder die Wahrscheinlichkeitsdichtefunktion (stetig) ab; sie tragen den vollen statistischen Gehalt. Der tiefe Lohn liegt darin, dass die ganze Analysis greifbar wird: man bildet Erwartungswerte (Integrale), berechnet Varianzen (mehr Integrale), beweist Konvergenzsätze und lässt die ganze Maschinerie der Analysis auf die Ungewissheit los. Ohne Zufallsvariablen lässt sich der Zentrale Grenzwertsatz nicht einmal formulieren, geschweige denn beweisen.

Warum jetztJedes angewandte Wahrscheinlichkeitsmodell der modernen Wissenschaft und Technik ist um Zufallsvariablen herum gebaut. Simulationen der Teilchenphysik modellieren Zerfallszeiten, Streuwinkel und Detektorrauschen als Zufallsvariablen. Verlustfunktionen des maschinellen Lernens sind Erwartungswerte von Zufallsvariablen (der Verlust als Funktion eines zufälligen Trainingsbeispiels). Die Zuverlässigkeitstechnik behandelt die Zeit bis zum Ausfall als Zufallsvariable mit gewählter Verteilung. Finanzmodelle behandeln Renditen, Volatilitäten und Schockereignisse als Zufallsvariablen. Der begriffliche Sprung — vom Ereignis zur Zahl, die vom Ausgang abhängt — ist die Brücke, über die die Wahrscheinlichkeit Einlass in den Rest der quantitativen Wissenschaft findet.