PolymathicAlle Ideen →
Mathematik

Wahrscheinlichkeitsverteilungen

Die Form einer Zufallsvariable — gleichverteilt, normal, poissonsch, jede fängt eine andere Art von Zufall ein.

Die Wahrscheinlichkeitsrechnung hat ein Bestiarium. Jede benannte Verteilung ist eine eigene Gestalt des Zufalls, zugeschnitten auf eine bestimmte Art von Vorgang. Die Binomialverteilung zählt Erfolge in einer festen Zahl von Versuchen. Die Poisson-Verteilung zählt Ankünfte in einem Zeitfenster. Die Exponential-Verteilung misst die Wartezeit zwischen Ankünften. Die Normal-Verteilung beschreibt, wie Mittelwerte typischerweise aussehen. Das Potenzgesetz erfasst Ungleichheit. Jede Verteilung trägt ihre eigene Ikonographie — die Glocke, den langen Schwanz, die schmale Spitze —, und das Bestiarium zu lernen ist der größte Teil dessen, was „statistische Intuition“ eigentlich heißt.

Eine Wahrscheinlichkeitsverteilung ist eine vollständige Beschreibung des Verhaltens einer Zufallsvariablen — ein Rezept, das angibt, wie wahrscheinlich jeder mögliche Wert ist. Für diskrete Zufallsvariablen ist die Beschreibung eine Wahrscheinlichkeitsmassenfunktion p(x), die jedem Wert eine Wahrscheinlichkeit zuordnet und sich über alle Möglichkeiten zu eins summiert. Für stetige Zufallsvariablen ist die Beschreibung eine Wahrscheinlichkeitsdichtefunktion f(x) — keine Wahrscheinlichkeit eines einzelnen Wertes (die wäre null), sondern eine Dichte, deren Integral über ein Intervall die Wahrscheinlichkeit angibt, in diesem Intervall zu landen. Die großen Familien bilden eine Art Periodensystem. Gleichverteilungen stehen für vollständige Unwissenheit über einen beschränkten Bereich. Bernoulli steht für einen einzelnen Ja/Nein-Versuch. Die Binomial-Verteilung verallgemeinert Bernoulli auf N Versuche. Die geometrische Verteilung zählt Versuche bis zum ersten Erfolg. Poisson beschreibt seltene unabhängige Ereignisse, die mit konstanter Rate eintreffen (radioaktive Zerfälle, Kundenankünfte, Mutationen pro Generation). Die Exponential-Verteilung liefert die Wartezeit zwischen Poisson-Ereignissen. Die Normal-Verteilung (die Glockenkurve) beschreibt die Summe vieler kleiner unabhängiger Beiträge — ihr Erscheinen erzwingt der Zentrale Grenzwertsatz. Gamma und Beta verallgemeinern Exponential und Gleichverteilung und dienen als konjugierte Priors in der bayesschen Inferenz. Potenzgesetz-Verteilungen beschreiben Phänomene, in denen eine große Sache viele kleine beherrscht — Vermögen, Stadtgrößen, Erdbebenmagnituden — und tragen schwere Ränder, die die Normalverteilung dramatisch unterschätzt. Jede Verteilung trägt Parameter, die sie an Daten anpassen; die statistische Inferenz besteht weitgehend darin, eine Familie zu wählen und diese Parameter zu schätzen.

Warum es jetzt zählt

Jedes angewandte statistische Modell wählt eine Verteilung als sein Rauschmodell oder seinen generativen Vorgang. Die lineare Regression setzt normalverteilte Residuen voraus. Die logistische Regression setzt Bernoulli-Ausgänge voraus. Die Überlebenszeitanalyse arbeitet mit Weibull- oder Exponentialverteilungen. Das Reinforcement Learning greift auf kategoriale Verteilungen über Handlungen zurück. Die statistische Mechanik greift zur Boltzmann-Verteilung, um Energieniveaus in einem thermischen System zu beschreiben. Die Versicherungsmathematik greift zunehmend zu Verteilungen mit schweren Rändern, denn katastrophale Risiken erweisen sich als nicht normalverteilt — eine Lehre, die die Finanzkrise von 2008 jenen Firmen schmerzlich erteilte, deren Risikomodelle Normalität unterstellt hatten.

WeiterführendWassermans All of Statistics (2004) bietet die kompakte Tour für die arbeitende Data Scientist; für tiefere mathematische Grundlegung ist Casella und Bergers Statistical Inference (2001) der Standardtext auf Graduate-Niveau. Ross' A First Course in Probability (2019) ist der sanfteste Einstieg. Die Poisson-, Exponential- und Gamma-Familien lehrt Pitmans Probability (1993) am eindringlichsten. Für eine moderne bayessche Rahmung derselben Familien ist Gelman u. a., Bayesian Data Analysis (2013), die Referenz.
In Polymathic lesen →Den Katalog durchstöbern
Polymathic — ein kuratierter Katalog der Ideen, die es wert sind, behalten zu werden, quer durch zwölf Disziplinen. polymathic.app