Warum lieben Menschen kuriose Diagramme? Weil starke Korrelationen verführerisch wirken. Diese Top-10 zeigt die populärsten Scheinkorrelationen – sortiert nach statistischer Prominenz (Häufigkeit in Lehrbüchern, Vorlesungen und Medien). Zu jedem Beispiel: kurzer Kontext, warum kein Kausalzusammenhang vorliegt, und die typische Fehlerquelle (Konfundierung, gemeinsamer Trend, Zufall).
Übersicht
- Eisverkauf vs. Ertrinken/Haibisse
- Nicolas-Cage-Filme vs. Pool-Ertrinken (USA)
- Margarineverbrauch (USA) vs. Scheidungsrate Maine
- Käseverbrauch vs. „im Bettlaken verhedelt“-Todesfälle
- US-Wissenschaftsbudget vs. Suizide durch Erhängen
- Schokoladenkonsum vs. Nobelpreisträger je Land
- Storchenpaare vs. Geburtenrate
- Schuhgröße von Kindern vs. Lesekompetenz
- Anzahl Kirchen vs. Kriminalität einer Stadt
- Zahl der Piraten vs. globale Temperatur
Eisverkauf vs. Ertrinken/Haibisse
Rang: 1
Der Klassiker aus fast jedem Statistik-Kurs: Steigen die Umsätze für Speiseeis, nehmen auch Ertrinkungsfälle und Haibisse zu. Der scheinbare Zusammenhang verschwindet, sobald man den lurking variable Sommer/Wetter kontrolliert. Wärme erhöht Badetage und Menschenmengen am Wasser und damit das Risiko – nicht das Eis.
- Mechanismus: gemeinsamer Treiber „Hitze/Badewetter“
- Lektion: saisonale Muster zuerst prüfen
- Typischer Fehler: Kausalschluss aus zwei Zeitreihen derselben Jahreszeit
- Fehlerquelle
- Konfundierung durch Wetter/Saison
- Beobachtungstyp
- gleichlaufende Saisonkurven
- Quelle
- Penn State STAT 200 – Lurking & Confounding
Nicolas-Cage-Filme vs. Pool-Ertrinken (USA)
Rang: 2
Eine berüchtigte Kuriosität: In Jahren mit mehr Nicolas-Cage-Filmen starben in den USA zufällig mehr Menschen durch Ertrinken in Schwimmbecken. Die Serie ist bewusst absurd, illustriert aber perfekt, wie hochdimensionale Datensammlungen zwangsläufig spektakuläre, aber sinnlose Treffer produzieren.
- Mechanismus: multiple Vergleiche → einige starke, aber zufällige Koinzidenzen
- Lektion: Korrelation ≠ Kausalität; immer vorab Hypothesen definieren
- Typischer Fehler: p-Hacking, Data-Dredging
- Fehlerquelle
- Zufall bei vielen Zeitreihen
- Beobachtungstyp
- spurious match in Popdaten
- Quelle
- Tyler Vigen – Spurious Correlations
Margarineverbrauch (USA) vs. Scheidungsrate Maine
Rang: 3
Beide Zeitreihen fallen über mehrere Jahre – was zusammen eine hohe Korrelation erzeugt. Ein gemeinsamer Trend (Ernährungswandel bzw. langfristige demografische und rechtliche Faktoren) genügt, um eine beeindruckende Korrelation zu liefern, ohne jegliche kausale Brücke zwischen Margarine und Ehen.
- Mechanismus: geteilte Abwärtstrends
- Lektion: erst Differenzen/bereinigte Reihen analysieren
- Typischer Fehler: Trend-Korrelationen als „Beweis“ lesen
- Fehlerquelle
- gemeinsamer Trend
- Beobachtungstyp
- langsame Parallelabnahme
- Quelle
- Tyler Vigen – Spurious Correlations
Käseverbrauch vs. „im Bettlaken verhedelt“-Todesfälle
Rang: 4
Ein weiteres Meme-Beispiel: Pro-Kopf-Käseverbrauch und kuriose Haushaltsunfälle laufen scheinbar synchron. Die visuelle Pointe zeigt, wie leicht sich Menschen von Story-Fit täuschen lassen, wenn zwei Linien verblüffend ähnlich aussehen.
- Mechanismus: zufällige Kopplung seltener Ereignisse mit breiter Konsumreihe
- Lektion: Basisrate und Plausibilität prüfen
- Typischer Fehler: „Looks convincing“ statt Modellprüfung
- Fehlerquelle
- Zufall/Multiple Tests
- Beobachtungstyp
- anektotische Spurious-Charts
- Quelle
- Tyler Vigen – Spurious Correlations
US-Wissenschaftsbudget vs. Suizide durch Erhängen
Rang: 5
Beide Reihen steigen in den 2000er Jahren – das genügt für eine hohe Korrelation. Diese Beispiele sind didaktisch wertvoll, weil sie zeigen, dass gemeinsame Drift (Inflation, Bevölkerungswachstum, Meldepraktiken) Korrelationen erzeugen kann, wo keine Kausalität existiert.
- Mechanismus: parallele Aufwärtstrends
- Lektion: Trends entfernen (Differenzieren, Detrending)
- Typischer Fehler: Zeitreihen ohne Stationaritätscheck korrelieren
- Fehlerquelle
- gemeinsamer Trend
- Beobachtungstyp
- nichtstationäre Reihen
- Quelle
- Tyler Vigen – Spurious Correlations
Schokoladenkonsum vs. Nobelpreisträger je Land
Rang: 6
Die berühmte Korrelationsanalyse aus einem Medizinjournal verband pro-Kopf-Schokoladenkonsum mit Nobelpreis-Dichte. Plausibler ist eine Drittvariable: wirtschaftliche Entwicklung/ Bildungsniveau treibt beides – Genussmittelkonsum und Forschungserfolg. Das Beispiel wird häufig zitiert, weil es in einem seriösen Journal erschien und die Auslegung lustvoll überspitzte.
- Mechanismus: Wohlstand/Bildung als Konfounder
- Lektion: ecological fallacy vermeiden
- Typischer Fehler: Länderaggregate kausal fehlinterpretieren
- Fehlerquelle
- Konfundierung (Wohlstand/Bildung)
- Beobachtungstyp
- Länderaggregate (ökologisches Niveau)
- Quelle
- NEJM – Chocolate Consumption & Nobel Laureates (Messerli, 2012)
Storchenpaare vs. Geburtenrate
Rang: 7
„Störche bringen Babys“ als statistischer Gag: In Regionen mit mehr ländlichen Häusern mit Schornsteinen brüten auch mehr Störche – und dort leben oft mehr Familien mit mehreren Kindern. Der Konfounder „Siedlungsstruktur“ erzeugt die Korrelation zwischen Storchenzahl und Geburten, nicht ein mythischer Lieferdienst.
- Mechanismus: ländliche Bebauung/Schornsteine erhöhen Storchennester und Kinderzahl
- Lektion: räumliche Autokorrelation und Strukturmerkmale prüfen
- Typischer Fehler: ökologische Korrelation als Individualkausalität lesen
- Fehlerquelle
- Konfundierung durch Siedlungsstruktur
- Beobachtungstyp
- räumliche Aggregation
- Quelle
- Wikipedia – Correlation ≠ Causation (Stork-Baby-Beispiel)
Schuhgröße von Kindern vs. Lesekompetenz
Rang: 8
Kinder mit größeren Füßen lesen im Mittel besser – aber nicht wegen der Füße. Der Konfounder „Alter“ erklärt beides: Ältere Kinder haben größere Schuhgrößen und höhere Lesefähigkeit. Dieses Beispiel illustriert ideal die Notwendigkeit, innerhalb von Altersgruppen zu vergleichen oder Alter zu kontrollieren.
- Mechanismus: Alter → Schuhgröße und Lesen
- Lektion: stratifizieren oder multivariat modellieren
- Typischer Fehler: Aggregatvergleich über Altersmischungen
- Fehlerquelle
- Konfundierung durch Alter
- Beobachtungstyp
- Individualdaten ohne Kontrolle
- Quelle
- OpenIntro Statistics – Confounding & Lurking Variables
Anzahl Kirchen vs. Kriminalität einer Stadt
Rang: 9
Mehr Kirchen, mehr Kriminalität – klingt provokant, ist aber ein Bevölkerungs-Konfounder: Große Städte haben mehr Menschen, mehr Kirchen und mehr Straftaten. Korrigiert man auf Einwohnerzahl (pro-Kopf-Raten), verschwindet der Zusammenhang.
- Mechanismus: Stadtgröße/Bevölkerungsdichte als Treiber beider Variablen
- Lektion: Raten statt Rohzahlen vergleichen
- Typischer Fehler: Rohzählungen ohne Skalierung
- Fehlerquelle
- Konfundierung durch Population
- Beobachtungstyp
- Aggregatdaten Stadtvergleich
- Quelle
- Penn State STAT 200 – Simpson & Confounding Examples
Zahl der Piraten vs. globale Temperatur
Rang: 10
Pastafarianische Satire mit ernstem Kern: Während die Zahl (klassischer) Piraten seit dem 19. Jahrhundert sank, stieg die globale Durchschnittstemperatur. Der Gag illustriert, wie gefährlich historische Langzeittrends ohne physikalisches Modell sind: Fast jede monotone Zeitreihe korreliert mit einer anderen.
- Mechanismus: gegenläufige, monotone Trends
- Lektion: physikalische/kausale Plausibilität ist Pflicht
- Typischer Fehler: historische Illustrationen ohne Modellprüfung
- Fehlerquelle
- Trend-Koinzidenz
- Beobachtungstyp
- langfristige Zeitreihen
- Quelle
- Wikipedia – Pirates & Global Warming (FSM)

