Ich habe meine Lektüre des Buchs „Lügen mit Zahlen“ fortgesetzt. Ich bleibe bei meiner Einschätzung, dass das ein gutes Buch ist. Leider vermeiden die Autoren, allzu mathematisch zu werden. Oft ist das durchaus angebracht. Schließlich verstecken viele Statistiken systematische Fehler hinter mathematisch exakt wirkenden Zahlen. Beim Simpson-Paradox gibt es jedoch eine simple mathematische Erklärung, die so nicht einmal in Wikipedia steht. (Aber, wie gesagt, für Wikipedia schreibe ich nichts mehr. Wenn Sie wollen, versuchen Sie die unten stehenden Erklärungen dort einzufügen. Vielleicht mit Zitat?)
Bekannt wurde das Paradox durch die Beobachtung, dass in der University of California Frauen insgesamt deutlich seltener für Graduate Courses angenommen wurden, während in den einzelnen Departements Frauen gleich oft oder öfter angenommen wurden. Wie ist das zu erklären?
Nehmen wir an, die Annahmequoten in den einzelnen Fächern bei den Frauen seien
\(p_1 = \dfrac{k_1}{m_1}, \ldots, p_n = \dfrac{k_n}{m_n} \)
mit den jeweiligen Annahmezahlen im Zähler und den Gesamtzahlen der Bewerberinnen im Nenner. Die Gesamt-Annahmequote ist dann
\(p = \dfrac{k_1+\ldots+k_n}{m_1+\ldots+m_n} \)
Die Frage ist, ob die einzelnen Quoten steigen können, und dabei gleichzeitig die Gesamtquote sinkt. Schreibt man die Gesamtquote in der Form
\(p = q_1 p_1 + \ldots + q_n p_n \)
mit
\(q_i = \dfrac{m_i}{m_1+\ldots+m_n} \)
für i=1 bis i=n, so wird doch aber klar, dass hier einfach ein gewichtetes Mittel der Einzelquoten vorliegt. Die Summe der Gewichte ist 1. Solange sich die Gesamtzahlen in jedem Fach nicht ändern, wird die Gesamtquote mit den Einzelquoten steigen und sinken. Das braucht jedoch nicht der Fall zu sein!
In Berkley waren zum Beispiel einfach die Gesamtzahlen der Frauen in den Fächern am höchsten, die die geringste Zulassungsquote hatten. Die Frauen haben sich also für die Fächer beworben, bei denen die Chancen am schlechtesten waren. Und obwohl in jedem einzelnen Fach die Frauen (vielleicht aufgrund ihrer Leistung) bevorzugt wurden, entstand durch die Gewichtung eine geringere Gesamtquote als bei den Männern. In obiger Gleichung war bei den Männern also die Gewichtung da größer, wo die Annahmequote größer war. Damit machten sie ihre in jedem Fach geringere Annahmequote wieder wett. Frauen sollten sich eben auch für die technischen Berufe interessieren!
Dies erklärt auf einfache Weise, wie das Paradoxon zustande kommt. Bei gleichen, oder sogar geringeren Einzelquoten kann man durch Änderung der Fallzahlen in jeder Kategorie beliebige Gesamtquoten zwischen dem Minimum und dem Maximum der Einzelquoten konstruieren.
Es sind auch Beispiele mit n=2 denkbar. „Lügen mit Zahlen“ zitiert den Fall eines Medikamententests in zwei komplett unterschiedlichen Behandlungszentren. Es ist möglich, dass Medikament A in jedem Zentrum besser abschneidet (als prozentualer Anteil von Geheilten an der Zahl der Anwendungen) als Medikament B, aber nicht in beiden Einheiten zusammen. Das ist natürlich dann der Fall, wenn das Medikament A in der Einheit viel öfter eingesetzt wurde, wo die Patienten sind, für die es schlechter geeignet ist.
Um das Paradoxon zu umgehen, muss man lediglich dafür sorgen, dass die Gewichtungen identisch sind. Im Fall der Medikamente muss man also beide Medikamente in jedem Zentrum gleich oft einsetzen, oder einfach die gleiche Anzahl Patienten (eventuell zufällig gezogen) in die Gesamtzahl einfließen lassen. Meldet man beim Medikament A 10 Patienten für die Gesamtzahl und bei Medikament B 100, so hat die gesamte Heilungsquote keine Aussagekraft mehr.