Ich habe gerade einen Blog gelesen (und auch kommentiert), in dem ein interessantes Problem anschaulich und auf mathematisch korrekte Weise erläutert wird. Ich habe zwar einige Einwände, ob in der Realität die gemachten Voraussetzungen stimmen oder ein wenig korrigiert werden müssen, aber die Mathematik bleibt korrekt. Wie so oft im Internet, ist der Blogeintrag schon älter, und geht daher gerne mal verloren. Mein Kommentar dort macht wohl nach all der Zeit wenig Sinn.
Hier also das Problem: Ein Ereignis trete mit einer Wahrscheinlichkeit p auf. Wir erkennen es aber nur mit einer Wahrscheinlichkeit a. Wenn es nicht eintritt, so täuschen wir uns mit einer Wahrscheinlichkeit b, und behaupten, es wäre doch eingetreten. In der Praxis ist a gewöhnlich nahe bei 1, und b recht klein.
Ein Beispiel ist ein Zwangstest auf HIV. p ist da sehr klein, sagen wir 0.1%, entsprechend der Rate der HIV-Positiven in der Gesamtbevölkerung. Die positive Erkennensrate von HIV liegt recht hoch, sagen wir bei 99%. Allerdings werden 1% der nicht HIV-Positiven fehlerhaft als positiv getestet. (Die Zahlen sind von mir frei erfunden.)
Die Frage ist nun, mit welcher Wahrscheinlichkeit das Ereignis eingetreten ist, wenn wir es beobachtet haben. Mit bedingten Wahrscheinlichkeiten ausgedrückt: Wie ist die Wahrscheinlichkeit für das Ereignis unter der Bedingung, dass wir es beobachtet haben?
Ich hatte schon an anderer Stelle darauf hingewiesen, dass man sich am leichtesten ein Experiment vorstellt. Wir nehmen an, dass wir unseren HIV-Test an zufälligen Personen vornehmen. Dann erwarten wir natürlich
\(p \cdot a+(1-p) \cdot b \)
positive Ergebnisse. Tatsächlich aufgetreten ist das Ereignis unter all diesen positiven Tests nur in
\(p \cdot a \)
Fällen. Also erhalten wir als Antwort auf unsere Frage
\(w = \dfrac{p \cdot a}{p \cdot a + (1-p) \cdot b} \)
Dieser Ausdruck gibt an, welcher Bruchteil von den positiv getesteten auch tatsächlich HIV-positiv ist.
Im Beispiel mit dem erzwungenen Massentests ist dieser Ausdruck ungefähr gleich 9%. Das ist doch ein bemerkenswertes Ergebnis! Es bedeutet, dass es eher unwahrscheinlich ist, HIV-positiv zu sein, wenn man zwangsweise zu einem solchen Test geladen wird, und der Test positiv ausgefallen ist.
Mehr oder weniger drastisch trifft dies auf alle Vorsorgetests zu, die eine Fehlerrate b haben, die relativ zu der Ausgangswahrscheinlichkeit p groß ist.
Man muss allerdings beachten, dass p nicht immer leicht zu bestimmen ist. Wenn es sich nämlich um einen freiwilligen Test handelt, so ist die Wahrscheinlichkeit HIV-positiv zu sein unter denen, die den Test auf sich nehmen, sicher erheblich höher. Das gleiche gilt bei Tests, die aufgrund einer Vorsorgeuntersuchung mit kritischem Ergebnis vorgenommen werden.
Um die Verhältnisse genauer einzusehen und eine praktische Faustformel herzuleiten, betrachten wir den Kehrwert dieser bedingten Wahrscheinlichkeit in der Form
\(\dfrac{1}{w}= 1 + \left( \dfrac{1}{p} – 1 \right) \cdot \dfrac{b}{a} \)
und setzen dann
\(K := \dfrac{1}{w} – 1 \)
Dieser Ausdruck die Wahrscheinlichkeit für einen korrekt positiven Test in der Form 1:K an. Das bedeutet, dass einem richtigem Ergebnis (korrekt positiv getestet) K falsche (falsch positiv getestet) gegenüber stehen. Je größer K, desto schlechter für den Test.
Für b<a erhalten wir auf jeden Fall
\(K > \dfrac{b}{p}-1 \)
und, da b klein ist, eher
\(K \sim \dfrac{b}{p} \)
Das ist tatsächlich auch eine sehr gute Abschätzung (nennen wir sie mal „Grothmannsche Faustformel“), wenn b und p gegen 0 gehen, und a gegen 1 geht. Im Beispiel kommt hier K=10 heraus, was den oben berechneten 9% gut entspricht.