Die Prävalenz-Falle
Insgesamt wirft diese Befundlage zur Fehlerhaftigkeit des RT-PCR-Tests mehr Fragen auf, als sie beantwortet. Eine indische Forschergruppe wertete im April 2020 die Corona-Zahlen aus 210 Ländern aus und korrelierte sie mit demographischen, soziologischen sowie gesundheitspolitischen Daten, auf die ich inhaltlich im Abschnitt „Kontexte“ zurückkomme. Dabei stellten die Forscher verschiedene Ungereimtheiten fest, die auf methodische Mängel der Erhebungen zu Covid-19 zurückzuführen seien: „Die gegenwärtige Form der Diagnostik überschätzt wahrscheinlich die SARS-CoV-2-Infektiosität sowie die Morbidität und Mortalität von Covid-19, da sie darauf abzielt, SARS-CoV-2 in allen vermuteten Grippefällen und allen Todesfällen in den Pandemieregionen nachzuweisen. Eine höhere Anzahl von Fällen wurde in Ländern mit einer hohen Alphabetisierung und stärkeren Volkswirtschaft registriert, die auch über eine höhere Testkapazität verfügen, was ebenfalls darauf hinweist, daß sie möglicherweise überdiagnostiziert wurden. Gegenwärtig folgt das Testen auf COVID-9 nicht dem Ziel, die wahre Verbreitung der Krankheit (disease mapping) zu identifizieren. Bis die Tests nach einem soliden Stichprobenplan durchgeführt werden, kann die tatsächliche Inzidenz und Prävalenz der Krankheit nicht genau bestimmt werden. Wenn keine repräsentativen Erkenntnisse zur wahren Verbreitung der Krankheit vorliegen, sind auch ihre Determinanten nicht korrekt beschreibbar … Ein hoher Anteil falsch-positiver Befunde von Covid-19-Tests hat kostspielige Folgen, die für eine wirksame Seuchenbekämpfung in Kauf genommen werden. Der aktuelle RT-PCR-basierte Labortest zeichnet sich jedoch durch einen hohen negativen Vorhersagewert aus und kann dazu führen, daß eine große Anzahl positiver Fälle übersehen wird, was zur anhaltenden Ausbreitung der Pandemie beitragen kann. Negative RT-PCR-Ergebnisse für Covid-19 erfordern wiederholte Tests, um das negative Ergebnis zu bestätigen. Daher ist ein besserer Test mit höheren positiven und negativen Vorhersagewerten erforderlich, um die wahre Anzahl positiver und negativer Fälle bestimmen zu können.“ (Singh et al. 2020, Übersetzung VK)
Die Strategie, von Personen mit Erkältungssymptomen einen Abstrich für den Labortest zu nehmen, erweist sich also aus mindestens zwei Gründen als fragwürdig: Erstens entsteht auf diese Weise kein realistisches Bild von der Verbreitung von Covid-19, da die Stichprobe nicht repräsentativ ist und Prävalenz sowie Inzidenz nicht bestimmt werden können. In den täglichen Nachrichtenmeldungen wird aber seit Anfang März so getan, als handelte es sich um diese Werte, indem irreführend von täglichen Neuinfektionen und ähnlichem gesprochen wird. Zweitens ist das klinische Bild, das den Corona-Labortest veranlaßt, identisch mit den Anzeichen einer „Grippe“, wie sie durch Influenza und andere Erkältungsviren hervorgerufen wird. Getestet wird aber nur das neue Coronavirus – wahrscheinliche Komorbiditäten mit anderen saisonalen Viren bleiben unerkannt. Eine derartig fragmentarische Diagnostik ist nicht nur für den medizinischen Erkenntnisgewinn unbrauchbar, sondern auch für die Ableitung eines angemessenen individuellen Therapieplans. Daraus wiederum resultieren zahlreiche praktische und ethische Probleme.
Bereits während des Vietnamkrieges, als es darum ging, mit welcher Wahrscheinlichkeit amerikanische Piloten vietnamesische von kambodschanischen Kampfjets unterscheiden können, (CIA, 2008), später bei der Interpretation von massenhaft gespeicherten Fluggastdaten nach 9/11, schließlich auch bei Einstufung der Zahl zu Unrecht verdächtigter Personen bei Rasterfahndungen mit DNA-Tests – immer wenn es sich um große Zahlen handelt, können auch kleinste Meßfehler zu gravierenden Fehlinterpretationen beitragen. Menschen lassen sich in ihrem intuitiven Zahlenverständnis eher vom Augenschein als von bedingten Wahrscheinlichkeiten leiten (Tversky & Kahneman, 1974). So mag ein Patient glauben, wenn ihm der Arzt die Kunde von einem positiven Corona-Laborbefund überbringt, daß er sich also mit 98%iger Sicherheit nun mit Covid-19 infiziert habe, denn der PCR-Test habe doch eine solch hohe Genauigkeit (Spezifität). Dieser Glaube, der gegenwärtig weit verbreitet zu sein und auch von unseren Datenjournalisten geteilt, zumindest nicht aktiv ausgeräumt zu werden scheint, beruht jedoch auf einem folgenschweren Irrtum, der in der Literatur als „Prävalenzfehler“ oder „Base Rate Fallacy“ bekannt ist und ins Erstsemester Statistik gehört. Wenn pro Woche, wie es seit Ende August 2020 in Deutschland der Fall ist, eine Million PCR-Tests durchgeführt werden, dann führt auch eine scheinbar kleine Falsch-Positv-Rate von 2% zu einer immensen Anzahl irrtümlich mit einer Covid-19-Erkrankung („Infektion“) verdächtigter Personen: Nehmen wir an, das neue Coronavirus hat sich bereits bei 1% der Bevölkerung ausgebreitet – diese Zahl wird Prävalenz genannt. Dann sollte der Test bei 10’000 der untersuchten Personen ein positives Ergebnis anzeigen. Mindestens, muß man sagen, denn aufgrund der durchaus realistschen Fehlerquote wird er darüber hinaus bei 2% der 990000 Personen, die keinen Abschnitt des Coronavirus in sich tragen, ebenfalls mit einem positiven Laborergebnis anschlagen: es handelt sich um 19800 falsch positive Laborbefunde, die pro Woche allein durch die Falsch-Positiv-Quote „eingepreist“ werden müssten – davon aber ist in unseren Nachrichten keine Rede. Vielmehr wird irreführend ein positiver Laborbefund mit einer aktiven klinischen Infektion gleichgesetzt, was schlichtweg eine Falschmeldung ist. Tatsächlich beträgt die Wahrscheinlichkeit, erkrankt zu sein, wenn ein positiver Laborbefund vorliegt, bei einer Prävalenz von 1% lediglich 33.5%.
Prävalenz |
Falsch-Positive |
Wahrscheinlichkeit einer Infektion |
0.5% |
19900 |
20.0% |
1% |
19800 |
33.5% |
1.5% |
19700 |
43.2% |
2% |
19600 |
50.5% |
3% |
19400 |
60.7% |
5% |
19000 |
72.5% |
10% |
18000 |
84.7% |
25% |
15000 |
94.3% |
50% |
10000 |
98.0% |
Tabelle 2: Modellrechnung zur Auswirkung der Prävalenz (base rate) auf die Wahrscheinlichkeit, bei einem positiven PCR-Laborbefund tatsächlich mit Covid-19 infiziert zu sein (Parameter: N= 1’000’000, Spezfität 98%, Sensitivität 100%)
Deutlich wird, daß die Wahrscheinlichkeit, mit der bei einem positiven Laborbefund auch von einer tatsächlichen Infektion auszugehen ist, keinesfalls a priori mit 100% anzusetzen ist, sondern maßgeblich von der aktuellen Gesamtzahl der bereits Infizierten, der Basisrate, abhängt. Dabei handelt es sich nicht im epidemiologischen Sinne um die sogenannte „Durchseuchung“, also dier Personen, die die Erkrankung bereits durchstanden haben und damit immun geworden sind, sondern um die Zahl der aktiven Fälle, die mit einem PCR-Test erfasst werden können. Erst wenn jeder Zweite, der einen positiven Laborbefund empfängt, auch klinische Symptome zeigt, können wir von einer 98%igen Wahrscheinlichkeit ausgehen, daß er auch an Covid-19 erkrankt ist.
Die Prävalenz ist also ein ausschlaggebender Faktor, um die täglich im Halbstundentakt vermeldete Zahl der Positivbefunde, die von den Datenjournalisten irrreführend mit der Zahl der Infizierten gleichgesetzt wird, realistisch einordnen zu können. Die Testkapazität hat keinen Einfluß auf die Infektionswahrscheinlichkeit. Bei einer geringen Prävalenz schießt vielmehr bei einer gleichzeitig hohen Testkapazität die absolute Zahl der fälschlicherweise mit einer Covid-19-Infektion in Verbindung gebrachten Personen in die Höhe – was nicht im Sinne der Gesundheitsvorsorge sein kann, aber just zum Herbstbeginn der Fall war. Das Motto „Test, test, test!“ erweist sich damit als irreführend – es kommt vielmehr auf die Qualität der Teststrategie an.
Um die Prävalenz zu messen, benötigt man eine repräsentative Auswahl der Stichprobe. Davon ist die „nationale Teststrategie“ in Deutschland weit entfernt (vgl. „Aktualisierung der Nationalen Teststrategie vom 15.10.2020 auf www.rki.de). Wurden im Frühjahr 2020 selektiv Personen mit Erkältungssymptomen getestet, waren es im Sommer die Urlaubsrückkehrer aus dem Ausland und vor den Herbstferien die Inlandstouristen, die aus Regionen mit höherer Inzidenz in eine Region mit niedrigerer Inzidenz fahren wollten – mit einer wissenschaftlichen Studie, die anhand demographischer Kriterien einen repräsentativen Bevölkerungsquerschnitt testet, hat all das nichts zu tun – Zweifel an der wissenschaftlichen Ernsthaftigkeit der Regierung sind daher mehr als angebracht, mag sie sich selbst noch so häufig als wissenschaftlich orientiert gegenüber der Willkürherrschaft autoritärer Machthaber in anderen Ländern bezeichnen. Die anhaltende Verweigerung, eine fundierte Prävalenzstudie für Deutschland zu initiieren, gibt gesundheitspolitische Rätsel auf.
Seit April 2020 erfaßt das RKI das Vorkommen von Corona-Antikörpern bei Blutspendern (SeBluCo-Studie). Alle zwei Wochen werden ca. 5000 Blutproben gesunder erwachsener Personen von 13 Blutspendediensten, die auf 28 Regionen Deutschlands verteilt sind, auf Seropositivität untersucht. Eine Zwischenauswertung zum 19. August 2020 brachte folgende Ergebnisse: „Der Anteil von Personen mit spezifischen Antikörpern gegen SARS-CoV-2 unter blutspendenden Erwachsenen ist mit 1.25% weiterhin gering.“ Ergänzend wurden bei 65% der Proben ergänzende „Neutralisationstests“ durchgeführt, um falsch-positive Befunde auszuschließen. „Von diesen hatten ca. 27% (96/362) auch nachweisbare neutralisierende Antikörper.“ – d.h., die korrigierte Prävalenz lag im August bei ca. 0.34%. „Die Seroprävalenz war bei Männern signifikant höher als bei Frauen (1.48 bzw. 0.96%) Es wurden Unterschiede in der Altersverteilung der Seropositiven erkennbar. Die drei jüngsten Altersgruppen (18-29 Jahre) der SeBluCo-Teilnehmerinnen und -Teilnehmer zeigen nach Auswertung von ca. 50% der Studiendaten die höchste adjustierte Prävalenz. Die Regionen Freiburg und Bayern Süd-Ost haben den höchsten Anteil an Seropositiven.“ (Quelle: www.rki.de)
Im Hotspot Gangelt ermittelte das Team von Hendrick Streek dagegen eine Prävalenz von 20% – sie kann jedoch ebenfalls nicht als repräsentativ angesehen werden.
In seiner umstrittenen Berechnung des Nutzens des Lockdowns für die Eindämmung der Pandemie ging das Imperial College im Juni 2020 von 0.85 % Prävalenz für Deutschland aus (Flaxman, 2020).
Eine der bisher qualitativ besten Prävalenzmessungen stammt von Mai 2020 aus Brazilien (Hallal et al., 2020). Es wurde eine anhand von 25 Census-Kriterien ausgeglichene Zufallsstichprobe in 133 Städten, proportional zur Bevölkerungsgröße gezogen, mit mindestens jeweils ca. 250 Teilnehmern. Insgesamt nahmen 25955 Probanden an der Studie teil. Es wurde wiederum die Seropositivität bestimmt. Ohne statistische Korrekturen betrug die krude Prävalenz 1.39%.
Im WHO Bulletin vom 15. Oktober 2020 veröffentlichte John Ioannidis eine Übersicht zu allen serologischen Corona-Antikörpertests weltweit seit Beginn der Pandemie (es wurden vor allem Studien während der ersten Welle ausgewertet). Dabei wurden Prävalenzstudien zur Verbreitung des Coronavirus im Krankenhauspersonal oder in bestimmten religösen Gruppen nicht berücksichtigt. Im Ergebnis wurden 61 Studien mit ingesamt 74 Prävalenzschätzungen zusammengetragen – Deutschland war lediglich durch die Streek-Studie in Gangelt und eine Untersuchung in Frankfurt a.M. vertreten. Die Prävalenz schwankte weltweit zwischen 0 und 54.4% (in den Slums von Mumbai). Die Infektions-Fatalitätsquote betrug 0-1.63% (im US-Bundesstaat Louisiana). Aufgrund dieser großen Spannbreite kam Ioannidis zu dem Schluß, daß eine klassische Meta-Analyse, um die Daten mehrerer Studien zusammenzufassen, nicht in Frage komme. Vielmehr gruppierte er die Ergebnisse anhand des globalen Mittelwertes (118 Coronatote / 1 Million Einwohner): in 51 Regionen, die unter diesem Mittelwert lagen, betrug die Fatalitätsquote 0.09%, in Regionen mit überdurchschnittlicher Mortalität schwankte die durchschnittliche Fatalitätsquote zwischen 0.20% und 0.57%. Bei Menschen, die jünger als 70 Jahre waren, lag die krude Fatalitätsquote bei 0.31%, nach statischer Korrektur bei 0.05%.
Ioannidis folgerte, daß die Sterblichkeit an Covid-19 damit deutlich unter den Befürchtungen vom Beginn der Pandemie und den Zahlen aus Wuhan einzustufen sei. Regionale Unterschiede ergeben sich in Folge der Altersstruktur der Bevölkerung, Bevölkerungsdichte und der Vorbelastung mit Atemwegserkrankungen, z.B. in Zusammenhang mit der Luftverschmutzung.
Ioannidis’ Metastudie gibt am Ende beiden Lagern recht: den Alarmisten, die nicht genug vor der Gefährlichkeit des neuen Virus warnen und mahnen können, wie auch den Verharmlosern, die Covid-19 keine besondere Gefährlichkeit zuschreiben: Es hängt jeweils von den Kontextbedingungen ab. In einigen wenigen Regionen übersteigt die Tödlichkeit des neuen Virus um das Zehn- bis Zwanzigfache die Tödlichkeit der bekannten Grippeviren. In vielen anderen Regionen ist es aber im Durchschnitt ähnlich oder sogar weniger gefährlich als die Grippe.
(Den gesamten Beitrag finden Sie im Essay „Zahlenspiele“.)
„Es hängt jeweils von den Kontextbedingungen ab.“
Na, da kann unsere Industrie jetzt Frischluft für alle produzieren und damit einen neuen Markt erschließen. Und dann können wir weiter unsere Produkte um den Erdball transportieren, können weiter die Eltern ihre Kinder zur Sicherheit mit ihren SUVs bis in die Schule gefahren werden, damit sie nicht von anderen SUVs überrollt werden…
Aah, die Schlange.