Am 11. Juli 2020 meldete die Tagesschau:
Bundeswirtschaftsminister Peter Altmaier hält eine Lockerung der Maskenpflicht für möglich, wenn die Zahl der Corona-Neuinfektionen pro Tag auf unter 100 sinkt. Solange es in Deutschland im Durchschnitt täglich mehrere hundert neue Infizierte gebe, werde die Pflicht überall dort bleiben müssen, wo der Mindestabstand von 1,5 Meter nicht eingehalten werden könne, sagte der CDU-Politiker der "Frankfurter Allgemeinen Zeitung". Auf Nachfrage fügte er an: "Wenn wir bei den Infektionen dauerhaft zweistellig sind, müssen Mediziner und Politik neu nachdenken." [1]
Ob er es wusste oder nicht: die Maskenpflicht wäre unter diesen Umständen endlos. Um das zu verstehen, muss man sich genauer mit den offiziellen Zahlen des Robert-Koch-Instituts RKI beschäftigen.
Woher kommen die Daten?
Das RKI wurde in diesem Jahr einer breiten Öffentlichkeit bekannt. Es veröffentlicht die Daten zu COVID-19, die im Frühling in täglichen Pressekonferenzen verbreitet wurden und inzwischen tagesaktuell auf dem Dashboard zu finden sind. [2] Dort gibt es Tabellen und Grafiken, die alle auf einer Datengrundlage beruhen: es sind COVID-19-Fälle, genauer positiv auf COVID-19 / SARS-CoV‑2 getestete Personen. Diese Werte werden täglich als absolute Zahlen eingetragen.
Diese absoluten Zahlen sagen nicht nur zu wenig aus, sondern sind schlicht irreführend, wie der Mathematiker Klaus Pfaffelmoser am anschaulichen Beispiel erklärt:
Ein Wahlforscher will das Wählerverhalten bezüglich einer Partei, die allgemein als „demokratiefeindlich“ eingestuft ist, beobachten. Beginnend mit Woche 1 macht er eine Umfrage unter 1.000 Personen und stellt dabei 100 Anhänger dieser Partei fest. In der 2. Woche umfasst die Umfrage 2.000 Personen, die Anzahl der Anhänger der Partei steigt nun auf 200 Personen. In Woche 3 wird die Umfrage bei 4.000 Personen durchgeführt, wobei sich nun 400 Personen für die Partei aussprechen. (Anm. d. Verf.: Der Anteil der Parteianhänger bei den Befragten ist jeweils 10 Prozent.)
Der Wahlforscher alarmiert Medien und Politik, aus bisher nicht bekannten Gründen sei bei der extremistischen Partei eine exponentielle Zunahme der Befürworter festzustellen. Hochrechnungen ergäben, dass innerhalb von nur 17 Wochen, also circa 4 Monaten, die gesamte Wählerschaft diese Partei wählen würde, in 18 Wochen sogar mehr.
Nach den Erfahrungen mit Covid-19 ist nicht auszuschließen, dass große Teile der Presse und der Medien diese Meldung ernsthaft aufgreifen würden, verbunden mit der Forderung, die gefährliche Partei zu verbieten. Wegen der gegebenen Dringlichkeit werden im Eilverfahren Gesetze beschlossen, die ein Parteienverbot in einem Schnellverfahren ermöglichen … [3]
Beim RKI werden aber nicht nur die Zahlen der positiv Getesteten erhoben, sondern auch die Zahlen der durchgeführten Tests. Letztere sind aber nicht aus dem Dashboard ersichtlich, sondern werden eher versteckt wöchentlich im donnerstags erscheinenden Epidemiologischen Bulletin publiziert. [4] Aktuell sehen sie so aus:
Und erst, wenn man die positiven Testergebnisse in Beziehung zu den insgesamt durchgeführten Tests setzt, kommt wie im Beispiel des Wahlforschers eine sinnvollere Angabe dabei heraus: 3.892 positive Tests bis zur Kalenderwoche 10 liegen nicht in der gleichen Größenordnung wie 3.601 positive Tests in der Kalenderwoche 26, da die Anzahl der durchgeführten Tests sich fast vervierfacht hat.
Umgesetzt in eine Graphik ist gut erkennbar, dass der Höhepunkt lange zurück liegt (März / April) und sich seit etwa einem Monat auf dem gleichen Niveau bewegt, lediglich der „Tönnies-Peak“ in der Kalenderwoche 25 unterbricht dieses Kurvenplateau.
Dieses gleichbleibende Niveau ist ein Hinweis auf falsch-positive Testergebnisse, denn der Kurvenverlauf scheint den für diesen Test charakteristischen Mindestwert erreicht zu haben, unter den er nicht mehr fallen kann. Angezeigt werden vermutlich also keine realen Messwerte, sondern eine Art Grundrauschen aus falsch-positiven Ergebnissen.
Von falsch-Positiven und richtig-Negativen
Kein Test ist perfekt, jeder hat einen Anteil an falsch-positiven Ergebnissen: werden beispielsweise 100 virusfreie Personen auf ein Virus getestet und ist bei einer von ihnen der Test positiv, ist dieses Ergebnis falsch-positiv; der Rest ist richtig-negativ. Die falsch-positiv-Rate ist in diesem angenommen Fall 1%, die Spezifität – die Genauigkeit – dieses Tests entsprechend 99%. Die Spezifität ist eine Eigenschaft von Tests, die bei der Evaluation bestimmt wird. So weiß man bei der Durchführung, mit wie vielen falsch-Positiven zu rechnen ist, wie das Ergebnis zu bewerten ist.
Da es immer noch nicht gelungen ist, von den Verantwortlichen (RKI, Bundesministerium für Gesundheit, Charité, Hersteller) Daten zu Spezifität ihrer seit Monaten massenhaft eingesetzten Tests zu erfahren, werden zur Schätzung der falsch-positiv-Rate die Ergebnisse des Extra-Ringversuchs von INSTAND [5] hinzugezogen. Hier wurden im Blindversuch Positiv- und Negativproben in 463 Laboratorien mehrerer Länder mit der PCR auf SARS-CoV‑2 getestet, um den Qualitätsstandard der Testungen zu ermitteln. Der Ringsversuchsleiter ist emeritierter Professor der Charité (jetzt „IQVD GmbH Institut für Qualitätssicherung in der Virusdiagnostik“), Kooperationspartner ist „Charité – Universitätsmedizin Berlin, Institut für Virologie Nationales Konsiliarlaboratorium für Coronaviren“ mit seinem Leiter Prof. Drosten. Es handelte sich also um eine respektable Anstrengung, aber nicht um eine amtliche Prüfung.
Eine der drei Proben zu Ermittlung der Spezifität war die virenfreie Negativkontrolle, hier gab es 0,7% falsch-positive Ergebnisse (7 von 976). Da dies sehr gut mit dem aktuellen Kurvenverlauf der Positivenrate von 0,6% übereinstimmt (s.o.), ist dies vermutlich der Wert für eine Coronaviren-freie Situation, mit aktuell nur falsch-positiven Ergebnissen.
Außerdem wurden Proben mit zwei (von vier) weiteren bekannten humanen Coronaviren (HCoV) auf Kreuzreaktionen getestet. Diese Viren verursachen üblicherweise Erkältungen, können aber auch zu Lungenentzündungen führen. Beim Test mit HCoV 229E gab es 6,9% falsch-positive Ergebnisse (67 von 975), also einen sehr hohen Anteil. Allerdings wurden später 58 Resultate mit der Begründung von „falschen Ergebniszuordnungen (Verwechslungen)“ zurückgezogen. Dadurch wurde die Spezifität erheblich auf 98,1% verbessert. Ein weiteres getestetes Coronavirus war HCoV OC43, hier gab es 0,8% falsch-positive Ergebnisse (8 von 969). In die offizielle Bewertung des Ringversuchs flossen letztere Ergebnisse nicht ein [6].
Es gibt also Kreuzreaktionen mit zwei der bekannten Coronaviren, festgestellt unter Mitarbeit von Drosten, obwohl der öffentlich behauptet hatte: „Wir testen mit diesem Test nur das neue Coronavirus beim Menschen. Wenn wir eine Patientenprobe testen und das ist positiv, dann ist es dieses neue Coronavirus und auf gar keinen Fall eins der bekannten anderen Coronaviren.“ [7] Er hat sich sozusagen selbst widerlegt.
Im Ringversuch wurde den Teilnehmern die Möglichkeit geboten „bei etwaigen Fehlmessungen ihre Testmethode kurzfristig verbessern [zu] können“ und es gab „Verwechslungen“ – auch das ist eine Quelle für falsche Ergebnisse. Die Probleme in den Labors, die sich mit definierten Proben um eine Zertifizierung bemühen, sind erstaunlich, aber immer noch geringer als die, die bei der täglichen Routinearbeit auftreten können, wie eine Analyse der britischen Regierung beschreibt:
Es ist wichtig sich zu vergegenwärtigen, dass Labortestungen die analytische Sensitivität und die analytische Spezifität der RT-PCR-Tests überprüft. Sie repräsentieren ein idealisiertes Testen. In einer klinischen oder häuslichen Umgebung kann es ineffektive Probenahme, Laborkontamination, Qualitätsverschlechterung der Probe oder andere Quellen von Irrtümern geben, die zu einer erhöhten Anzahl von falsch-positiven oder falsch-negativen Ergebnissen führen werden. Die diagnostische Sensitivität und die diagnostische Spezifität eines Tests können nur unter Praxisbedingungen bestimmt werden. […]
Es wurde versucht, die wahrscheinliche falsch-positiv-Rate von nationalen COVID-19-Testprogrammen abzuschätzen, indem die Daten von publizierten externen Qualitätsbestimmungen (EQAs) für RT-PCR-Tests auf andere RNA-Viren aus den Jahren 2004–2019 überprüft wurden […]. Die Ergebnisse von 43 EQAs wurden geprüft und ergaben im Median eine falsch-positiv-Rate von of 2,3% (Interquartil-Bereich 0,8–4,0%). [8]
Wohin führen die Daten?
Die weitere Berechnung geht von einer durchschnittlichen falsch-positiv-Rate von 1% aus, was angesichts der genannten Daten eine brauchbare, eher konservative Schätzung und ein guter Wert wären. Ein Anteil in dieser Größenordnung mag vernachlässigbar erscheinen, hat aber bei hohen Zahlen erhebliche Auswirkungen. Insgesamt wurden laut RKI fast 7 Millionen Tests durchgeführt. [4] Darin enthalten wären dann 70.000 falsch-positive Testergebnisse, eine Zahl, die sich aufgrund von Doppelmeldungen etwas verringern würde. Damit wäre schätzungsweise fast ein Drittel der RKI-Fallstatistik falsch-positiv.
Leider gibt es keine Bereinigung der Zahlen und nicht einmal das öffentliche Eingeständnis des RKI, dass es bei der COVID-19-PCR falsch-Positive geben könnte. Mit Sicherheit wissen das aber die dortigen Experten, denn das gehört zum Grundwissen in ihrem Fach. Zu ihrem Chef jedenfalls, dem Bundesgesundheitsminister, ist dieses Wissen mittlerweile vorgedrungen:
„Wir müssen jetzt aufpassen, dass wir nicht nachher durch zu umfangreiches Testen – klingt jetzt total … da muss man erstmal um zwei Ecken denken – durch zu umfangreiches Testen zu viele falsch Positive haben. Weil die Tests ja nicht 100% genau sind, sondern auch eine kleine, aber eben auch eine Fehlerquote haben. Und wenn sozusagen insgesamt das Infektionsgeschehen immer weiter runtergeht, und Sie gleichzeitig das Testen auf Millionen ausweiten, dann haben Sie auf einmal viel mehr falsch Positive als tatsächlich Positive. Das sind so die Dinge, mit denen man dann sozusagen erst konfrontiert wird in der weiteren Folge, und die Erkenntnisse.“ [9]
Die Erkenntnisse alleine reichen aber nicht, es müssen auch die Konsequenzen erkannt und gezogen werden. Das betrifft nicht nur die wackelige RKI-Fallstatistik, sondern auch die zukünftigen Messungen: sollte es bei 500.000 Tests pro Woche blieben, würden 1% falsch-positive Resultate zu einem R‑Wert führen, der dauerhaft um 1 oszillieren würde: mal ein wenig darüber („Wir müssen Anstrengungen unternehmen, ihn zu drücken“), mal ein wenig darunter („Wir dürfen jetzt unsere Erfolge nicht gefährden“).
500.000 Tests pro Woche würden wöchentlich einen Basissatz von 5.000 falsch-positiven Ergebnissen produzieren, also durchschnittlich 714 pro Tag. Und so kommt man nie in die Situation, dass „die Zahl der Corona-Neuinfektionen pro Tag auf unter 100 sinkt“, wie von Altmaier gefordert.
Für die Maskenpflicht würden die falsch-Positiven aus Grundrauschen und Kreuzreaktionen völlig ausreichen, solange so getestet und ausgewertet wird.
[1] Tagesschau 11.7.2020
https://www.tagesschau.de/inland/maskenpflicht-111.html
[2] Robert Koch-Institut: COVID-19-Dashboard / Auswertungen basierend auf den aus den Gesundheitsämtern gemäß IfSG übermittelte Meldedaten
https://experience.arcgis.com/experience/478220a4c454480e823b17327b2bf1d4
[3] Klaus Pfaffelmoser: Die endlose Pandemie
https://www.rubikon.news/artikel/die-endlose-pandemie
[4] Epidemiologisches Bulletin / Kapitel „Erfassung der SARS-CoV-2-Testzahlen in Deutschland“
https://www.rki.de/DE/Content/Infekt/EpidBull/epid_bull_node.html
[5] Extra-Ringversuch von INSTAND Gesellschaft zur Förderung der Qualitätssicherung in medizinischen Laboratorien e.V.
https://www.instand-ev.de/System/rv-files/340%20DE%20SARS-CoV‑2%20Genom%20April%202020%2020200502j.pdf
[6] „Wichtige Mitteilung zur Auswertung: Nur 4 der 7 Proben, die im diesem Extra-Ringversuch untersucht wurden, werden für die Erlangung eines Zertifikats über die erfolgreiche Teilnahme berücksichtigt Während der Extra-Ringversuch noch lief, erhielt INSTAND e.V. aus dem In- und Ausland dringliche Anfragen, noch vor Ende der verlängerten Abgabefrist, also vor dem 28. April 2020, die Eigenschaften der zu untersuchenden Proben aufzudecken, damit Laboratorien bei etwaigen Fehlmessungen ihre Testmethode kurzfristig verbessern können. INSTAND e.V. hat sich daraufhin […] entschieden, die Eigenschaften von 3 der 7 Ringversuchsproben noch während des laufenden Ringversuchs zur Orientierung aufzudecken und eine Zwischenauswertung mitzuteilen.“ (S.4)
Aus laufenden und geplanten Ringversuchen sind vermutlich weitere Informationen zu erwarten: „Während beim Extra-Ringversuch im April 2020 der Genomnachweis von SARS-CoV‑2 im Vordergrund stand, werden die kommenden molekularen Coronavirus-Ringversuche im Juni/Juli und November 2020 erweitert und die Möglichkeit zur Differenzierung zwischen SARS-CoV‑2, MERS-CoV und anderen humanen CoV bieten.“ (S.7)
[7] (16) Coronavirus-Update: Brauchen Abkürzungen bei der Impfstoffzulassung vom 18.03.2020
https://www.ndr.de/nachrichten/info/16-Coronavirus-Update-Wir-brauchen-Abkuerzungen-bei-der-Impfstoffzulassung,podcastcoronavirus140.html
[8] Impact of false-positives and false-negatives in the UK’s COVID-19 RT-PCR testing programme by Carl Mayers & Kate Baker, 3.6.2020
[9] Zitat des Bundesgesundheitsministers in „Sie fragen – Bundesgesundheitsminister Spahn antwortet / Nachbericht aus Berlin“.
https://youtu.be/iN9QAvtV2hA (jetzt youtube.com, 14.6.20)
Einem Peter Altmaier, der laut Wikipedia in einer katholisch-konservativen Mittelschichtfamilie aufwuchs und eine Privatbibliothek mit über 6000 Buchtiteln besitzt, darf man eigentlich nicht unterstellen, dass ihm die katastrophalen wirtschaftlichen Folgen der aktuellen Regierungspolitik kalt ließen. Unfassbar ist es dann gleichwohl, dass er das üble Spiel mitspielt.
Vermutlich weiß er es als Jurist nicht besser. Das ist Sache der Berater, vor allem Robert-Koch-Institut (v.a. Wieler, Schaade) und Charité (v.a. Drosten, Kroemer), für die es diese beiden Möglichkeiten gibt: wenn sie es nicht wissen, sind sie aufgrund von Inkompetenz fehl am Platz, wenn sie es wissen, dann ist es bewusste Irreführung von Politik und Öffentlichkeit.
Guten Tag,
ich habe eine Frage zu dem folgenden Absatz:
"Insgesamt wurden laut RKI fast 7 Millionen Tests durchgeführt. [4] Darin enthalten wären dann 70.000 falsch-positive Testergebnisse, eine Zahl, die sich aufgrund von Doppelmeldungen etwas verringern würde. Damit wäre schätzungsweise fast ein Drittel der RKI-Fallstatistik falsch-positiv."
Um dies berechnen zu können, müsste man doch zwischen positiven und negativen Ergebnissen unterscheiden, oder? Wie kommen sie auf die 70.000 falsch-positiven (1% der positiv-getesteten?! Nicht der Gesamtgetesteten, oder?)
Und wieso soll dann ein drittel der Fallstatistik schätzungsweise falsch sein? Könnten sie das etwas genauer erörtern? Ich habe mit einem guten Freund eine Diskussion dazu und schätze ihren Aufwand und die Recherche sehr, die sie betreiben, aber in dem Punkt kamen wir auf keinen gemeinsamen Nenner : )
Vielen Dank und liebe Grüße
Die Bezugsgröße ist die Gesamtzahl der durchgeführten Tests und der Einfachheit halber habe ich die runde Zahl von 7.000.000 durchgeführten Tests verwendet.
Bei einer Spezifität von 99% wäre 1% der Ergebnisse falsch-positiv, also 1% von der Bezugsgröße von 7.000.000 = 70.000.
Zu dem Zeitpunkt lag die RKI-Fallzahl bei etwas über 200.000 und damit wäre bei der Annahme von 99% Spezifität ca. ein Drittel falsch-positiv.
Aber bei falsch-positiv Testung nimmt man doch die 1% von den im Test positiv-Getesteten, das wäre bei den 200.000 ca. 2.000 und bei falsch-negativ Testung würde man die 7.000.000 – die 200.000 nehmen und davon dann die 1%, oder nicht?
oder anders formuliert:
"In dem Fall müssten dann aber 7.000.000 Tests positiv ausgefallen sein, oder? Weil sich die Angabe der Spezifität ja nur auf die positiven Testergebnisse bezieht, nicht auf alle Testungen. Bei 200.000 positiven RKI-Testungen komme ich bei einer Spezifität von 99 Prozent nämlich auf eine Zahl von 2.000 Falsch-Positiven"
oder sehe ich das falsch?
Hier ist ein Link: https://statistikguru.de/lexikon/sensitivitaet-und-spezifitaet.html
Vielen lieben Dank für den Link.
Mein Problem ist noch nicht gelöst, bin jetzt bei
https://de.wikipedia.org/wiki/Beurteilung_eines_binaeren_Klassifikators (sry für den wiki-link, kenne wikihausen, aber für so Fragen sind die ja zu gebrauchen ^^)
gelandet und weiß immer noch nicht wie man auf "ein Drittel falsch-positiv bei der Spezifität von 99%" kommt.
Gibt es da eine konkrete Formel für?
Würde das gerne nachvollziehen können ( :
Vielleicht liegt es an unseren unterschiedlichen Perspektiven oder Fragestellungen. Wenn ich Sie richtig verstehe, gehen Sie sehr mathematisch an die Sache ran, vermutlich können Sie auch besser mit Formeln umgehen als ich. Mir ging es hier lediglich darum, auf die hohe Zahl der falsch-Positiven bei Massentests – und dann noch mehrheitlich an Gesunden – hinzuweisen.
Ich mißtraue den PCR-Zahlen zutiefst, habe immer ein großes Unbehagen, wenn ich mit ihnen rechne und es auch nicht mein Hauptinteresse. Hier habe ich es mal gemacht und da es mir um die Dimension geht, auch nur grob. Ich versuche nochmal zu erklären:
Bei der Zahl von gerundet 7.000.000 Tests ist in diesem Rahmen die Anzahl von Positiven vernachlässigbar, daher tauchen sie nicht in meiner Rechnung auf. Bei einer Spezifität von 99% wären 1% = 70.000 falsch-positiv, der Rest richtig-negativ, das war bei der damaligen Zahl von RKI-Fällen ungefähr ein Drittel (es waren etwas über 200.000, wenn ich mich richtig erinnere).
[Spezifität misst den Anteil der tatsächlichen Negativen, die korrekt als solche identifiziert werden (z.B. den Anteil der gesunden Menschen, die korrekt als nicht krank erkannt werden)]
Wie gesagt sind die Grunddaten nicht viel wert und eigentlich ist es müßig, mit ihnen zu rechnen. Aber die falsch-Positiven sind von großer Bedeutung, da sie die RKI-Fallstatistik aufblähen und angesichts der im Text zitierten Zahlen von 0,8–4% könnten sie auch noch höher liegen. Ihren tatsächlichen Anteil herauszufinden und aus den Daten herauszurechnen, steht nach wie vor aus.
Vielen Dank für die Antwort,
also gibt es bis jetzt keine konkreten Daten zur Sensitivität/Spezifität oder Prävalenz?
Ist denn bekannt wieviele Tests insgesamt gemacht worden sind? (Stand 29.11.)
Ich habe einen PCR-Rechner gefunden, mit dem man mal etwas "rumspielen" kann, aber ohne Basisdaten ist das natürlich unspannend.
https://www.covid-19-lektionen.de/blog/2020/05/17/pcr-test-rechner/
Liebe Grüße und danke für die Arbeit.
Auch ist mir aufgefallen, dass die 7 Millionen scheinbar falsche Zahlen sind.(Gesamtzahl der täglichen Testkapazitäten)
Es wurden nach aktuellem Stand (24.11. 12 Uhr)
27.859.242 Testungen durchgeführt, von denen 993.128 positiv gewesen sein sollen.
Der Text stammt aus dem Sommer (19.7.) und ich habe die damals aktuellen RKI-Zahlen verwendet: ca. 7 Millionen durchgeführte Tests (Woche 28: 6.884.614 Testungen).
Soweit ich weiß, ist es noch niemandem gelungen, vom Gesundheitsministerium oder dem Robert-Koch-Institut eine Auskunft über die (daignostische) Spezifität zu erhalten.
Die Daten zu den durchgeführten Testungen werden regelmäßig im Epidemiologischen Bulletin des RKI veröffentlicht.
15.05.2020
RKI | Robert Koch-Institut
Erläuterung der Schätzung der zeitlich variierenden Reproduktionszahl R
https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Projekte_RKI/R‑Wert-Erlaeuterung.pdf?__blob=publicationFile