Wie kommt die Reproduktionszahl R zustande und was sagt sie aus? Beispielrechnung zum besseren Verständnis

Die folgenden Rechnungen basieren auf den Fallzahlen, die auch das RKI benutzt. Wir haben uns die Daten des RKI ausgeliehen, um an ihrem Beispiel zu zeigen, welche Systematik hinter der Berechnung von R steht. Der Beitrag ergänzt den grundsätzlichen Beitrag zu diesem Thema, den wir hier veröffentlicht haben.

Die folgende Zusammenstellung erklärt, wie R berechnet wird, auf welchen Daten es basiert, und warum das R, das heute genannt wird, nicht das R ist, das man erhält, wenn man die Anzahl der heute gemeldeten Erkrankungsfälle durch die Anzahl der gestern gemeldeten Erkrankungsfälle dividiert.

Die folgende Abbildung stellt für die Daten bis zum 6. Mai dar, wie sich die Fallzahlen geglättet und ungeglättet entwickeln.

Relevant für alles weitere ist die Kurve in orange. Sie gibt den Moving Average (MA) über vier Tage an, der die Grundlage für die Berechnung von R ist, die oben dargestellt wurde. Die blaue Kurve gibt die (zeitweise) geschätzten Tagesdaten an, also die Anzahl der für den jeweiligen Tag per Nowcasting geschätzten Erkrankungsfälle. Wie man sieht, gleicht die orange Kurve die Ausschläge der blauen Kurve aus, reagiert etwas zeitverzögert auf die Entwicklung der blauen Kurve. Das hat den Vorteil, dass Ausreißer-Werte ausgeglichen werden und R nicht zwischen Werten über 3 und unter 1 hin und herspringt und somit mehr oder weniger ohne Informationsgehalt bleibt. Die Reproduktionszahl, die für SARS-CoV-2 auf Grundlage der geglätteten Daten, des Moving Average berechnet wird, hat den Vorzug, dass sie nicht auf jede Steigung/jeden Rückgang reagiert und nur dann eine Richtungsänderung vornimmt, wenn ein Anstieg oder ein Rückgang dauerhaft (also an drei von vier Tagen zu finden) ist.



Wir haben für die folgende Abbildung das R, das vom RKI auf Basis der geglätteten Werte berechnet wird, dem R, der Reproduktionszahl gegenübergestellt, die sich ergeben würde, wenn man nicht die geglätteten, sondern die (zweitweise) geschätzten Tagesdaten benutzen würde.

Einmal mehr zeigt sich, dass die Berechnung auf Grundlage des Moving Average die bessere Wahl ist, denn die errechneten Werte weisen geringere Ausschläge auf, so dass man sich nicht heute an eine Lockerung und morgen an eine Ent-Lockerung gewöhnen muss, der wiederum eine Lockerung folgt. Zudem zeigt die Abbildung, dass die Kurve für den Moving Average (Berechnung oben) der Entwicklung der Fallzahlen „hinterherhinkt“, d.h. erst wenn sich dauerhaft eine Reduktion oder dauerhaft eine Steigerung der Fallzahlen abzeichnet, reagiert auch das auf Basis des Moving Average berechnete R. 

Zudem löst diese Abbildung auch ein Rätsel. Der am 10. Mai vom RKI angegebene Wert für R von 1,13 bezieht sich auf den 6. Mai.
Warum?

Weil zwischen der Infektion, dem Testergebnis, das die Erkrankung bestätigt, und der Übermittlung der Daten an das RKI Zeit vergeht, was dazu führt, dass alle Modelle des RKI eigentlich die Vergangenheit beschreiben, wie sie sich vor vier Tagen dargestellt hat, nicht die Gegenwart. Im Grunde soll das Nowcasting diese Problematik beheben und vorhersagen, welche Fallzahl sich ergeben würde, wenn alle Gesundheitsämter schnell und zur gleichen Zeit melden würden. Wie wir oben dargestellt haben, basiert die Berechnung von R aber auf einem Moving Average über VIER Tage. Da man einen solchen Mittelwert erst berechnen kann, wenn man Daten für vier Tage vorliegen hat, ergibt es sich zwangsläufig eine Zeitverzögerung von vier Tagen. D.h. der Wert von heute beschreibt die Situation von vor vier Tagen.

Wenn Sie also das nächste Mal ein R in den Nachrichten lesen oder hören, dann wissen sie, das R, obwohl heute verkündet, bezieht sich auf die Zeit vor vier Tagen, bestenfalls den (dann aber veränderlichen) Zeitraum der letzten vier Tage. Und weil stetig Daten gemeldet werden, kann es durchaus sein, dass das, was ihnen heute als R präsentiert wird, in zwei Tagen im Datensatz einen anderen Wert ausweist, der Unterschied zwischen dem dann ausgewiesenen Wert und dem einst verkündeten Wert wäre der Unterschied zwischen dem Nowcasting, das wir hier besprochen haben und der Melderealität, also der Schätzfehler.




Wenn man bedenkt, dass wir ein kleines privates Blog sind und uns vornehmlich über Spenden finanzieren, dann ist die Menge an Informationen, die wir bereitstellen, damit SARS-CoV-2 und die von ihm ausgehende Gefahr besser eingeschätzt werden kann, erstaunlich, wie wir finden.

Unterstützen Sie unseren Fortbestand als freies Medium.
Vielen Dank!

[wpedon id=66988]


Fakten zu SARS-CoV-2/COVID-19:




Folgen Sie uns auf TELEGRAM


Bleiben Sie mit uns in Kontakt.
Wenn Sie ScienceFiles abonnieren, erhalten Sie bei jeder Veröffentlichung eine Benachrichtigung in die Mailbox.
[email-subscribers-form id=“1″]


ScienceFiles-Shop


Falls Sie unsere Arbeit unterstützen, und dafür sorgen wollen, dass bei ScienceFiles auch weiterhin das Rad rund läuft, dann kaufen Sie uns doch einen Kaffee:



Oder unterstützen Sie uns auf einem der folgenden Wege Unser herzlicher Dank ist Ihnen sicher! DENN: ScienceFiles lebt von Spenden. Helfen Sie uns, ScienceFiles auf eine solide finanzielle Basis zu stellen, damit Sie uns auch morgen noch lesen können!
Wir haben drei sichere Spendenmöglichkeiten:

Donorbox

Unterstützen Sie ScienceFiles


Unsere eigene ScienceFiles-Spendenfunktion

Zum Spenden einfach klicken

Unser Spendenkonto bei Halifax:

ScienceFiles Spendenkonto: HALIFAX (Bitte angeben: Zahlungsempfänger: Michael Klein, Zahlungszweck: ScienceFiles-Spende / Schenkung):
  • IBAN: GB15 HLFX 1100 3311 0902 67
  • BIC: HLFXGB21B24

Folgen Sie uns auf Telegram.
Anregungen, Hinweise, Kontakt? -> Redaktion @ Sciencefiles.org

22Comments

Add yours
  1. 1
    H.ans

    R – wie schnell mal die Regeln ändern ?
    Das RKI ist aktuell mit der Message in den Medien unterwegs, dass aktuell die Reproduktionszahl R wieder steigen würde ===> eine unfassbare Irreführung des Bürgers.
    Am 6. Mai wurden vom RKI ja die Richtlinien geändert, wer getestet werden soll !! Deswegen ist es absolut irreführend, wenn das RKI hier von einem „gestiegenen R“ spricht. In Wirklichkeit spiegelt das gestiegene R nur die Ausweitung der Tests wieder. Es ist ein echter Skandal, dass das RKI nach wie vor bei der Schätzung der Reproduktionszahl R den Faktor der Testanzahl nicht berücksichtigt. Denn dann würde man nicht nur sehen, dass das R in Wirklichkeit im März kaum gestiegen ist, sondern auch, dass das R aktuell in Wirklichkeit weiter sinkt. Quelle: Christof Kuhbandner Prof. Christof Kuhbandner, Inhaber des Lehrstuhls für Pädagogische Psychologie VI. der Uni Regensburg

    • 2
      Michael Klein

      Das mit den Tests müssen Sie mir erklären. Wie soll das funktionieren?
      Entweder mehr Tests führen proportional zu mehr festgestellten Erkrankten, das hat keinerlei Auswirkung auf R.
      Oder mehr Tests führen zu genau derselben Anzahl von festgestellten Erkrankten als weniger Tests, wieder hat es keine Auswirkung auf R.
      Oder mehr Tests führen zu mehr festgestellten Erkrankten als weniger Tests, dann gibt es NUR dann einen Effekt auf R, wenn die Anzahl der Erkrankten exponentiell steigt. Und wenn R dann steigt, dann wäre das korrekt oder?

      • 3
        H.ans

        Danke Herr Klein für die Nachfrage. Ich dachte, Sie hätten heute den offenen Brief schon gesehen. https://www.journalistenwatch.com/2020/05/11/professor-brief-das/
        „Durch die damit verbundene deutliche Ausweitung der Tests – in den Wochen davor wurden ja bis zu 60% der vorhandenen Testkapazitäten nicht genutzt – werden natürlich deutlich mehr Infektionen entdeckt.“
        Ich verstehe das so, daß zuvor ein R berechnet wurde und wissentlich viel ausgelassen wurde. Nun wird intensiv in (möglichen) Quellen herumgetestet und mit einen anders ertesteten R kommentarlos verglichen.

        • 4
          anon

          Das gilt nur für die Zeit der Umstellung: Wenn vier Tage vorher der Mittelwert bspw. bei 1000 lag und heute 900 Neuinfektionen gemeldet würden, dann wäre R 0,9. Geht jetzt die Anzahl der erkannten Infektionen durch die Ausweitung der Tests hoch bspw. auf den Mittelwert von 2000 und vier Tage später werden 1800 Neuinfektionen gemeldet, dann liegt R ebenso bei 0,9. In der Übergangszeit gibt’s dagegen dann bspw. Mittelwert 1000 und Neuinfektionen 2000 R = 2,0

      • 7
        HPB

        Das RKI weist einmal wöchentlich in seinem täglichen Situationsbericht die Gesamtzahl der Testkapazität, der Tests und der positiven Test aus. Für die Entwicklung des epidemiologischen Verlaufes sind die wöchentlichen Positiv-Test-Raten doch recht aussagefähig. Die stiegen von der KW 10 von 3,1 Prozent bis zur KW 14 auf 9,0 Prozent!. Bis zur KW 18 sanken sie peu a peu wieder auf 3,8 Prozent und könnten bis zur KW 21 auf 2,0 Prozent sinken.
        Das ist zwar auch nur ein nachlaufender Indikator, zeugt aber einerseits von wachsender Immun-Stärke der betroffenen Population und andereseits von breiter angelegten Tests und sicher auch eines Nutzens der getroffenen Maßnahmen.

  2. 8
    Scholz

    Sie vergessen zu berücksichtigen, dass das RKI die relative Quote der Infizierten unterschlägt. Mit der absoluten Zahl Infizierter kann man keine wissenschaftliche Aussage machen.

  3. 11
    ingres

    Ich meine, wenn es nicht gelingt R 1. Wenn man sich das Stäbchendiagramm ansieht, so haben sich anscheinend Phasen mit steigendem R mit denen mit fallendem R abgewechselt. Aber die Zahl der Neuinfektionen ist kontinuierlich gefallen (eine Berg- und Talfahrt, aber mit ständig sinkenden Maxima, wobei mich ja die regelmäßigen Schwankungen wundern).

    Also ist doch offensichtlich ein R > 1 seit über 1,5 Monaten nicht mehr relevant gewesen. D.h, die absteigenden Phasen waren offensichtlich immer stärker als die aufsteigenden. Da muß ich doch nichts berechnen. Was soll also beim jetzigen niedrigen Niveau das Pochen des RKI auf einem zur Abwechslung mal wieder R > 1? Das Stäbchendiagramm weist doch ganz offensichtlich auf eine auslaufende Epidemie hin. (wobei man jetzt natürlich den Effekt der Lockerungen abwarten muß)

  4. 12
    michael_m

    „Weil zwischen der Infektion, dem Testergebnis, das die Erkrankung bestätigt, und der Übermittlung der Daten an das RKI Zeit vergeht, was dazu führt, dass alle Modelle des RKI eigentlich die Vergangenheit beschreiben, wie sie sich vor vier Tagen dargestellt hat, nicht die Gegenwart.“

    vor 4 tagen?
    fehlt da nicht die inkubationszeit?

    ***
    unten links, in der ersten grafik, steht geschrieben, dass der gleitende durchschnitt auf der annahme basiert, das der erkrankte zwei tage vor seiner erkrankung andere anstecken kann.

    dies ist eher schwierig. sie meinen sicherlich zwei tage vor einem positiv-test?

  5. 13
    ingres

    Übrigens, wenn R allein deshalb eigentlich nicht zu berechnen ist, da man ja die Dunkelziffer der symptomlos Ansteckenden nicht kennt, dann zeigt das, dass man sich auf R nicht stützen sollte.

    Die Zahl der fallenden „Daily New Cases“ (oder ein geglätteter Durchschnitt davon). ist doch viel aussagekräftiger.

    Zwar könnte es sein, dass die Dunkelziffer der Symtomlosen ja als konstanter Beitrag zu den Neu-Infektionen angenommen werden kann und R damit zumindest relativ korrekt berechnet ist,

    Aber wenn man nur die fallende Kurve betrachtet sieht man doch, dass es ausläuft und damit R geglättet schon lange (seit dem 26. März) < 1 ist.

    • 14
      bollo

      @ingres, ich will das nur festhalten, nicht Sie belehren: Ich glaube ja, viele haben das mit dem R noch nicht wirklich verstanden. Es wird oft vermischt, wie ansteckend die Krankheit für andere durch einen Infizierten ist, damit, wie viele Infizierte insgesamt andere feststellbar angesteckt haben. Man kann von der Zahl keine Rückschlüsse auf die Ansteckungsgefahr der Krankheit an sich machen. Die ändert sich nicht. Man kann nur Rückschlüsse auf das Verhalten der Bevölkerung machen. Konkret: Ein Infizierter hat in Gangelt zig bis hunderte innerhalb weniger Stunden angesteckt. Nachdem die isoliert und aufgeklärt waren, haben die nur noch zwischen 2 und 3 Personen jeweils angesteckt. Weil sie isoliert waren.

      .

      Das mit den Daily new Cases, geglättet, sehe ich genau so, wie Sie. Es ist erheblich praktischer und direkter, ohne unnötige Annahmen, und erstaunlich präzise.

      .

      Bei dem gleitenden Mittelwert handelt es sich um einen Tiefpassfilter. (Hohe Frequenzen/schnelle Auschläge werden heraus gefiltert). Üblicherweise ist er in der Darstellung zeitversetzt um das Intervall der Breite, es sei denn es ist ein „gleitender Mittelwert mit dynamischem Fenster“, wo die ersten und letzten Wert verändert einberechnet werden.

      .

      Dass man in der Kurve sehen kann, dass sie ausläuft, ist eine Interpretation, für die man weiteres Hintergrundwissen bräuchte. Zum Beispiel ab welcher Größenordnung bei welchen Maßnahmen man davon ausgehen kann, dass sie ausläuft. An der Kurve von Schweden kann man aber auch sehen, dass sie genauso auf sehr hohem Wert stagnieren kann. Hier ist Hintergrundwissen hilfreich, in wie weit die Ausweitung der Tests mit der steigenden Kurve korrelliert. Wurden auch mehr Tests gemacht, als man merkte, dass es mehr Infektionen gibt? In Schweden nicht. Die Kurve kann nicht steigen, weil nicht entsprechend mehr Tests gemacht wurden. Die Zahl der positiven Tests an den limitierten Tests ist in Schweden viel höher, als in anderen europäischen Ländern. Die positiven Tests sind in anderen Ländern vielleicht bei 5 oder 8 Prozent. Bei Schweden jenseits von 20 Prozent. Aber man will nicht mehr testen. In Deutschland hat man anfangs ja auch kaum jemanden getestet, selbst wenn er aus Ischgl mit Symptomen kam. Aber jetzt sieht es ein bisschen anders aus.

      • 15
        ingres

        @Bollo

        Also von Oscar Wilde soll ja der Spruch stammen: Ich bin immer bereit zu lernen, aber nicht immer, mich belehren zu lassen“.
        So seh ich das auch immer, und habe keine Probleme mit Kritik oder Korrekturen. Und je nach Situation kann man sich auch belehren lassen.
        Insofern ist es sicher richtig, dass ein Auslaufen der Kurve Interpretationssache ist, deshalb habe ich ja auch eingeschränkt, dass man abwarten muß was die Lockerungen nun bringen werden. Mehr fällt mir nicht dazu ein, was die Kurve sonst am Auslaufen hindern sollte. Denn sie fällt ja sehr regelmäßig in abwechselnden Bergen und Tälern. Lediglich in den letzen Tagen hatte sie wieder einen kleinen Knacks (wie freilich regelmäßig auch vorher immer) bekommen. Deshalb ja auch wieder das „R >1“

        Deshalb vielleicht zusätzlich folgende Anmerkung: Da ja die „Daily New Cases“ permanent zurückgegangen sind könnte man sicherlich ein Intervall für den gleitenden Durchschnitt finden, für welches R über den gesamten Zeitraum monoton fallen würde.
        Für heute 0:00 h darf die Zahl der Neu-Infektionen (wenn ich mich nicht verrechnet habe) für das Intervall 4 bei über 1200 liegen, damit R wieder unter 1 fällt.)

        • 16
          bollo

          Sie haben da einen ziemlich anderen Gedankengang und Ansatz als ich. Da (über Ihren) habe ich mir so noch keine genaueren Gedanken gemacht, weil für mich ausgeschlossen. Ich habe ein paar andere Grundannahmen für meine Einschätzungen.

          .

          Z.B. ist für mich entscheidend, wie wahrscheinlich bei einer Menschenansammlung von x Personen ist, dass jemand darunter ist, der die Krankheit übertragen kann. Aber auch andere GRUND-Annahmen.

          .

          Der Weg über R ist der umgekehrte Weg. Man sagt, wenn allgemein in der Bevölkerung eine Person weniger als eine andere Person ansteckt, kann man alles öffnen.

  6. 17
    Jürgen Althoff

    Wie wird die Spezifität des Coronatests berücksichtigt? Lt.Prof. Krämer/TU Dortmund („Unstatistik des Monats“ etc) gibt es auf diesem Gebiet keine Tests mit weniger als 10% falsch positiven Ergebnissen. Was sagt das über die R-Berechnung?

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden.