Dynamika rozprzestrzeniania się koronawirusa SARS-CoV-2 w Polsce: Różnice pomiędzy wersjami

Z Henryk Dąbrowski
Skocz do: nawigacja, szukaj
Linia 251: Linia 251:
 
| style = "background: #ccffcc;" | 28 ( 86) || 352 || 22825
 
| style = "background: #ccffcc;" | 28 ( 86) || 352 || 22825
 
| style = "background: #ccffcc;" | 28 (117) || 193 || 33907
 
| style = "background: #ccffcc;" | 28 (117) || 193 || 33907
| style = "background: #ccffcc;" | 28 (147) || ||  
+
| style = "background: #ccffcc;" | 28 (147) || 502 || 43904
 
|-
 
|-
 
| style = "background: #ccffcc;" | 29 ( 26) || 224 || 1862
 
| style = "background: #ccffcc;" | 29 ( 26) || 224 || 1862

Wersja z 11:31, 28 lip 2020

24.03.2020



Podejrzewasz zakażenie koronawirusem SARS-CoV-2? Sprawdź co robić!

Zakażenie koronawirusem może spowodować pojawienie się u chorego następujących objawów:

  • gorączka większa od 38°C
  • kaszel
  • duszność
  • problemy z oddychaniem

Jeżeli wystąpił u Ciebie co najmniej jeden z wyżej wymienionych objawów, to powinieneś zgłosić się do szpitalnego oddziału chorób zakaźnych, najbliższego Twojego miejsca pobytu.

Możesz też zadzwonić na całodobową infolinię Narodowego Funduszu Zdrowia 800 190 590, aby uzyskać więcej informacji o tym, jak postępować w przypadku podejrzenia zakażenia koronawirusem.

Listę szpitalnych oddziałów chorób zakaźnych (plik DOCX do pobrania) znajdziesz na stronie Ministerstwa Zdrowia: Byłeś w Chinach i źle się czujesz? Sprawdź co robić! (LINK).

Nie zgłaszaj się na SOR lub do przychodni POZ, bo możesz jedynie zarazić przebywające tam osoby.


Pamiętaj! Nie czekaj, aż objawy wystąpią u Ciebie lub u bliskich Ci osób. Pobierz plik już dziś! Już teraz musisz wiedzieć, co będziesz musiał zrobić. Twoja wiedza może okazać się przydatna, gdy choroba dotknie Ciebie lub inne osoby.


Poczyniwszy odpowiednie przygotowania, możemy teraz spokojnie przejść do zasadniczego tematu tego artykułu, jakim jest szybkość rozprzestrzeniania się koronawirusa w Polsce.



Epidemia i dynamika rozprzestrzeniania się zakażeń

Najgorszy przypadek rozprzestrzeniania się choroby opisuje krzywa wykładnicza. Typowy przykład: każda chora osoba w ciągu okresu T dni zaraża N zdrowych osób. Po upływie k takich okresów T zarażonych jest Nk osób. To wzrost wykładniczy – najgorszy z możliwych. Rozstrzygnięcie, z jakim rodzajem wzrostu mamy do czynienia w Polsce, jest kluczowe dla nas wszystkich. Najpierw przyjrzyjmy się rodzajom funkcji, które mogą opisywać wzrost liczby osób zakażonych i oczekiwaną liczbę przypadków w kolejnych dniach epidemii.


Liczba chorych po n dniach epidemii Przyrost liczby chorych w kolejnych dniach Uwagi
y(n) = ea·n + b y(n+1) - y(n) = ea·n + b + c wzrost wykładniczy,   c = log(ea - 1)
podwojenie co T = log(2)/a dni
y(n) = a·n + b y(n+1) - y(n) = a wzrost liniowy
y(n) = a·n2 + b·n + c y(n+1) - y(n) = 2a·n + b1 wzrost kwadratowy,   b1 = a + b
y(n) = a·n3 + b·n2 + c·n + d y(n+1) - y(n) = 3a·n2 + b2·n + c2 wzrost sześcienny,   b2 = 3a + 2b,   c2 = a + b + c


Widzimy, że jeżeli wzrost ogólnej liczby przypadków jest opisywany funkcją wykładniczą, to dzienne przyrosty liczby chorych również są opisywane funkcją wykładniczą. W przypadku, gdy wzrost ogólnej liczby chorych opisywany jest wielomianem, to dzienne przyrosty liczby chorych są opisywane wielomianem o jeden stopień niższym.



Liczba wykrytych zakażeń w kolejnych dniach

Poniższa tabela przedstawia liczbę N stwierdzonych zakażeń w kolejnych dniach oraz sumę wszystkich zakażeń od początku epidemii. Liczby w nawiasie określają liczbę dni, które upłynęły od początku epidemii.

MAR N KWI N MAJ N CZE N LIP N
01 (   ) 01 ( 29) 243 2554 01 ( 59) 228 13105 01 ( 90) 379 24165 01 (120) 382 34775
02 (   ) 02 ( 30) 392 2946 02 ( 60) 270 13375 02 ( 91) 230 24395 02 (121) 371 35146
03 (   ) 03 ( 31) 437 3383 03 ( 61) 318 13693 03 ( 92) 292 24687 03 (122) 259 35405
04 (  1) 1 1 04 ( 32) 244 3627 04 ( 62) 313 14006 04 ( 93) 361 25048 04 (123) 314 35719
05 (  2) 0 1 05 ( 33) 475 4102 05 ( 63) 425 14431 05 ( 94) 362 25410 05 (124) 231 35950
06 (  3) 4 5 06 ( 34) 311 4413 06 ( 64) 309 14740 06 ( 95) 576 25986 06 (125) 205 36155
07 (  4) 1 6 07 ( 35) 435 4848 07 ( 65) 307 15047 07 ( 96) 575 26561 07 (126) 257 36412
08 (  5) 5 11 08 ( 36) 357 5205 08 ( 66) 319 15366 08 ( 97) 599 27160 08 (127) 277 36689
09 (  6) 6 17 09 ( 37) 370 5575 09 ( 67) 285 15651 09 ( 98) 400 27560 09 (128) 262 36951
10 (  7) 5 22 10 ( 38) 380 5955 10 ( 68) 345 15996 10 ( 99) 282 27842 10 (129) 265 37216
11 (  8) 9 31 11 ( 39) 401 6356 11 ( 69) 330 16326 11 (100)[1] 359 28201 11 (130) 305 37521
12 (  9) 20 51 12 ( 40) 318 6674 12 ( 70) 595 16921 12 (101) 376 28577 12 (131) 370 37891
13 ( 10) 17 68 13 ( 41) 260 6934 13 ( 71) 283 17204 13 (102) 440 29017 13 (132) 299 38190
14 ( 11) 36 104 14 ( 42) 268 7202 14 ( 72) 411 17615 14 (103) 375 29392 14 (133) 267 38457
15 ( 12) 21 125 15 ( 43) 380 7582 15 ( 73) 401 18016 15 (104) 396 29788 15 (134) 264 38721
16 ( 13) 52 177 16 ( 44) 336 7918 16 ( 74) 241 18257 16 (105) 407 30195 16 (135) 333 39054
17 ( 14) 61 238 17 ( 45) 461 8379 17 ( 75) 272 18529 17 (106) 506 30701 17 (136) 353 39407
18 ( 15) 49 287 18 ( 46) 363 8742 18 ( 76) 356 18885 18 (107) 314 31015 18 (137) 339 39746
19 ( 16) 68 355 19 ( 47) 545 9287 19 ( 77) 383 19268 19 (108) 301 31316 19 (138) 358 40104
20 ( 17) 70 425 20 ( 48) 306 9593 20 ( 78) 471 19739 20 (109) 304 31620 20 (139) 279 40383
21 ( 18) 111 536 21 ( 49) 263 9856 21 ( 79) 404 20143 21 (110) 311 31931 21 (140) 399 40782
22 ( 19) 98 634 22 ( 50) 313 10169 22 ( 80) 476 20619 22 (111) 296 32227 22 (141) 380 41162
23 ( 20) 115 749 23 ( 51) 342 10511 23 ( 81) 312 20931 23 (112) 300 32527 23 (142) 418 41580
24 ( 21) 152 901 24 ( 52) 381 10892 24 ( 82) 395 21326 24 (113) 294 32821 24 (143) 458 42038
25 ( 22) 150 1051 25 ( 53) 381 11273 25 ( 83) 305 21631 25 (114) 298 33119 25 (144) 584 42622
26 ( 23) 170 1221 26 ( 54) 344 11617 26 ( 84) 443 22074 26 (115) 276 33395 26 (145) 443 43065
27 ( 24) 168 1389 27 ( 55) 285 11902 27 ( 85) 399 22473 27 (116) 319 33714 27 (146) 337 43402
28 ( 25) 249 1638 28 ( 56) 316 12218 28 ( 86) 352 22825 28 (117) 193 33907 28 (147) 502 43904
29 ( 26) 224 1862 29 ( 57) 422 12640 29 ( 87) 330 23155 29 (118) 247 34154 29 (148)
30 ( 27) 193 2055 30 ( 58) 237 12877 30 ( 88) 416 23571 30 (119) 239 34393 30 (149)
31 ( 28) 256 2311 31 ( 89) 215 23786 31 (150)


Liczba wykrytych zakażeń (w ciągu doby). Okres od 10 kwietnia 2020 r. do 23 kwietnia 2020 r. Zielona linia jest krzywą regresji liniowej, a czerwona linia krzywą regresji wielomianowej dla wielomianu drugiego stopnia.


Łączna liczba wykrytych zakażeń. Okres od 10 kwietnia 2020 r. do 23 kwietnia 2020 r. Zielona linia jest krzywą regresji wielomianowej dla wielomianu drugiego stopnia.


Łączna liczba wykrytych zakażeń (skala logarytmiczna). Okres od 10 kwietnia 2020 r. do 23 kwietnia 2020 r. Zielona linia jest krzywą regresji wielomianowej dla wielomianu drugiego stopnia. Dobrze widoczne jest powolne wyhamowywanie epidemii.



Zastosowany sposób analizy całkowitej liczby zakażeń

Do badania statystycznego wybieramy okres 14 dni. Ostatni dzień tego okresu to dzień nadejścia najnowszych danych. Omówimy jak znajdować wykładniczą i wielomianową funkcję regresji. Jeśli Czytelnik nie jest zainteresowany zapoznaniem się z zastosowaną metodą obliczeń, to bez najmniejszej straty może pominąć tę sekcję.


Wykładnicza krzywa regresji

Przypuśćmy, że wzrost całkowitej liczby zakażeń jest opisywany funkcją wykładniczą y(n) = exp(a·n + b) i wyznaczmy parametry tej funkcji. Łatwo zauważamy, że problem ten sprowadza się do problemu liniowego, bo logarytmując obie strony wypisanego równania mamy log( y(n) ) = a·n + b. Dlatego w kolejnych kolumnach arkusza kalkulacyjnego umieszczamy:

  • logarytm naturalny całkowitej liczby zakażeń w kolejnych dniach wybranego przedziału (to są dane Y)
  • numer kolejnego dnia epidemii odpowiadający datom z wybranego okresu (to są dane X)


Korzystając z funkcji arkusza REGLINP()[2][3], otrzymujemy wartości współczynników. Przykładowo dla dnia 25 marca 2020 r. (22 dzień epidemii) znajdujemy wartości:

a = 0,229 (z błędem 0,018)
b = 2,08 (z błędem 0,28)

Jako wartość błędu przyjęliśmy podwojoną wartość odchylenia standardowego σ dla każdego ze współczynników. Zatem szukana funkcja ma postać: y(n) = exp( 0,229·n + 2,08 ), gdzie n przyjmuje wartości z przedziału [9, 22].

Zwraca uwagę wysoka korelacja równa 0,992. Zauważmy, że znalezionej wartości współczynnika a odpowiada okres podwojenia całkowitej liczby zakażeń T2 = log(2)/a równy 3 dni. Wartość ta tak znacznie odbiega od rzeczywistości, że wykładniczej funkcji regresji w ogóle nie będziemy brali pod uwagę.


Już teraz zauważmy, że jeśli epidemia potrwa dłużej, to numery kolejnych dni epidemii osiągną duże wartości. Przykładowo będziemy mieli n = 101, 102, …, 114. Gdy argument funkcji przyjmuje tak duże wartości, to w funkcji opisującej znalezioną krzywą regresji pojawiają się ogromne współczynniki. Przewidując ten problem, warto dokonać podstawienia x = n – n0 + 1, gdzie n0 oznacza numer dnia epidemii dla pierwszego dnia wybranego przedziału danych. W naszym przypadku tak zdefiniowana zmienna x będzie zawsze przyjmowała wartości od 1 do 14.

Powtarzając obliczenia dla zmiennej x, otrzymujemy:

a = 0,229 (z błędem 0,018)
b = 3,92 (z błędem 0,15)

Czyli szukana funkcja wykładnicza ma postać: y(x) = exp( 0,229·x + 3,92 ), gdzie x przymuje wartości z przedziału [1, 14].

Zauważmy, że wartości współczynnika a oraz współczynnika korelacji nie zmieniły się, ale współczynnik b oraz jego błąd uległy zmianie. Czego należało się spodziewać.

Zawsze możemy przejść od zmiennej x do zmiennej n. W naszym przypadku wystarczy wykonać podstawienie: x = n – 8. Czytelnik może wykonać to podstawienie i porównać uzyskany wzór ze wzorem obliczonym wcześniej.

Dokładnie taka postać funkcji jest znajdowana, gdy tworzymy krzywą regresji przy pomocy Kreatora wykresów dostępnego w pakiecie LibreOffice Calc. W rzeczywistości jest to ogromne ułatwienie: nie musimy wzoru opisującego krzywą regresji znajdować sami, a zostaje on automatycznie wygenerowany w czasie tworzenia wykresu. Oczywiście nie uzyskamy w ten sposób innych informacji statystycznych (na przykład odchylenia standardowego dla wyliczonych współczynników), ale w pewnych przypadkach uzyskanie postaci funkcji może nas w zupełności zadowolić.


Kwadratowa funkcja regresji

Zauważmy, że wzrost całkowitej liczby zakażeń z pewnością nie jest opisywany funkcją liniową, bo liczba rejestrowanych każdego dnia przypadków nie jest stała, ale zdecydowanie rośnie. Przypuśćmy zatem, że wzrost ten jest opisywany funkcją kwadratową i wyznaczmy parametry tej funkcji. Sytuacja jest bardziej skomplikowana, bo odpowiednie wzory opisujące regresję liniową są łatwo dostępne, ale na regresję nieliniową już nie. Jednak niektóre problemy nieliniowe dają się łatwo zlinearyzować. Tak uczyniliśmy przed chwilą w przypadku funkcji wykładniczej: logarytmy wartości tej funkcji są opisywane funkcją liniową, dlatego przygotowaliśmy w kolumnie logarytmy ogólnej liczby przypadków. Podobnie w przypadku zjawiska opisywanego funkcją kwadratową postaci y = ax2 + b, podstawienie u = x2 linearyzuje problem, a w kolumnie wystarczy wpisać wartości kwadratów zmiennej niezależnej x.


W naszym przypadku uczynimy tak samo, choć problem będzie bardziej skomplikowany. Podstawiając u = x2 sprowadzamy problem badania funkcji y = ax2 + bx + c do badania funkcji y = au + bx + c, czyli do problemu dwukrotnej regresji liniowej[4], gdzie są już odpowiednie wzory, a funkcja REGLINP() ponownie okaże się przydatna.


Pamiętając o potrzebie przejścia do zmiennej x = n – n0 + 1, gdzie n0 oznacza numer dnia epidemii dla pierwszego dnia wybranego przedziału danych, w kolejnych kolumnach arkusza kalkulacyjnego umieszczamy:

  • całkowitą liczbę zakażeń w kolejnych dniach wybranego przedziału (to są dane Y)
  • liczby od 1 do 14 (numerują one dni epidemii w wybranym przedziale danych) (to są dane X)
  • kwadraty liczb od 1 do 14 (to też są dane X)


Ponownie korzystając z funkcji arkusza REGLINP(), otrzymujemy wartości współczynników:

a = 5,46 (z błędem 0,49)
b = -7,3 (z błędem 7,5)
c = 66 (z błędem 25)

Zwraca uwagę niezwykle wyskoki współczynnik korelacji równy 0,999.

Czyli szukany wielomian drugiego stopnia ma postać: z(x) = 5,46·x2 - 7,3·x + 66, gdzie x przyjmuje wartości z przedziału [1, 14].


Wzrost całkowitej liczby zakażeń opisywany funkcją kwadratową jest znacznie bardziej zbliżony do rzeczywistości. Funkcja kwadratowa jest znacznie lepiej dopasowana do rzeczywistych danych – pokazuje to efekt działań podjętych przez rząd: początkowo wykładniczy wzrost liczby chorych przeszedł we wzrost opisywany funkcją kwadratową i miejmy nadzieję, że za kilka tygodni zacznie wygasać.


Sześcienna funkcja regresji

Oczywiście (wbrew doniesieniom mediów) całkowita liczba zakażeń nie nie rośnie wykładniczo, a rośnie (od 20 dnia epidemii) wielomianowo i biegnie między krzywymi opisywanymi wielomianem 2 i 3 stopnia.

Sposób postępowania jest analogiczny jak dla wielomianu stopnia drugiego, dlatego jedynie go naszkicujemy. Podstawiając u = x2t = x3, sprowadzamy problem do badania funkcji postaci y = at + bu + cx + d, czyli sprowadzamy problem do trzykrotnej regresji liniowej[4] i ponownie funkcja REGLINP() okaże się niezwykle pomocna.

Dokonujemy przejścia do zmiennej x = n – n0 + 1, gdzie n0 oznacza numer dnia epidemii dla pierwszego dnia wybranego przedziału danych i w kolejnych kolumnach arkusza kalkulacyjnego umieszczamy:

  • całkowitą liczbę zakażeń w kolejnych dniach wybranego przedziału (to są dane Y)
  • liczby od 1 do 14 (numerują one dni epidemii w wybranym przedziale danych) (to są dane X)
  • kwadraty liczb od 1 do 14 (to też są dane X)
  • sześciany liczb od 1 do 14 (to również są dane X)


Korzystając z funkcji arkusza REGLINP(), otrzymujemy wartości współczynników (dla danych z dnia 26 marca 2020 r.):

a = 0,206 (z błędem 0,077)
b = 1,3 (z błędem 1,8)
c = 26 (z błędem 12)
d = 41 (z błędem 21)

Zwraca uwagę niezwykle wysoki współczynnik korelacji równy 0,9999.

Czyli szukany wielomian trzeciego stopnia ma postać: w(x) = 0,206·x3 + 1,3·x2 + 26·x + 41, gdzie x przyjmuje wartości z przedziału [1, 14].



Zestawienie wyników dla kolejnych dni

W tabeli przedstawiamy rezultaty otrzymane dla danych obejmujących 14 dni (do daty podanej w kolumnie Data). W kolumnach zamieszczamy:

  • kolejne daty (w nawiasie dzień epidemii), dla których wykonane zostały obliczenia
  • otrzymaną postać wielomianu drugiego stopnia
  • liczbę dni T2 po jakiej (dla znalezionego wielomianu drugiego stopnia) nastąpi podwojenie łącznej liczby stwierdzonych zakażeń (dla wielomianu w(x), gdzie x przyjmuje wartości z przedziału [1, 14], wartość T2 wynika z rozwiązania równania w(T2 + 14) = 2·w(14)[5])
  • otrzymaną postać wielomianu trzeciego stopnia
  • liczbę dni T2 po jakiej (dla znalezionego wielomianu trzeciego stopnia) nastąpi podwojenie łącznej liczby stwierdzonych zakażeń (dla wielomianu w(x), gdzie x przyjmuje wartości z przedziału [1, 14], wartość T2 wynika z rozwiązania równania w(T2 + 14) = 2·w(14)[5])
  • związek między zmienną x przyjmującą wartości z przedziału [1, 14], a zmienną n oznaczającą kolejne dni epidemii


Zauważmy, że kierunek zmian wartości T2 obserwowany w dłuższym okresie będzie bardzo dobrym wskaźnikiem przebiegu epidemii.

Data Wielomian 2 stopnia T2 Wielomian 3 stopnia T2 Uwagi
23.03.2020 ( 20) 4,37·x2 - 11,2·x + 39 4,80 0.127·x3 + 1.5·x2 + 7·x + 13 4.32 x = n - 6
24.03.2020 ( 21) 4,92·x2 - 9,7·x + 50 4,96 0.185·x3 + 0.8·x2 + 16·x + 12 4.35 x = n - 7
25.03.2020 ( 22) 5,46·x2 - 7,3·x + 66 5,13 0.196·x3 + 1.0·x2 + 20·x + 26 4.53 x = n - 8
26.03.2020 ( 23) 5,96·x2 - 3,3·x + 83 5,32 0,206·x3 + 1,3·x2 + 26·x + 41 4,73 x = n - 9
27.03.2020 ( 24) 6,33·x2 + 2,9·x + 104 5,55 0,136·x3 + 3,3·x2 + 22·x + 77 5,15 x = n - 10
28.03.2020 ( 25) 7,05·x2 + 6,3·x + 136 5,69 0,240·x3 + 1,6·x2 + 40·x + 87 5,08 x = n - 11
29.03.2020 ( 26) 7,79·x2 + 9,9·x + 180 5,84 0,207·x3 + 3,1·x2 + 39·x + 138 5,33 x = n - 12
30.03.2020 ( 27) 7,85·x2 + 23,1·x + 211 6,15 0,023·x3 + 7,3·x2 + 26·x + 206 6,09 x = n - 13
31.03.2020 ( 28) 7,79·x2 + 39,1·x + 242 6,50 -0,028·x3 + 8,4·x2 + 35·x + 248 6,58 x = n - 14
01.04.2020 ( 29) 7,57·x2 + 57,2·x + 285 6,89 -0,114·x3 + 10,1·x2 + 41·x + 308 7,25 x = n - 15
02.04.2020 ( 30) 8,39·x2 + 63,0·x + 367 7,01 0,161·x3 + 4,8·x2 + 85·x + 334 6,61 x = n - 16
03.04.2020 ( 31) 10,21·x2 + 57,3·x + 489 6,91 0,530·x3 -1,7·x2 + 131·x + 381 5,92 x = n - 17
04.04.2020 ( 32) 10,3·x2 + 74,8·x + 571 7,21 0,363·x3 + 2,2·x2 + 125·x + 497 6,49 x = n - 18
05.04.2020 ( 33) 11,4·x2 + 81,0·x + 694 7,30 0,447·x3 + 1,3·x2 + 144·x + 602 6,50 x = n - 19
06.04.2020 ( 34) 11,4·x2 + 101·x + 805 7,64 0,082·x3 + 9,5·x2 + 113·x + 788 7,46 x = n - 20
07.04.2020 ( 35) 11,3·x2 + 124·x + 925 7,97 -0,101·x3 + 13,6·x2 + 110·x + 946 8,20 x = n - 21
08.04.2020 ( 36) 10,4·x2 + 156·x + 1043 8,50 -0,437·x3 + 20,2·x2 + 95·x + 1132 9,74 x = n - 22
09.04.2020 ( 37) 8,9·x2 + 195·x + 1168 9,19 -0,734·x3 + 25,4·x2 + 93·x + 1318 12,09 x = n - 23
10.04.2020 ( 38) 7,4·x2 + 233·x + 1327 9,98 -0,999·x3 + 29,8·x2 + 93·x + 1531 16,35 x = n - 24
11.04.2020 ( 39) 5,3·x2 + 277·x + 1480 10,99 -0,870·x3 + 24,9·x2 + 155·x + 1658 17,49 x = n - 25
12.04.2020 ( 40) 2,6·x2 + 328·x + 1642 12,50 -0,676·x3 + 17,8·x2 + 233·x + 1780 18,81 x = n - 26
13.04.2020 ( 41) -0,40·x2 + 374·x + 1857 14,00[6] -0,687·x3 + 15,1·x2 + 278·x + 1997 19,47[6] x = n - 27
14.04.2020 ( 42) -3,1·x2 + 411·x + 2122 16,54 -0,661·x3 + 11,8·x2 + 319·x + 2257 25,91 x = n - 28
15.04.2020 ( 43) -3,6·x2 + 413·x + 2507 18,01 -0,566·x3 + 9,2·x2 + 334·x + 2622 27,01 x = n - 29
16.04.2020 ( 44) -3,8·x2 + 410·x + 2894 19,35 -0,332·x3 + 3,7·x2 + 364·x + 2962 23,86 x = n - 30
17.04.2020 ( 45) -3,3·x2 + 404·x + 3267 19,77 0,585·x3 - 16,5·x2 + 485·x + 3148 15,60 x = n - 31
18.04.2020 ( 46) -1,3·x2 + 370·x + 3738 18,96 0,751·x3 - 18,2·x2 + 475·x + 3585 14,56 x = n - 32
19.04.2020 ( 47) 1,3·x2 + 336·x + 4173 17,57 1,427·x3 - 30,8·x2 + 535·x + 3882 11,98 x = n - 33
20.04.2020 ( 48) 3,4·x2 + 308·x + 4611 16,96 1,049·x3 - 20,2·x2 + 454·x + 4397 12,84 x = n - 34
21.04.2020 ( 49) 3,3·x2 + 310·x + 4959 17,62 0,318·x3 - 3,9·x2 + 354·x + 4894 15,95 x = n - 35
22.04.2020 ( 50) 2,7·x2 + 318·x + 5293 18,64 -0,489·x3 + 13,7·x2 + 250·x + 5393 23,06 x = n - 36
23.04.2020 ( 51) 1,8·x2 + 330·x + 5615 19,88 -1,097·x3 + 26,5·x2 + 177·x + 5839 ---- x = n - 37



Rzeczywista dzienna liczba zakażonych a wartości oczekiwane

W zamieszczonej niżej tabeli zebraliśmy rzeczywiste liczby osób zakażonych koronawirusem, tak aby można było łatwo je porównać z przewidywanymi wartościami.

Data Rzeczywista liczba zakażeń Przewidywana liczba - wielomian 2 stopnia Przewidywana liczba - wielomian 3 stopnia
24.03.2020 (21) 152 105 131+
25.03.2020 (22) 150 111 149+
26.03.2020 (23) 170 134 174-
27.03.2020 (24) 168 154+ 196
28.03.2020 (25) 249 183 211+
29.03.2020 (26) 224 179 228-
30.03.2020 (27) 193 218- 260
31.03.2020 (28) 256 268- 273
01.04.2020 (29) 243 272 266-
02.04.2020 (30) 392 292+ 269
03.04.2020 (31) 437 254 287+
04.04.2020 (32) 244 263- 371
05.04.2020 (33) 475 388 462+
06.04.2020 (34) 311 372- 463
07.04.2020 (35) 435 470- 487
08.04.2020 (36) 357 472 452-
09.04.2020 (37) 370 518 429-
10.04.2020 (38) 380 527 377+
11.04.2020 (39) 401 518 314+
12.04.2020 (40) 318 476 298+
13.04.2020 (41) 260 461 323-
14.04.2020 (42) 268 448 308-
15.04.2020 (43) 380 397- 262
16.04.2020 (44) 336 313+ 198
17.04.2020 (45) 461 283+ 215
18.04.2020 (46) 363 199 318+
19.04.2020 (47) 545 258 411+
20.04.2020 (48) 306 229+ 520
21.04.2020 (49) 263 387- 601
22.04.2020 (50) 313 483- 548
23.04.2020 (51) 342 497 397-
24.04.2020 (52) 381 471- 247


W ostatnim wierszu tabeli podajemy oczekiwaną liczbę nowych zakażeń koronawirusem w następnym dniu epidemii dla wielomianowych krzywych regresji. Najlepiej dopasowaną przewidywaną wartość do danych rzeczywistych zapisaliśmy pogrubioną czcionką. Znak + informuje nas, że wartość tę należy powiększyć, aby uzyskać wartość rzeczywistą, a znak - informuje nas, że wartość tę należy pomniejszyć. Tabela ta pokazuje w bardzo przejrzysty sposób sytuację epidemiczną. Rzeczywisty sukces w walce z epidemią zostanie natychmiast zauważony: najlepiej dopasowane będą wartości w trzeciej kolumnie i zostaną opatrzone znakiem minus.


28 marca 2020 r.: Duży wzrost liczby zakażonych, znacznie odbiegający od wartości oczekiwanych. W komunikacie z 20:02 Ministerstwo Zdrowia poinformowało o 157 nowych przypadkach, z których ponad połowę (103) stanowiły osoby z województwa mazowieckiego. Następnego dnia wyjaśniono, że wzrost ten spowodowany został wykryciem ogniska koronawirusa w Domu Pomocy Społecznej w Niedabylu – stwierdzono zakażenie koronawirusem u 60 osób[7].

31 marca 2020 r.: Po raz pierwszy współczynnik przy x3 zmienił znak i stał się liczbą ujemną. Oznacza to, że wielomian 3 stopnia dla pewnej wartości x osiągnie maksimum i przestanie rosnąć.

2 kwietnia 2020 r.: Duży wzrost liczby zakażonych, znacznie odbiegający od wartości oczekiwanych. W komunikacie z 21:14 Ministerstwo Zdrowia poinformowało o 254 nowych przypadkach, z których ponad połowę (142) stanowiły osoby z województwa mazowieckiego. Nie wyjaśniono powodów tak dużej liczby zakażeń. Może ma to związek ze znacznym zwiększeniem liczby wykonywanych testów[8], a może czeka nas gwałtowny wzrost liczby zakażeń.

3 kwietnia 2020 r.: W komunikacie z godziny 10:00 Ministerstwo poinformowało o 203 nowych przypadkach. Ponad połowa, bo 125 osób, były to przypadki z województwa śląskiego. Nie wyjaśniono przyczyn tak wielkiej liczby zakażeń w tym województwie.

7 kwietnia 2020 r.: Po raz drugi współczynnik przy x3 zmienił znak i stał się liczbą ujemną.

9 kwietnia 2020 r.: Wygląda na to, że współczynnik przy x3 w wielomianie trzeciego stopnia pozostanie liczbą ujemną. Bez trudu możemy policzyć, że wypisany wielomian osiągnie maksimum 48 dnia epidemii, czyli 20 kwietnia. Daje to pierwsze oszacowanie dnia, od którego liczba osób zakażonych w kolejnych dniach powinna zdecydowanie zmaleć.

11 kwietnia 2020 r.: Wielomian trzeciego stopnia osiąga maksimum 46 dnia epidemii, czyli 18 kwietnia. Zgodność tego wyniku i wyniku uzyskanego 9 kwietnia zwiększa zaufanie do uzyskanych rezultatów.

13 kwietnia 2020 r.: Po raz pierwszy współczynnik przy x2 w wielomianie drugiego stopnia zmienił znak i stał się liczbą ujemną. Wielomian trzeciego stopnia osiąga maksimum 48 dnia epidemii, czyli 20 kwietnia, co oznacza bardzo dobrą zgodność z poprzednimi wynikami. Od pięciu dni jest odnotowywana praktycznie stała liczba zakażeń (na poziomie ok. 350 osób dziennie), a dzisiaj nastąpił znaczący spadek (260 przypadków). Ze względu na brak rozwiązań odpowiedniego równania w przypadku wielomianu trzeciego stopnia nastąpiła zmiana sposobu obliczania okresu podwojenia T2[6]. Ta wymuszona zmiana jest również korzystnym sygnałem.

15 kwietnia 2020 r.: Od 9 kwietnia funkcja regresji kwadratowej dla liczby wykrytych zakażeń (w ciągu doby) osiąga maksimum w rozpatrywanym przedziale danych i przechodzi w funkcję malejącą. Podobnie od 14 kwietnia krzywa regresji liniowej jest krzywą malejącą. Mimo dzisiejszego wzrostu zakażeń (380 przypadków) obie krzywe regresji dla łącznej liczby przypadków utrzymały ujemne współczynniki przy wyrazach w najwyższej potędze. Wielomian trzeciego stopnia niezmiennie osiąga maksimum około 20 kwietnia. Najbliższe dni rozstrzygną, czy obserwujemy trwałe spowolnienie epidemii.

19 kwietnia 2020 r.: Wzrost liczby zakażeń koronawirusem wiąże się z wykryciem trzech nowych ognisk; dotyczą one ośrodków opieki długoterminowej w Kaliszu (woj. wielkopolskie) i Czernichowie (woj. śląskie) oraz szpitala w Jastrzębiu-Zdroju (woj. śląskie)[9].

23 kwietnia 2020 r.: Ponownie wystąpił brak rozwiązań odpowiedniego równania w przypadku wielomianu trzeciego stopnia, dlatego nie podajemy okresu podwojenia (nie będzie kolejnej modyfikacji formuły, według której obliczany jest okres podwojenia T2). Fakt ten utwierdza nas w przekonaniu, że epidemia zdecydowanie spowolniła.


Na podstawie następujących faktów:

  • wzrost całkowitej liczby zakażeń nie ma charakteru wykładniczego, a wielomianowy o stopniu nie wyższym od trzeciego
  • przewidywany okres podwojenia T2 systematycznie wydłuża się
  • oczekiwane wartości liczby zakażeń w ciągu kolejnych dni dobrze odpowiadają odnotowanym danym rzeczywistym

łatwo stwierdzamy, że sytuacja w Polsce powoli się poprawia dzięki zdecydowanym działaniom rządu i wysiłkowi całego społeczeństwa, a sugestie, że w Polsce powtórzy się scenariusz włoski, są całkowicie nieprawdziwe.


Przedstawiony obraz był prawdziwy i przewidywalny do 2 kwietnia. Co takiego się stało, że epidemia przyspieszyła mimo nakładania kolejnych ograniczeń przez rząd? Trudno wskazać jakiekolwiek sensowne wyjaśnienie poza (być może) wykrytymi ogniskami zakażeń lub zwiększoną liczbą wykonywanych testów. Po gwałtownym skoku liczby zakażonych 2, 3 i 5 kwietnia obecnie sytuacja wydaje się stabilizować. Okres podwojenia całkowitej liczby osób zakażonych T2 wyraźnie rośnie, a przewidywana liczba osób zakażonych jest większa niż w rzeczywistości (od 6 kwietnia). Daje to ponownie nadzieję na zdecydowane spowolnienie epidemii w ciągu najbliższych 10 dni.



Epidemia została wyhamowana i co dalej?

Epidemia zdecydowanie spowolniła, a liczba wykrywanych zakażeń jest w miarę stabilna. Dalsza analiza ostatnich czternastu dni nie wnosi już wiele informacji, a całkowicie przypadkowe liczby zakażeń nie stanowią dobrego materiału do analizy statystycznej i przewidywania możliwej liczby nowych przypadków. Wystarczy wykrycie trzech nowych ognisk choroby, aby w danym dniu liczba zakażeń gwałtownie wzrosła. Dlatego konieczna jest zmiana sposobu prezentowania bieżącej sytuacji.


Od 24 kwietnia 2020 r. (52 dzień epidemii) będziemy prezentowali na wykresie wartości średniej kroczącej[10] liczby zakażeń obliczanej dla ostatnich pięciu dni. Wybór pięciu dni jako podstawy do wyliczania średniej jest podyktowany jedynie tym, że chcemy uzyskać wygładzenie odnotowywanych skoków liczby zakażeń przy uśrednianiu po możliwe najmniejszej liczbie dni. Oto uzyskany rezultat:


Średnia krocząca liczby wykrytych zakażeń (obliczana z ostatnich pięciu dni). Wielomianowa krzywa regresji (zielona linia) ma na celu jedynie lepsze ukazanie przebiegu zmian.


Możemy powiedzieć, że na obecnym etapie możliwe są wszystkie scenariusze (oczywiście nie mam tu na myśli scenariusza włoskiego). Zakładając, że wprowadzone przez rząd ograniczenia zostaną zachowane, moglibyśmy uznać, że przedstawiony przebieg liczby zakażeń napawa optymizmem. Podobne oscylacje liczby zakażeń (już po osiągnięciu maksimum) są dobrze widoczne w przypadku danych pochodzących z Włoch[11]. Niestety konieczność powrotu do normalności budzi uzasadnione obawy co do tego, jakie zmiany na przedstawionym wykresie zaobserwujemy w nadchodzących dniach.







Przypisy

  1. Od 11 czerwca 2020 r. Ministerstwo Zdrowia zmieniło sposób raportowania danych. Dane w tabeli do dnia 10 czerwca są danymi z godziny 17:30. Od 11 czerwca (100 dzień epidemii) dane są raportowane tylko raz na dobę i podawane ok. godziny 10:30.
  2. LibreOffice Calc, Funkcje macierzowe, (LINK)
  3. LibreOffice 6.4 Help, REGLINP, (LINK)
  4. 4,0 4,1 Wyznaczenie współczynników wielokrotnej regresji liniowej oraz ich odchyleń standardowych przy pomocy metody najmniejszych kwadratów, (Opracowanie własne - LINK)
  5. 5,0 5,1 W rzeczywistości okres podwojenia T2 wyliczamy w bardziej skomplikowany sposób. Najpierw wyliczamy, jaka liczba dni D musi upłynąć od ostatniego (czyli 14) dnia badanego okresu, aby całkowita liczba zakażeń wzrosła o 18,9207%. Gdyby taka tendencja wzrostu liczby zakażeń była trwała, to podwojenie całkowitej liczby zakażonych nastąpiłoby po 4·D dniach. Jest tak dlatego, że (1.189207)^4 = 2. Wnioskowanie o okresie podwojenia na podstawie rozwiązania równania w(T2 + 14) = 2·w(14) jest nieuprawnioną ekstrapolacją wielomianu w(x). Nieuprawnioną dlatego, że na podstawie danych z 14 dni sięgamy od 5 do 7 dni w przyszłość (takie wartości T2 wynikały z rozwiązania tego równania). Zbierając: rozwiązujemy równanie w(D + 14) = 2^(1/4)·w(14) i otrzymaną liczbę D mnożymy przez 4.
  6. 6,0 6,1 6,2 Od 13 kwietnia 2020 r. nastąpiła (wymuszona) zmiana sposobu wyliczania okres podwojenia T2. Zmiana została spowodowana brakiem rozwiązań równania w(D + 14) = 2^(1/4)·w(14) w przypadku wielomianu trzeciego stopnia. Dlatego od 13 kwietnia rozwiązujemy równanie w(D + 14) = 2^(1/8)·w(14) i otrzymaną liczbę D mnożymy przez 8.
  7. Polska Agencja Prasowa SA, Kraska: Żaden polityk nie podejmie decyzji o wyborach narażając ludzi na niebezpieczeństwo utraty życia i zdrowia, (LINK)
  8. Ministerstwo Zdrowia informowało o następujących liczbach testów przeprowadzonych w ciągu doby:
    15 marca – 1 tys. (LINK)
    17 marca – 1,2 tys. (LINK)
    18 marca – 1,6 tys. (LINK)
    19 marca – 1,6 tys. (LINK)
    20 marca – 1,8 tys. (LINK)
    21 marca – 2 tys. (LINK)
    22 marca – 2,5 tys. (LINK)
    23 marca – 2,5 tys. (LINK)
    24 marca – 2,8 tys. (LINK)
    25 marca – 3,3 tys. (LINK)
    26 marca – 3,3 tys. (LINK)
    27 marca – 4,5 tys. (LINK)
    28 marca – 4,6 tys. (LINK)
    29 marca – 4,1 tys. (LINK)
    30 marca – 3,8 tys. (LINK)
    31 marca – 4,8 tys. (LINK)
    1 kwietnia – 4,3 tys. (LINK)
    2 kwietnia – 5,3 tys. (LINK)
    3 kwietnia – 5,7 tys. (LINK)
  9. Polska Agencja Prasowa SA, Rzecznik MZ: wzrost zakażeń koronawirusem wiąże się z wykryciem trzech nowych ognisk, (LINK)
  10. Stosujemy prostą średnią kroczącą (ruchomą) dla n = 5. (LINK1), (LINK2)
  11. Wikipedia, New cases per day, (LINK)