Dynamika rozprzestrzeniania się koronawirusa SARS-CoV-2 w Polsce

Z Henryk Dąbrowski
Skocz do: nawigacja, szukaj
24.03.2020



Podejrzewasz zakażenie koronawirusem SARS-CoV-2? Sprawdź co robić!

Zakażenie koronawirusem może spowodować pojawienie się u chorego następujących objawów:

  • gorączka większa od 38°C
  • kaszel
  • duszność
  • problemy z oddychaniem

Jeżeli wystąpił u Ciebie co najmniej jeden z wyżej wymienionych objawów, to powinieneś zgłosić się do szpitalnego oddziału chorób zakaźnych, najbliższego Twojego miejsca pobytu.

Możesz też zadzwonić na całodobową infolinię Narodowego Funduszu Zdrowia 800 190 590, aby uzyskać więcej informacji o tym, jak postępować w przypadku podejrzenia zakażenia koronawirusem.

Listę szpitalnych oddziałów chorób zakaźnych (plik DOCX do pobrania) znajdziesz na stronie Ministerstwa Zdrowia: Byłeś w Chinach i źle się czujesz? Sprawdź co robić! (LINK).

Nie zgłaszaj się na SOR lub do przychodni POZ, bo możesz jedynie zarazić przebywające tam osoby.


Pamiętaj! Nie czekaj, aż objawy wystąpią u Ciebie lub u bliskich Ci osób. Pobierz plik już dziś! Już teraz musisz wiedzieć, co będziesz musiał zrobić. Twoja wiedza może okazać się przydatna, gdy choroba dotknie Ciebie lub inne osoby.


Poczyniwszy odpowiednie przygotowania, możemy teraz spokojnie przejść do zasadniczego tematu tego artykułu, jakim jest szybkość rozprzestrzeniania się koronawirusa w Polsce.



Dynamika rozprzestrzeniania się koronawirusa SARS-CoV-2 w Polsce

Na wstępie zauważmy, że tekst artykułu zmieniał się w czasie. Początkowo miał tylko pokazać, że liczba zakażeń nie wzrasta wykładniczo, a taką wersję przedstawiały wszystkie media. W rzeczywistości wzrost liczby zakażeń mieścił się między krzywymi wielomianowymi drugiego i trzeciego stopnia. Te rozważania, obecnie już całkowicie nieaktualne, przesunęliśmy na koniec tekstu.


Minęło już ponad 170 dni od początku epidemii w Polsce, czyli prawie 25 tygodni. Wygląda na to, że koronawirus zostanie z nami na dłużej i będzie problemem, dopóki większość osób nie przejdzie zakażenia (lub nie pojawi się szczepionka). Na zamieszczonym niżej wykresie prezentujemy wartości tygodniowej średniej kroczącej[1], czyli średniej liczby zakażeń obliczanej dla ostatnich siedmiu dni. Wybór tygodnia do obliczania średniej kroczącej wydaje się najbardziej właściwy. Wynika to z faktu, że intensywność pracy służb może spadać w weekendy, co skutkuje dziwnymi skokami średniej kroczącej obliczanej dla ostatnich pięciu dni (wcześniej wybraliśmy właśnie taką średnią kroczącą). Poza tym oczekiwany długi okres trwania epidemii zmienia podejście do prezentowania liczby zakażeń. Już nie oczekujemy, że koniec zachorowań jest bliski, a spadek liczby zakażeń zauważymy tym lepiej, im średnia krocząca będzie obliczana dla mniejszej liczby dni. Przeciwnie, uważamy, że wygaszanie epidemii będzie długotrwałe i posługiwanie się tygodniową średnią kroczącą nie spowoduje utraty informacji, a sprawi, że nie będą pojawiały się przypadkowe odchylenia na prezentowanym wykresie.


Liczba wykrytych zakażeń w kolejnych dniach epidemii i tygodniowa średnia krocząca liczby wykrytych zakażeń (obliczana z ostatnich siedmiu dni). Wielomianowa krzywa regresji (zielona linia) ma na celu jedynie lepsze ukazanie przebiegu zmian.



Po upływie ponad 230 dni widzimy, że możemy wydzielić dwa podstawowe etapy przebiegu epidemii:

  • etap pierwszy w okresie od 4 marca 2020 roku (1 dzień epidemii) do 18 września 2020 roku (199 dzień epidemii)
  • etap drugi w okresie od 19 września 2020 roku (200 dzień epidemii) do chwili obecnej

W pierwszym etapie dzienna liczba zakażeń nigdy nie przekroczyła tysiąca, w drugim etapie przekroczyła tysiąc i rozpoczął się szybki, a następnie bardzo szybki wzrost dziennej liczby zakażeń. Zauważmy też, że tygodniowa średnia krocząca po raz ostatni osiągnęła lokalne minimum 11.09.2020 (192) – 461 zakażeń i od tego czasu nieprzerwanie rosła przez 61 dni do 11.11.2020 (253) – 25615 zakażeń. Konsekwentnie sporządzimy osobne wykresy dla każdego z etapów, bo pozwala to lepiej prezentować uzyskiwane dane.


Pierwszy etap epidemii: od 04.03.2020 (1) do 18.09.2020 (199)

Dynamika rozprzestrzeniania się koronawirusa SARS-CoV-2 w Polsce w pierwszym okresie epidemii wyglądała następująco:

Liczba wykrytych zakażeń w kolejnych dniach epidemii i tygodniowa średnia krocząca liczby wykrytych zakażeń (obliczana z ostatnich siedmiu dni). Wielomianowa krzywa regresji (zielona linia) ma na celu jedynie lepsze ukazanie przebiegu zmian.


Drugi etap epidemii: od 19.09.2020 (200) do chwili obecnej

Dynamika rozprzestrzeniania się koronawirusa SARS-CoV-2 w Polsce w drugim okresie epidemii ma zupełnie inny przebieg i możemy powiedzieć, że dzienna liczba zakażeń wyrwała się spod kontroli. Czytelnik powinien mieć świadomość, że wzrost dziennej liczby przypadków jest na poniższym wykresie ponad dziesięciokrotnie szybszy niż na wykresie sporządzonym dla pierwszego etapu.

Liczba wykrytych zakażeń w kolejnych dniach epidemii i tygodniowa średnia krocząca liczby wykrytych zakażeń (obliczana z ostatnich siedmiu dni). Wielomianowa krzywa regresji (zielona linia) ma na celu jedynie lepsze ukazanie przebiegu zmian.



Liczba wykrytych zakażeń w kolejnych dniach

Poniższe tabele przedstawiają liczbę N stwierdzonych zakażeń w kolejnych dniach oraz sumę wszystkich zakażeń od początku epidemii. Liczby w nawiasie określają liczbę dni, które upłynęły od początku epidemii.


Pierwszy etap epidemii: od 04.03.2020 (1) do 18.09.2020 (199)

MAR N KWI N MAJ N CZE N LIP N SIE N WRZ N
01 (   ) 01 ( 29) 243 2554 01 ( 59) 228 13105 01 ( 90) 379 24165 01 (120) 382 34775 01 (151) 658 46346 01 (182) 550 67922
02 (   ) 02 ( 30) 392 2946 02 ( 60) 270 13375 02 ( 91) 230 24395 02 (121) 371 35146 02 (152) 548 46894 02 (183) 595 68517
03 (   ) 03 ( 31) 437 3383 03 ( 61) 318 13693 03 ( 92) 292 24687 03 (122) 259 35405 03 (153) 575 47469 03 (184) 612 69129
04 (  1) 1 1 04 ( 32) 244 3627 04 ( 62) 313 14006 04 ( 93) 361 25048 04 (123) 314 35719 04 (154) 680 48149 04 (185) 691 69820
05 (  2) 0 1 05 ( 33) 475 4102 05 ( 63) 425 14431 05 ( 94) 362 25410 05 (124) 231 35950 05 (155) 640 48789 05 (186) 567 70387
06 (  3) 4 5 06 ( 34) 311 4413 06 ( 64) 309 14740 06 ( 95) 576 25986 06 (125) 205 36155 06 (156) 726 49515 06 (187) 437 70824
07 (  4) 1 6 07 ( 35) 435 4848 07 ( 65) 307 15047 07 ( 96) 575 26561 07 (126) 257 36412 07 (157) 809 50324 07 (188) 302 71126
08 (  5) 5 11 08 ( 36) 357 5205 08 ( 66) 319 15366 08 ( 97) 599 27160 08 (127) 277 36689 08 (158) 843 51167 08 (189) 400 71526
09 (  6) 6 17 09 ( 37) 370 5575 09 ( 67) 285 15651 09 ( 98) 400 27560 09 (128) 262 36951 09 (159) 624 51791 09 (190) 421 71947
10 (  7) 5 22 10 ( 38) 380 5955 10 ( 68) 345 15996 10 ( 99) 282 27842 10 (129) 265 37216 10 (160) 619 52410 10 (191) 506 72453
11 (  8) 9 31 11 ( 39) 401 6356 11 ( 69) 330 16326 11 (100)[2] 359 28201 11 (130) 305 37521 11 (161) 551 52961 11 (192) 594 73047
12 (  9) 20 51 12 ( 40) 318 6674 12 ( 70) 595 16921 12 (101) 376 28577 12 (131) 370 37891 12 (162) 715 53676 12 (193) 603 73650
13 ( 10) 17 68 13 ( 41) 260 6934 13 ( 71) 283 17204 13 (102) 440 29017 13 (132) 299 38190 13 (163) 811 54487 13 (194) 502 74152
14 ( 11) 36 104 14 ( 42) 268 7202 14 ( 72) 411 17615 14 (103) 375 29392 14 (133) 267 38457 14 (164) 832 55319 14 (195) 377 74529
15 ( 12) 21 125 15 ( 43) 380 7582 15 ( 73) 401 18016 15 (104) 396 29788 15 (134) 264 38721 15 (165) 771 56090 15 (196) 605 75134
16 ( 13) 52 177 16 ( 44) 336 7918 16 ( 74) 241 18257 16 (105) 407 30195 16 (135) 333 39054 16 (166) 594 56684 16 (197) 600 75734
17 ( 14) 61 238 17 ( 45) 461 8379 17 ( 75) 272 18529 17 (106) 506 30701 17 (136) 353 39407 17 (167) 595 57279 17 (198) 837 76571
18 ( 15) 49 287 18 ( 46) 363 8742 18 ( 76) 356 18885 18 (107) 314 31015 18 (137) 339 39746 18 (168) 597 57876 18 (199) 757 77328
19 ( 16) 68 355 19 ( 47) 545 9287 19 ( 77) 383 19268 19 (108) 301 31316 19 (138) 358 40104 19 (169) 735 58611 19 (200) 1002 78330
20 ( 17) 70 425 20 ( 48) 306 9593 20 ( 78) 471 19739 20 (109) 304 31620 20 (139) 279 40383 20 (170) 767 59378 20 (201) 910 79240
21 ( 18) 111 536 21 ( 49) 263 9856 21 ( 79) 404 20143 21 (110) 311 31931 21 (140) 399 40782 21 (171) 903 60281 21 (202) 748 79988
22 ( 19) 98 634 22 ( 50) 313 10169 22 ( 80) 476 20619 22 (111) 296 32227 22 (141) 380 41162 22 (172) 900 61181 22 (203) 711 80699
23 ( 20) 115 749 23 ( 51) 342 10511 23 ( 81) 312 20931 23 (112) 300 32527 23 (142) 418 41580 23 (173) 581 61762 23 (204) 974 81673
24 ( 21) 152 901 24 ( 52) 381 10892 24 ( 82) 395 21326 24 (113) 294 32821 24 (143) 458 42038 24 (174) 548 62310 24 (205) 1136 82809
25 ( 22) 150 1051 25 ( 53) 381 11273 25 ( 83) 305 21631 25 (114) 298 33119 25 (144) 584 42622 25 (175) 763 63073 25 (206) 1587 84396
26 ( 23) 170 1221 26 ( 54) 344 11617 26 ( 84) 443 22074 26 (115) 276 33395 26 (145) 443 43065 26 (176) 729 63802 26 (207) 1584 85980
27 ( 24) 168 1389 27 ( 55) 285 11902 27 ( 85) 399 22473 27 (116) 319 33714 27 (146) 337 43402 27 (177) 887 64689 27 (208) 1350 87330
28 ( 25) 249 1638 28 ( 56) 316 12218 28 ( 86) 352 22825 28 (117) 193 33907 28 (147) 502 43904 28 (178) 791 65480 28 (209) 1306 88636
29 ( 26) 224 1862 29 ( 57) 422 12640 29 ( 87) 330 23155 29 (118) 247 34154 29 (148) 512 44416 29 (179) 759 66239 29 (210) 1326 89962
30 ( 27) 193 2055 30 ( 58) 300 12877 30 ( 88) 416 23571 30 (119) 239 34393 30 (149) 615 45031 30 (180) 631 66870 30 (211) 1552 91514
31 ( 28) 256 2311 31 ( 89) 215 23786 31 (150) 657 45688 31 (181) 502 67372


Drugi etap epidemii: od 19.09.2020 (200) do chwili obecnej

WRZ N PAŹ N LIS N GRU N
01 (182) 550 67922 01 (212) 1967 93481 01 (243) 17171 379902 01 (273) 9105 999924
02 (183) 595 68517 02 (213) 2292 95773 02 (244) 15578 395480 02 (274) 13855 1013747
03 (184) 612 69129 03 (214) 2367 98140 03 (245) 19364 414844 03 (275) 14838 1028610
04 (185) 691 69820 04 (215) 1934 100074 04 (246) 24692 439536 04 (276)
05 (186) 567 70387 05 (216) 2006 102080 05 (247) 27143 466679 05 (277)
06 (187) 437 70824 06 (217) 2236 104316 06 (248) 27086 493765 06 (278)
07 (188) 302 71126 07 (218) 3003 107319 07 (249) 27875 521640 07 (279)
08 (189) 400 71526 08 (219) 4280 111599 08 (250) 24785 546425 08 (280)
09 (190) 421 71947 09 (220) 4739 116338 09 (251) 21713 568138 09 (281)
10 (191) 506 72453 10 (221) 5300 121638 10 (252) 25484 593592 10 (282)
11 (192) 594 73047 11 (222) 4178 125816 11 (253) 25221 618813 11 (283)
12 (193) 603 73650 12 (223) 4394 130210 12 (254) 22683 641496 12 (284)
13 (194) 502 74152 13 (224) 5068 135278 13 (255) 24051 665547 13 (285)
14 (195) 377 74529 14 (225) 6526 141804 14 (256) 25571 691118 14 (286)
15 (196) 605 75134 15 (226) 8099 149903 15 (257) 21854 712972 15 (287)
16 (197) 600 75734 16 (227) 7705 157608 16 (258) 20816 733788 16 (288)
17 (198) 837 76571 17 (228) 9622 167230 17 (259) 19152 752940 17 (289)
18 (199) 757 77328 18 (229) 8536 175766 18 (260) 19883 772823 18 (290)
19 (200) 1002 78330 19 (230) 7482 183248 19 (261) 23975 796798 19 (291)
20 (201) 910 79240 20 (231) 9291 192539 20 (262) 22464 819262 20 (292)
21 (202) 748 79988 21 (232) 10040 202579 21 (263) 24213 843475 21 (293)
22 (203) 711 80699 22 (233) 12107 214686 22 (264) 18467 861331 22 (294)
23 (204) 974 81673 23 (234) 13632 228318 23 (265) 15002 876333 23 (295)
24 (205) 1136 82809 24 (235) 13628 241946 24 (266) 10139 909066 24 (296)
25 (206) 1587 84396 25 (236) 11742 253688 25 (267) 15362 924422 25 (297)
26 (207) 1584 85980 26 (237) 10241 263929 26 (268) 16687 941112 26 (298)
27 (208) 1350 87330 27 (238) 16300 280229 27 (269) 17060 958416 27 (299)
28 (209) 1306 88636 28 (239) 18820 299049 28 (270) 15178 973593 28 (300)
29 (210) 1326 89962 29 (240) 20156 319205 29 (271) 11483 985075 29 (301)
30 (211) 1552 91514 30 (241) 21629 340834 30 (272) 5733 990811 30 (302)
31 (242) 21897 362731 31 (303)



Jak rozprzestrzeniają się zakażenia

Najgorszy przypadek rozprzestrzeniania się choroby opisuje krzywa wykładnicza. Typowy przykład: każda chora osoba w ciągu okresu T dni zaraża N zdrowych osób. Po upływie k takich okresów T zarażonych jest Nk osób. To wzrost wykładniczy – najgorszy z możliwych. Rozstrzygnięcie, z jakim rodzajem wzrostu mamy do czynienia w Polsce, jest kluczowe dla nas wszystkich. Najpierw przyjrzyjmy się rodzajom funkcji, które mogą opisywać wzrost liczby osób zakażonych i oczekiwaną liczbę przypadków w kolejnych dniach epidemii.


Liczba chorych po n dniach epidemii Przyrost liczby chorych w kolejnych dniach Uwagi
y(n) = ea·n + b y(n+1) - y(n) = ea·n + b + c wzrost wykładniczy,   c = log(ea - 1)
podwojenie co T = log(2)/a dni
y(n) = a·n + b y(n+1) - y(n) = a wzrost liniowy
y(n) = a·n2 + b·n + c y(n+1) - y(n) = 2a·n + b1 wzrost kwadratowy,   b1 = a + b
y(n) = a·n3 + b·n2 + c·n + d y(n+1) - y(n) = 3a·n2 + b2·n + c2 wzrost sześcienny,   b2 = 3a + 2b,   c2 = a + b + c


Widzimy, że jeżeli wzrost ogólnej liczby przypadków jest opisywany funkcją wykładniczą, to dzienne przyrosty liczby chorych również są opisywane funkcją wykładniczą. W przypadku, gdy wzrost ogólnej liczby chorych opisywany jest wielomianem, to dzienne przyrosty liczby chorych są opisywane wielomianem o jeden stopień niższym.



Wykresy z kwietnia 2020 roku

Liczba wykrytych zakażeń (w ciągu doby). Okres od 10 kwietnia 2020 r. do 23 kwietnia 2020 r. Zielona linia jest krzywą regresji liniowej, a czerwona linia krzywą regresji wielomianowej dla wielomianu drugiego stopnia.


Łączna liczba wykrytych zakażeń. Okres od 10 kwietnia 2020 r. do 23 kwietnia 2020 r. Zielona linia jest krzywą regresji wielomianowej dla wielomianu drugiego stopnia.


Łączna liczba wykrytych zakażeń (skala logarytmiczna). Okres od 10 kwietnia 2020 r. do 23 kwietnia 2020 r. Zielona linia jest krzywą regresji wielomianowej dla wielomianu drugiego stopnia. Dobrze widoczne jest powolne wyhamowywanie epidemii.



Zastosowany sposób analizy całkowitej liczby zakażeń

Do badania statystycznego wybieramy okres 14 dni. Ostatni dzień tego okresu to dzień nadejścia najnowszych danych. Omówimy jak znajdować wykładniczą i wielomianową funkcję regresji. Jeśli Czytelnik nie jest zainteresowany zapoznaniem się z zastosowaną metodą obliczeń, to bez najmniejszej straty może pominąć tę sekcję.


Wykładnicza krzywa regresji

Przypuśćmy, że wzrost całkowitej liczby zakażeń jest opisywany funkcją wykładniczą y(n) = exp(a·n + b) i wyznaczmy parametry tej funkcji. Łatwo zauważamy, że problem ten sprowadza się do problemu liniowego, bo logarytmując obie strony wypisanego równania mamy log( y(n) ) = a·n + b. Dlatego w kolejnych kolumnach arkusza kalkulacyjnego umieszczamy:

  • logarytm naturalny całkowitej liczby zakażeń w kolejnych dniach wybranego przedziału (to są dane Y)
  • numer kolejnego dnia epidemii odpowiadający datom z wybranego okresu (to są dane X)


Korzystając z funkcji arkusza REGLINP()[3][4], otrzymujemy wartości współczynników. Przykładowo dla dnia 25 marca 2020 r. (22 dzień epidemii) znajdujemy wartości:

a = 0,229 (z błędem 0,018)
b = 2,08 (z błędem 0,28)

Jako wartość błędu przyjęliśmy podwojoną wartość odchylenia standardowego σ dla każdego ze współczynników. Zatem szukana funkcja ma postać: y(n) = exp( 0,229·n + 2,08 ), gdzie n przyjmuje wartości z przedziału [9, 22].

Zwraca uwagę wysoka korelacja równa 0,992. Zauważmy, że znalezionej wartości współczynnika a odpowiada okres podwojenia całkowitej liczby zakażeń T2 = log(2)/a równy 3 dni. Wartość ta tak znacznie odbiega od rzeczywistości, że wykładniczej funkcji regresji w ogóle nie będziemy brali pod uwagę.


Już teraz zauważmy, że jeśli epidemia potrwa dłużej, to numery kolejnych dni epidemii osiągną duże wartości. Przykładowo będziemy mieli n = 101, 102, …, 114. Gdy argument funkcji przyjmuje tak duże wartości, to w funkcji opisującej znalezioną krzywą regresji pojawiają się ogromne współczynniki. Przewidując ten problem, warto dokonać podstawienia x = n – n0 + 1, gdzie n0 oznacza numer dnia epidemii dla pierwszego dnia wybranego przedziału danych. W naszym przypadku tak zdefiniowana zmienna x będzie zawsze przyjmowała wartości od 1 do 14.

Powtarzając obliczenia dla zmiennej x, otrzymujemy:

a = 0,229 (z błędem 0,018)
b = 3,92 (z błędem 0,15)

Czyli szukana funkcja wykładnicza ma postać: y(x) = exp( 0,229·x + 3,92 ), gdzie x przymuje wartości z przedziału [1, 14].

Zauważmy, że wartości współczynnika a oraz współczynnika korelacji nie zmieniły się, ale współczynnik b oraz jego błąd uległy zmianie. Czego należało się spodziewać.

Zawsze możemy przejść od zmiennej x do zmiennej n. W naszym przypadku wystarczy wykonać podstawienie: x = n – 8. Czytelnik może wykonać to podstawienie i porównać uzyskany wzór ze wzorem obliczonym wcześniej.

Dokładnie taka postać funkcji jest znajdowana, gdy tworzymy krzywą regresji przy pomocy Kreatora wykresów dostępnego w pakiecie LibreOffice Calc. W rzeczywistości jest to ogromne ułatwienie: nie musimy wzoru opisującego krzywą regresji znajdować sami, a zostaje on automatycznie wygenerowany w czasie tworzenia wykresu. Oczywiście nie uzyskamy w ten sposób innych informacji statystycznych (na przykład odchylenia standardowego dla wyliczonych współczynników), ale w pewnych przypadkach uzyskanie postaci funkcji może nas w zupełności zadowolić.


Kwadratowa funkcja regresji

Zauważmy, że wzrost całkowitej liczby zakażeń z pewnością nie jest opisywany funkcją liniową, bo liczba rejestrowanych każdego dnia przypadków nie jest stała, ale zdecydowanie rośnie. Przypuśćmy zatem, że wzrost ten jest opisywany funkcją kwadratową i wyznaczmy parametry tej funkcji. Sytuacja jest bardziej skomplikowana, bo odpowiednie wzory opisujące regresję liniową są łatwo dostępne, ale na regresję nieliniową już nie. Jednak niektóre problemy nieliniowe dają się łatwo zlinearyzować. Tak uczyniliśmy przed chwilą w przypadku funkcji wykładniczej: logarytmy wartości tej funkcji są opisywane funkcją liniową, dlatego przygotowaliśmy w kolumnie logarytmy ogólnej liczby przypadków. Podobnie w przypadku zjawiska opisywanego funkcją kwadratową postaci y = ax2 + b, podstawienie u = x2 linearyzuje problem, a w kolumnie wystarczy wpisać wartości kwadratów zmiennej niezależnej x.


W naszym przypadku uczynimy tak samo, choć problem będzie bardziej skomplikowany. Podstawiając u = x2 sprowadzamy problem badania funkcji y = ax2 + bx + c do badania funkcji y = au + bx + c, czyli do problemu dwukrotnej regresji liniowej[5], gdzie są już odpowiednie wzory, a funkcja REGLINP() ponownie okaże się przydatna.


Pamiętając o potrzebie przejścia do zmiennej x = n – n0 + 1, gdzie n0 oznacza numer dnia epidemii dla pierwszego dnia wybranego przedziału danych, w kolejnych kolumnach arkusza kalkulacyjnego umieszczamy:

  • całkowitą liczbę zakażeń w kolejnych dniach wybranego przedziału (to są dane Y)
  • liczby od 1 do 14 (numerują one dni epidemii w wybranym przedziale danych) (to są dane X)
  • kwadraty liczb od 1 do 14 (to też są dane X)


Ponownie korzystając z funkcji arkusza REGLINP(), otrzymujemy wartości współczynników:

a = 5,46 (z błędem 0,49)
b = -7,3 (z błędem 7,5)
c = 66 (z błędem 25)

Zwraca uwagę niezwykle wyskoki współczynnik korelacji równy 0,999.

Czyli szukany wielomian drugiego stopnia ma postać: z(x) = 5,46·x2 - 7,3·x + 66, gdzie x przyjmuje wartości z przedziału [1, 14].


Wzrost całkowitej liczby zakażeń opisywany funkcją kwadratową jest znacznie bardziej zbliżony do rzeczywistości. Funkcja kwadratowa jest znacznie lepiej dopasowana do rzeczywistych danych – pokazuje to efekt działań podjętych przez rząd: początkowo wykładniczy wzrost liczby chorych przeszedł we wzrost opisywany funkcją kwadratową i miejmy nadzieję, że za kilka tygodni zacznie wygasać.


Sześcienna funkcja regresji

Oczywiście (wbrew doniesieniom mediów) całkowita liczba zakażeń nie nie rośnie wykładniczo, a rośnie (od 20 dnia epidemii) wielomianowo i biegnie między krzywymi opisywanymi wielomianem 2 i 3 stopnia.

Sposób postępowania jest analogiczny jak dla wielomianu stopnia drugiego, dlatego jedynie go naszkicujemy. Podstawiając u = x2t = x3, sprowadzamy problem do badania funkcji postaci y = at + bu + cx + d, czyli sprowadzamy problem do trzykrotnej regresji liniowej[5] i ponownie funkcja REGLINP() okaże się niezwykle pomocna.

Dokonujemy przejścia do zmiennej x = n – n0 + 1, gdzie n0 oznacza numer dnia epidemii dla pierwszego dnia wybranego przedziału danych i w kolejnych kolumnach arkusza kalkulacyjnego umieszczamy:

  • całkowitą liczbę zakażeń w kolejnych dniach wybranego przedziału (to są dane Y)
  • liczby od 1 do 14 (numerują one dni epidemii w wybranym przedziale danych) (to są dane X)
  • kwadraty liczb od 1 do 14 (to też są dane X)
  • sześciany liczb od 1 do 14 (to również są dane X)


Korzystając z funkcji arkusza REGLINP(), otrzymujemy wartości współczynników (dla danych z dnia 26 marca 2020 r.):

a = 0,206 (z błędem 0,077)
b = 1,3 (z błędem 1,8)
c = 26 (z błędem 12)
d = 41 (z błędem 21)

Zwraca uwagę niezwykle wysoki współczynnik korelacji równy 0,9999.

Czyli szukany wielomian trzeciego stopnia ma postać: w(x) = 0,206·x3 + 1,3·x2 + 26·x + 41, gdzie x przyjmuje wartości z przedziału [1, 14].



Zestawienie wyników dla kolejnych dni

W tabeli przedstawiamy rezultaty otrzymane dla danych obejmujących 14 dni (do daty podanej w kolumnie Data). W kolumnach zamieszczamy:

  • kolejne daty (w nawiasie dzień epidemii), dla których wykonane zostały obliczenia
  • otrzymaną postać wielomianu drugiego stopnia
  • liczbę dni T2 po jakiej (dla znalezionego wielomianu drugiego stopnia) nastąpi podwojenie łącznej liczby stwierdzonych zakażeń (dla wielomianu w(x), gdzie x przyjmuje wartości z przedziału [1, 14], wartość T2 wynika z rozwiązania równania w(T2 + 14) = 2·w(14)[6])
  • otrzymaną postać wielomianu trzeciego stopnia
  • liczbę dni T2 po jakiej (dla znalezionego wielomianu trzeciego stopnia) nastąpi podwojenie łącznej liczby stwierdzonych zakażeń (dla wielomianu w(x), gdzie x przyjmuje wartości z przedziału [1, 14], wartość T2 wynika z rozwiązania równania w(T2 + 14) = 2·w(14)[6])
  • związek między zmienną x przyjmującą wartości z przedziału [1, 14], a zmienną n oznaczającą kolejne dni epidemii


Zauważmy, że kierunek zmian wartości T2 obserwowany w dłuższym okresie będzie bardzo dobrym wskaźnikiem przebiegu epidemii.

Data Wielomian 2 stopnia T2 Wielomian 3 stopnia T2 Uwagi
23.03.2020 ( 20) 4,37·x2 - 11,2·x + 39 4,80 0.127·x3 + 1.5·x2 + 7·x + 13 4.32 x = n - 6
24.03.2020 ( 21) 4,92·x2 - 9,7·x + 50 4,96 0.185·x3 + 0.8·x2 + 16·x + 12 4.35 x = n - 7
25.03.2020 ( 22) 5,46·x2 - 7,3·x + 66 5,13 0.196·x3 + 1.0·x2 + 20·x + 26 4.53 x = n - 8
26.03.2020 ( 23) 5,96·x2 - 3,3·x + 83 5,32 0,206·x3 + 1,3·x2 + 26·x + 41 4,73 x = n - 9
27.03.2020 ( 24) 6,33·x2 + 2,9·x + 104 5,55 0,136·x3 + 3,3·x2 + 22·x + 77 5,15 x = n - 10
28.03.2020 ( 25) 7,05·x2 + 6,3·x + 136 5,69 0,240·x3 + 1,6·x2 + 40·x + 87 5,08 x = n - 11
29.03.2020 ( 26) 7,79·x2 + 9,9·x + 180 5,84 0,207·x3 + 3,1·x2 + 39·x + 138 5,33 x = n - 12
30.03.2020 ( 27) 7,85·x2 + 23,1·x + 211 6,15 0,023·x3 + 7,3·x2 + 26·x + 206 6,09 x = n - 13
31.03.2020 ( 28) 7,79·x2 + 39,1·x + 242 6,50 -0,028·x3 + 8,4·x2 + 35·x + 248 6,58 x = n - 14
01.04.2020 ( 29) 7,57·x2 + 57,2·x + 285 6,89 -0,114·x3 + 10,1·x2 + 41·x + 308 7,25 x = n - 15
02.04.2020 ( 30) 8,39·x2 + 63,0·x + 367 7,01 0,161·x3 + 4,8·x2 + 85·x + 334 6,61 x = n - 16
03.04.2020 ( 31) 10,21·x2 + 57,3·x + 489 6,91 0,530·x3 -1,7·x2 + 131·x + 381 5,92 x = n - 17
04.04.2020 ( 32) 10,3·x2 + 74,8·x + 571 7,21 0,363·x3 + 2,2·x2 + 125·x + 497 6,49 x = n - 18
05.04.2020 ( 33) 11,4·x2 + 81,0·x + 694 7,30 0,447·x3 + 1,3·x2 + 144·x + 602 6,50 x = n - 19
06.04.2020 ( 34) 11,4·x2 + 101·x + 805 7,64 0,082·x3 + 9,5·x2 + 113·x + 788 7,46 x = n - 20
07.04.2020 ( 35) 11,3·x2 + 124·x + 925 7,97 -0,101·x3 + 13,6·x2 + 110·x + 946 8,20 x = n - 21
08.04.2020 ( 36) 10,4·x2 + 156·x + 1043 8,50 -0,437·x3 + 20,2·x2 + 95·x + 1132 9,74 x = n - 22
09.04.2020 ( 37) 8,9·x2 + 195·x + 1168 9,19 -0,734·x3 + 25,4·x2 + 93·x + 1318 12,09 x = n - 23
10.04.2020 ( 38) 7,4·x2 + 233·x + 1327 9,98 -0,999·x3 + 29,8·x2 + 93·x + 1531 16,35 x = n - 24
11.04.2020 ( 39) 5,3·x2 + 277·x + 1480 10,99 -0,870·x3 + 24,9·x2 + 155·x + 1658 17,49 x = n - 25
12.04.2020 ( 40) 2,6·x2 + 328·x + 1642 12,50 -0,676·x3 + 17,8·x2 + 233·x + 1780 18,81 x = n - 26
13.04.2020 ( 41) -0,40·x2 + 374·x + 1857 14,00[7] -0,687·x3 + 15,1·x2 + 278·x + 1997 19,47[7] x = n - 27
14.04.2020 ( 42) -3,1·x2 + 411·x + 2122 16,54 -0,661·x3 + 11,8·x2 + 319·x + 2257 25,91 x = n - 28
15.04.2020 ( 43) -3,6·x2 + 413·x + 2507 18,01 -0,566·x3 + 9,2·x2 + 334·x + 2622 27,01 x = n - 29
16.04.2020 ( 44) -3,8·x2 + 410·x + 2894 19,35 -0,332·x3 + 3,7·x2 + 364·x + 2962 23,86 x = n - 30
17.04.2020 ( 45) -3,3·x2 + 404·x + 3267 19,77 0,585·x3 - 16,5·x2 + 485·x + 3148 15,60 x = n - 31
18.04.2020 ( 46) -1,3·x2 + 370·x + 3738 18,96 0,751·x3 - 18,2·x2 + 475·x + 3585 14,56 x = n - 32
19.04.2020 ( 47) 1,3·x2 + 336·x + 4173 17,57 1,427·x3 - 30,8·x2 + 535·x + 3882 11,98 x = n - 33
20.04.2020 ( 48) 3,4·x2 + 308·x + 4611 16,96 1,049·x3 - 20,2·x2 + 454·x + 4397 12,84 x = n - 34
21.04.2020 ( 49) 3,3·x2 + 310·x + 4959 17,62 0,318·x3 - 3,9·x2 + 354·x + 4894 15,95 x = n - 35
22.04.2020 ( 50) 2,7·x2 + 318·x + 5293 18,64 -0,489·x3 + 13,7·x2 + 250·x + 5393 23,06 x = n - 36
23.04.2020 ( 51) 1,8·x2 + 330·x + 5615 19,88 -1,097·x3 + 26,5·x2 + 177·x + 5839 ---- x = n - 37



Rzeczywista dzienna liczba zakażonych a wartości oczekiwane

W zamieszczonej niżej tabeli zebraliśmy rzeczywiste liczby osób zakażonych koronawirusem, tak aby można było łatwo je porównać z przewidywanymi wartościami.

Data Rzeczywista liczba zakażeń Przewidywana liczba - wielomian 2 stopnia Przewidywana liczba - wielomian 3 stopnia
24.03.2020 (21) 152 105 131+
25.03.2020 (22) 150 111 149+
26.03.2020 (23) 170 134 174-
27.03.2020 (24) 168 154+ 196
28.03.2020 (25) 249 183 211+
29.03.2020 (26) 224 179 228-
30.03.2020 (27) 193 218- 260
31.03.2020 (28) 256 268- 273
01.04.2020 (29) 243 272 266-
02.04.2020 (30) 392 292+ 269
03.04.2020 (31) 437 254 287+
04.04.2020 (32) 244 263- 371
05.04.2020 (33) 475 388 462+
06.04.2020 (34) 311 372- 463
07.04.2020 (35) 435 470- 487
08.04.2020 (36) 357 472 452-
09.04.2020 (37) 370 518 429-
10.04.2020 (38) 380 527 377+
11.04.2020 (39) 401 518 314+
12.04.2020 (40) 318 476 298+
13.04.2020 (41) 260 461 323-
14.04.2020 (42) 268 448 308-
15.04.2020 (43) 380 397- 262
16.04.2020 (44) 336 313+ 198
17.04.2020 (45) 461 283+ 215
18.04.2020 (46) 363 199 318+
19.04.2020 (47) 545 258 411+
20.04.2020 (48) 306 229+ 520
21.04.2020 (49) 263 387- 601
22.04.2020 (50) 313 483- 548
23.04.2020 (51) 342 497 397-
24.04.2020 (52) 381 471- 247


W ostatnim wierszu tabeli podajemy oczekiwaną liczbę nowych zakażeń koronawirusem w następnym dniu epidemii dla wielomianowych krzywych regresji. Najlepiej dopasowaną przewidywaną wartość do danych rzeczywistych zapisaliśmy pogrubioną czcionką. Znak + informuje nas, że wartość tę należy powiększyć, aby uzyskać wartość rzeczywistą, a znak - informuje nas, że wartość tę należy pomniejszyć. Tabela ta pokazuje w bardzo przejrzysty sposób sytuację epidemiczną. Rzeczywisty sukces w walce z epidemią zostanie natychmiast zauważony: najlepiej dopasowane będą wartości w trzeciej kolumnie i zostaną opatrzone znakiem minus.


28 marca 2020 r.: Duży wzrost liczby zakażonych, znacznie odbiegający od wartości oczekiwanych. W komunikacie z 20:02 Ministerstwo Zdrowia poinformowało o 157 nowych przypadkach, z których ponad połowę (103) stanowiły osoby z województwa mazowieckiego. Następnego dnia wyjaśniono, że wzrost ten spowodowany został wykryciem ogniska koronawirusa w Domu Pomocy Społecznej w Niedabylu – stwierdzono zakażenie koronawirusem u 60 osób[8].

31 marca 2020 r.: Po raz pierwszy współczynnik przy x3 zmienił znak i stał się liczbą ujemną. Oznacza to, że wielomian 3 stopnia dla pewnej wartości x osiągnie maksimum i przestanie rosnąć.

2 kwietnia 2020 r.: Duży wzrost liczby zakażonych, znacznie odbiegający od wartości oczekiwanych. W komunikacie z 21:14 Ministerstwo Zdrowia poinformowało o 254 nowych przypadkach, z których ponad połowę (142) stanowiły osoby z województwa mazowieckiego. Nie wyjaśniono powodów tak dużej liczby zakażeń. Może ma to związek ze znacznym zwiększeniem liczby wykonywanych testów[9], a może czeka nas gwałtowny wzrost liczby zakażeń.

3 kwietnia 2020 r.: W komunikacie z godziny 10:00 Ministerstwo poinformowało o 203 nowych przypadkach. Ponad połowa, bo 125 osób, były to przypadki z województwa śląskiego. Nie wyjaśniono przyczyn tak wielkiej liczby zakażeń w tym województwie.

7 kwietnia 2020 r.: Po raz drugi współczynnik przy x3 zmienił znak i stał się liczbą ujemną.

9 kwietnia 2020 r.: Wygląda na to, że współczynnik przy x3 w wielomianie trzeciego stopnia pozostanie liczbą ujemną. Bez trudu możemy policzyć, że wypisany wielomian osiągnie maksimum 48 dnia epidemii, czyli 20 kwietnia. Daje to pierwsze oszacowanie dnia, od którego liczba osób zakażonych w kolejnych dniach powinna zdecydowanie zmaleć.

11 kwietnia 2020 r.: Wielomian trzeciego stopnia osiąga maksimum 46 dnia epidemii, czyli 18 kwietnia. Zgodność tego wyniku i wyniku uzyskanego 9 kwietnia zwiększa zaufanie do uzyskanych rezultatów.

13 kwietnia 2020 r.: Po raz pierwszy współczynnik przy x2 w wielomianie drugiego stopnia zmienił znak i stał się liczbą ujemną. Wielomian trzeciego stopnia osiąga maksimum 48 dnia epidemii, czyli 20 kwietnia, co oznacza bardzo dobrą zgodność z poprzednimi wynikami. Od pięciu dni jest odnotowywana praktycznie stała liczba zakażeń (na poziomie ok. 350 osób dziennie), a dzisiaj nastąpił znaczący spadek (260 przypadków). Ze względu na brak rozwiązań odpowiedniego równania w przypadku wielomianu trzeciego stopnia nastąpiła zmiana sposobu obliczania okresu podwojenia T2[7]. Ta wymuszona zmiana jest również korzystnym sygnałem.

15 kwietnia 2020 r.: Od 9 kwietnia funkcja regresji kwadratowej dla liczby wykrytych zakażeń (w ciągu doby) osiąga maksimum w rozpatrywanym przedziale danych i przechodzi w funkcję malejącą. Podobnie od 14 kwietnia krzywa regresji liniowej jest krzywą malejącą. Mimo dzisiejszego wzrostu zakażeń (380 przypadków) obie krzywe regresji dla łącznej liczby przypadków utrzymały ujemne współczynniki przy wyrazach w najwyższej potędze. Wielomian trzeciego stopnia niezmiennie osiąga maksimum około 20 kwietnia. Najbliższe dni rozstrzygną, czy obserwujemy trwałe spowolnienie epidemii.

19 kwietnia 2020 r.: Wzrost liczby zakażeń koronawirusem wiąże się z wykryciem trzech nowych ognisk; dotyczą one ośrodków opieki długoterminowej w Kaliszu (woj. wielkopolskie) i Czernichowie (woj. śląskie) oraz szpitala w Jastrzębiu-Zdroju (woj. śląskie)[10].

23 kwietnia 2020 r.: Ponownie wystąpił brak rozwiązań odpowiedniego równania w przypadku wielomianu trzeciego stopnia, dlatego nie podajemy okresu podwojenia (nie będzie kolejnej modyfikacji formuły, według której obliczany jest okres podwojenia T2). Fakt ten utwierdza nas w przekonaniu, że epidemia zdecydowanie spowolniła.


Na podstawie następujących faktów:

  • wzrost całkowitej liczby zakażeń nie ma charakteru wykładniczego, a wielomianowy o stopniu nie wyższym od trzeciego
  • przewidywany okres podwojenia T2 systematycznie wydłuża się
  • oczekiwane wartości liczby zakażeń w ciągu kolejnych dni dobrze odpowiadają odnotowanym danym rzeczywistym

łatwo stwierdzamy, że sytuacja w Polsce powoli się poprawia dzięki zdecydowanym działaniom rządu i wysiłkowi całego społeczeństwa, a sugestie, że w Polsce powtórzy się scenariusz włoski, są całkowicie nieprawdziwe.


Przedstawiony obraz był prawdziwy i przewidywalny do 2 kwietnia. Co takiego się stało, że epidemia przyspieszyła mimo nakładania kolejnych ograniczeń przez rząd? Trudno wskazać jakiekolwiek sensowne wyjaśnienie poza (być może) wykrytymi ogniskami zakażeń lub zwiększoną liczbą wykonywanych testów. Po gwałtownym skoku liczby zakażonych 2, 3 i 5 kwietnia obecnie sytuacja wydaje się stabilizować. Okres podwojenia całkowitej liczby osób zakażonych T2 wyraźnie rośnie, a przewidywana liczba osób zakażonych jest większa niż w rzeczywistości (od 6 kwietnia). Daje to ponownie nadzieję na zdecydowane spowolnienie epidemii w ciągu najbliższych 10 dni.








Przypisy

  1. Stosujemy prostą średnią kroczącą (ruchomą) dla n = 7. (LINK1), (LINK2)
  2. Od 11 czerwca 2020 r. Ministerstwo Zdrowia zmieniło sposób raportowania danych. Dane w tabeli do dnia 10 czerwca są danymi z godziny 17:30. Od 11 czerwca (100 dzień epidemii) dane są raportowane tylko raz na dobę i podawane ok. godziny 10:30.
  3. LibreOffice Calc, Funkcje macierzowe, (LINK)
  4. LibreOffice 6.4 Help, REGLINP, (LINK)
  5. 5,0 5,1 Wyznaczenie współczynników wielokrotnej regresji liniowej oraz ich odchyleń standardowych przy pomocy metody najmniejszych kwadratów, (Opracowanie własne - LINK)
  6. 6,0 6,1 W rzeczywistości okres podwojenia T2 wyliczamy w bardziej skomplikowany sposób. Najpierw wyliczamy, jaka liczba dni D musi upłynąć od ostatniego (czyli 14) dnia badanego okresu, aby całkowita liczba zakażeń wzrosła o 18,9207%. Gdyby taka tendencja wzrostu liczby zakażeń była trwała, to podwojenie całkowitej liczby zakażonych nastąpiłoby po 4·D dniach. Jest tak dlatego, że (1.189207)^4 = 2. Wnioskowanie o okresie podwojenia na podstawie rozwiązania równania w(T2 + 14) = 2·w(14) jest nieuprawnioną ekstrapolacją wielomianu w(x). Nieuprawnioną dlatego, że na podstawie danych z 14 dni sięgamy od 5 do 7 dni w przyszłość (takie wartości T2 wynikały z rozwiązania tego równania). Zbierając: rozwiązujemy równanie w(D + 14) = 2^(1/4)·w(14) i otrzymaną liczbę D mnożymy przez 4.
  7. 7,0 7,1 7,2 Od 13 kwietnia 2020 r. nastąpiła (wymuszona) zmiana sposobu wyliczania okres podwojenia T2. Zmiana została spowodowana brakiem rozwiązań równania w(D + 14) = 2^(1/4)·w(14) w przypadku wielomianu trzeciego stopnia. Dlatego od 13 kwietnia rozwiązujemy równanie w(D + 14) = 2^(1/8)·w(14) i otrzymaną liczbę D mnożymy przez 8.
  8. Polska Agencja Prasowa SA, Kraska: Żaden polityk nie podejmie decyzji o wyborach narażając ludzi na niebezpieczeństwo utraty życia i zdrowia, (LINK)
  9. Ministerstwo Zdrowia informowało o następujących liczbach testów przeprowadzonych w ciągu doby:
    15 marca – 1 tys. (LINK)
    17 marca – 1,2 tys. (LINK)
    18 marca – 1,6 tys. (LINK)
    19 marca – 1,6 tys. (LINK)
    20 marca – 1,8 tys. (LINK)
    21 marca – 2 tys. (LINK)
    22 marca – 2,5 tys. (LINK)
    23 marca – 2,5 tys. (LINK)
    24 marca – 2,8 tys. (LINK)
    25 marca – 3,3 tys. (LINK)
    26 marca – 3,3 tys. (LINK)
    27 marca – 4,5 tys. (LINK)
    28 marca – 4,6 tys. (LINK)
    29 marca – 4,1 tys. (LINK)
    30 marca – 3,8 tys. (LINK)
    31 marca – 4,8 tys. (LINK)
    1 kwietnia – 4,3 tys. (LINK)
    2 kwietnia – 5,3 tys. (LINK)
    3 kwietnia – 5,7 tys. (LINK)
  10. Polska Agencja Prasowa SA, Rzecznik MZ: wzrost zakażeń koronawirusem wiąże się z wykryciem trzech nowych ognisk, (LINK)