Różnica pomiędzy stronami "Funkcje wbudowane, poradniki LibreOffice i inne linki" i "Liczby losowe – metoda odwracania dystrybuanty"

Z Henryk Dąbrowski
(Różnica między stronami)
Przejdź do nawigacji Przejdź do wyszukiwania
m (1 wersja)
 
m (1 wersja)
 
Linia 1: Linia 1:
<div style="text-align:right; font-size: 130%; font-style: italic; font-weight: bold;">11.07.2020</div>
+
<div style="text-align:right; font-size: 130%; font-style: italic; font-weight: bold;">06.01.2021</div>
  
 +
__FORCETOC__
  
  
  
 +
== Gęstość prawdopodobieństwa i dystrybuanta ==
  
== Uwagi ==
+
Rozważmy funkcję <math>f(x)</math> określoną na <math>\mathbb{R}</math>, nieujemną i całkowalną. Powiemy, że <math>f(x)</math> jest gęstością rozkładu prawdopodobieństwa <math>P</math>, jeżeli dla dowolnego zbioru <math>A \subset \mathbb{R}</math> jest
  
[[Co zrobić, jeśli funkcja jest dostępna w arkuszu, ale nie jest dostępna w makrach?]]
+
::<math>P(A)=\int\limits_A f(x)dx</math>
  
 +
gdzie <math>P(A)</math> jest prawdopodobieństwem przypisanym zbiorowi <math>A</math>.
  
 +
Z powyższej definicji wynika natychmiast, że funkcja <math>f(x)</math> musi być unormowana:
  
 +
::<math>\int^{+ \infty}_{- \infty} f(x)dx = 1</math>
  
  
== Libreoffice.org ==
+
Dystrybuantą gęstości prawdopodobieństwa <math>f(x)</math> nazywamy funkcję:
  
[https://help.libreoffice.org/latest/pl/text/shared/05/new_help.html The LibreOffice Help]
+
::<math>F(x) = \int^x_{- \infty} f(t)dt</math>
  
[https://help.libreoffice.org/6.4/pl/text/sbasic/shared/01020300.html Korzystanie z procedur i funkcji]<br/>
 
[https://help.libreoffice.org/latest/pl/text/sbasic/shared/01020300.html Korzystanie z procedur i funkcji]
 
  
[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03080601.html Alfabetyczny spis funkcji, instrukcji i operatorów]
+
Prawdopodobieństwo, że zmienna losowa przyjmie wartość należącą do przedziału <math>[a, b]</math> wynosi:
  
[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03010000.html Funkcje, twierdzenia i operatory]
+
::<math>P(a \leqslant x \leqslant b) = \int^b_a f(t)dt = F (b) - F (a)</math>
  
::[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03030000.html Funkcje daty i czasu]
 
  
::[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03060000.html Operatory logiczne]
 
  
::[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03070000.html Operatory matematyczne]
 
  
::[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03080000.html Funkcje numeryczne]
 
  
::[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03100000.html Zmienne]
+
== Rozkład równomierny <math>U(a, b)</math> ==
  
::[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03110100.html Operatory porównania]
+
Rozkładem równomiernym (prostokątnym) nazywamy rozkład prawdopodobieństwa, dla którego gęstość prawdopodobieństwa <math>f(x)</math> jest równa:
  
::[https://help.libreoffice.org/latest/pl/text/sbasic/shared/03120000.html Łańcuchy]
+
::<math>f(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < a\\
 +
  \frac{1}{b - a} & \text{dla} & x \in [a, b]\\
 +
  0 & \text{dla} & x > b
 +
\end{array} \right.</math>
  
[https://help.libreoffice.org/latest/pl/text/sbasic/shared/01030300.html Debugowanie programu Basic]
 
  
[https://help.libreoffice.org/latest/pl/text/scalc/01/04060100.html Funkcje (dostępne w arkuszu) według kategorii]
+
Tak zdefiniowany rozkład równomierny będziemy oznaczali <math>U(a, b)</math>. Dystrybuanta tego rozkładu jest określona wzorem:
  
::[https://help.libreoffice.org/latest/pl/text/scalc/01/04060102.html Funkcje daty i godziny]
+
::<math>F(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < a\\
 +
  \frac{x - a}{b - a} & \text{dla} & x \in [a, b]\\
 +
  1 & \text{dla} & x > b
 +
\end{array} \right.</math>
  
::[https://help.libreoffice.org/latest/pl/text/scalc/01/04060106.html Funkcje matematyczne]
 
  
::[https://help.libreoffice.org/latest/pl/text/scalc/01/04060108.html Funkcje statystyczne]
+
Zbiór liczb należących do rozkładu równomiernego <math>U(0, 1)</math> możemy łatwo uzyskać. Przykładowo w arkuszu kalkulacyjnym LibreOffice dostępna jest funkcja <math>\text{LOS}()</math>, która zwraca przypadkową liczbę z przedziału <math>[0, 1)</math>. Pisząc makro mamy dostępną analogiczną funkcję <math>\text{Rnd}()</math>. Liczby losowe generowane przez programy komputerowe nazywamy liczbami pseudolosowymi.
  
::[https://help.libreoffice.org/latest/pl/text/scalc/01/04060110.html Funkcje tekstowe]
+
Dysponując liczbami losowymi <math>u_i</math> należącymi do rozkładu równomiernego <math>U(0, 1)</math> możemy łatwo uzyskać liczby losowe <math>x_i</math> należące do rozkładu równomiernego <math>U(a, b)</math>. Wystarczy skorzystać ze wzoru:
  
 +
::<math>x_i = a + (b - a) u_i</math>
  
  
 +
Przykład histogramu rozkładu równomiernego <math>U (0, 1)</math> Czytelnik znajdzie w arkuszu kalkulacyjnym: [https://henryk-dabrowski.pl/pliki/rozklady/1_Rownomierny.ods Równomierny]
  
  
== Poradniki (PDF) ==
 
  
[https://documentation.libreoffice.org/assets/Uploads/Documentation/en/MACROS/RefCards/LibOBasic-1-IDE-Flat-Letter-EN-v102.pdf LibreOffice Basic IDE (Integrated Development Environment)]
 
  
[https://documentation.libreoffice.org/assets/Uploads/Documentation/en/MACROS/RefCards/LibOBasic-2-Overview-Flat-Letter-EN-v110.pdf LibreOffice Basic Overview]
 
  
[https://documentation.libreoffice.org/assets/Uploads/Documentation/en/MACROS/RefCards/LibOBasic-3-Calc-Flat-A4-EN-v111.pdf LibreOffice Basic Calc]
+
== Dystrybuanta odwrotna ==
  
[https://documentation.libreoffice.org/assets/Uploads/Documentation/en/MACROS/RefCards/LibOBasic-5-ExecLib-Flat-A4-EN-v101.pdf LibreOffice Basic Runtime Library]
+
Dystrybuanta odwrotna <math>F^{- 1} (u)</math> przekształca zmienną losową <math>U(0,1)</math> o rozkładzie równomiernym w zmienną losową <math>X</math> o rozkładzie <math>f(x)</math>, któremu odpowiada dystrybuanta <math>F(x)</math>:
  
[https://documentation.libreoffice.org/assets/Uploads/Documentation/en/MACROS/RefCards/LibOBasic-6-Dialogs-Flat-A4-EN-v103.pdf LibreOffice Basic Dialogs]
+
::<math>X = F^{- 1} (U)</math>
  
 +
Punktowi <math>u \in [0, 1]</math> zostaje przypisany punkt <math>x = F^{- 1} (u) \in [a, b]</math>. Granice przedziału <math>[a, b]</math> mogą być w ogólności niewłaściwe.
  
  
 +
Przykładowo dystrybuanta odwrotna zmiennej losowej o rozkładzie <math>f(x) = e^{- x}</math>, gdzie <math>x \in [0, + \infty)</math> jest równa <math>F^{- 1} (x) = - \log (1 - x)</math>. Zatem wylosowana liczba <math>u_1 = 0.25 \in [0.2, 0.3)</math> z rozkładu <math>U[0, 1]</math> przejdzie w punkt
 +
::<math>x_1 = - \log (1 - u_1) = 0.125 \in [0.1, 0.2)</math>
  
 +
z rozkładu wykładniczego <math>f(x) = e^{- x}</math>. Podobnie liczba <math>u_2 = 0.95
 +
\in [0.9, 0.1)</math> przejdzie w punkt
 +
::<math>x_2 = - \log (1 - u_2) = 1.301 \in [1.3, 1.4)</math>
  
== Wiki.openoffice.org ==
+
Czyli liczby te trafią do innych podprzedziałów, będą zliczane w innych miejscach i utworzą inny histogram. Tak jak to pokazano na rysunku:
  
[https://wiki.openoffice.org/wiki/Documentation The Apache OpenOffice Documentation Project]
 
  
[https://wiki.openoffice.org/wiki/Documentation/BASIC_Guide/Runtime_Library The Runtime Library of Apache OpenOffice Basic]
+
[[File:Dystrybuanta_odwrotna.png|center]]
  
::[https://wiki.openoffice.org/wiki/Documentation/BASIC_Guide/Conversion_Functions_(Runtime_Library) Conversion Functions]
 
  
::[https://wiki.openoffice.org/wiki/Documentation/BASIC_Guide/Strings_(Runtime_Library) Strings]
 
  
::[https://wiki.openoffice.org/wiki/Documentation/BASIC_Guide/Date_and_Time_(Runtime_Library) Date and Time]
+
Przykłady histogramów rozkładu równomiernego <math>U (0, 1)</math> i wykładniczego <math>f(x) = e^{-x}</math> (wygenerowanego z rozkładu równomiernego) Czytelnik znajdzie w arkuszach kalkulacyjnych:
  
::[https://wiki.openoffice.org/wiki/Documentation/BASIC_Guide/Files_and_Directories_(Runtime_Library) Files and Directories]
+
[https://henryk-dabrowski.pl/pliki/rozklady/1_Rownomierny.ods Równomierny]<br/>
 +
[https://henryk-dabrowski.pl/pliki/rozklady/6_Wykladniczy.ods Wykładniczy]
  
::[https://wiki.openoffice.org/wiki/Documentation/BASIC_Guide/Message_and_Input_Boxes_(Runtime_Library) Message and Input Boxes]
 
  
::[https://wiki.openoffice.org/wiki/Documentation/BASIC_Guide/Other_Functions_(Runtime_Library) Other Functions]
 
  
[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Functions_listed_alphabetically Calc: Functions listed alphabetically]
 
  
[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Functions_listed_by_category Calc: Functions listed by category]
 
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Array_functions Array functions]
+
Przedstawimy teraz kilka przykładów zastosowania tego faktu.
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Complex_Number_functions Complex Number functions]
+
== Rozkład jednomianowy <math>f(x) = (n + 1)x^n</math> ==
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Date_%26_Time_functions Date & Time functions]
+
Rozważmy funkcję gęstości prawdopodobieństwa postaci:
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Information_functions Information functions]
+
::<math>f(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < 0\\
 +
  (n + 1) x^n & \text{dla} & x \in [0, 1]\\
 +
  0 & \text{dla} & x > 1
 +
\end{array} \right.</math>
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Logical_functions Logical functions]
 
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Mathematical_functions Mathematical functions]
+
Łatwo sprawdzamy, że
 +
::<math>\int^{+ \infty}_{- \infty} f(t)dt = \int^1_0 f (t) dt = (n + 1) \int^1_0 t^n dt = t^{n + 1} \biggr|^1_0 = 1</math>
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Number_Conversion_functions Number Conversion functions]
 
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Spreadsheet_functions Spreadsheet functions]
+
=== Dystrybuanta ===
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Statistical_functions Statistical functions]
+
::<math>F(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < 0\\
 +
  x^{n + 1} & \text{dla} & x \in [0, 1]\\
 +
  1 & \text{dla} & x > 1
 +
\end{array} \right.</math>
  
::[https://wiki.openoffice.org/wiki/Documentation/How_Tos/Calc:_Text_functions Text functions]
 
  
 +
=== Dystrybuanta odwrotna ===
  
 +
::<math>F^{- 1} (x) = \sqrt[n + 1]{x}</math>
  
 +
Jeżeli <math>u_i \in U (0, 1)</math>, to liczby <math>x_i = \sqrt[n + 1]{u_i} \in [0, 1]</math> będą należały do rozkładu <math>f(x) = (n + 1) x^n</math> określonego na odcinku <math>[0, 1]</math>.
  
  
== Openoffice.org ==
+
=== Krzywa opisująca histogram ===
  
[https://www.openoffice.org/api/docs/common/ref/index-files/index-1.html Global Index]
+
Załóżmy, że:
  
 +
:* wygenerowaliśmy <math>N</math> liczb losowych <math>u_i \in U (0, 1)</math>
  
 +
:* obliczyliśmy wartości <math>x_i = \sqrt[n + 1]{u_i}</math>
  
 +
:* podzieliliśmy przedział zmienności liczb <math>x_i</math> (w naszym przypadku <math>[0, 1]</math>) na podprzedziały każdy o ustalonej szerokości <math>\Delta</math>
  
 +
:* pogrupowaliśmy <math>x_i</math> w poszczególnych podprzedziałach i wyznaczyliśmy ilość <math>g(k)</math> liczb <math>x_i</math> w <math>k</math>-tym podprzedziale
  
  
 +
Jakiej zależności <math>g(k)</math> należy się spodziewać? Prawdopodobieństwo tego, że zmienna losowa przyjmie wartość z <math>k</math>-tego przedziału o szerokości <math>\Delta</math> wyraża się wzorem:
  
 +
::<math>P((k - 1) \Delta \leqslant x_i \leqslant k \Delta) = \int^{k \Delta}_{(k - 1) \Delta} f(t)dt \approx f (k \Delta) \cdot \Delta</math>
 +
 +
Przybliżenie jest tym lepsze, im mniejsza jest szerokość przedziałów <math>\Delta</math>. Należy zatem oczekiwać zależności:
 +
 +
::<math>g(k) = N \cdot f (k \Delta) \cdot \Delta = N \Delta \cdot f (k \Delta)</math>
 +
 +
 +
Dla rozkładu jednomianowego na odcinku <math>[0, 1]</math> otrzymamy:
 +
 +
::<math>g(k) = N \cdot f (k \Delta) \cdot \Delta = N \cdot (n + 1) \cdot (k \Delta)^n \cdot \Delta = (n + 1) N \cdot \Delta^{n + 1} \cdot k^n</math>
 +
 +
 +
Przykład dla <math>n = 1</math> i <math>n = 2</math>
 +
 +
Niech <math>N = 10^5</math>, <math>\Delta = 0.01</math>
 +
 +
dla <math>n = 1</math>: <math>g(k) = 20 k</math>
 +
 +
dla <math>n = 2</math>: <math>g(k) = 0.3 k^2</math>
 +
 +
 +
Przykłady histogramów rozkładu jednomianowego <math>f(x) = (n + 1)x^n</math>, dla <math>n = 1, 2</math> Czytelnik znajdzie w arkuszach kalkulacyjnych:
 +
 +
[https://henryk-dabrowski.pl/pliki/rozklady/2_Jednomianowy_n_1.ods Jednomianowy (n = 1)]<br/>
 +
[https://henryk-dabrowski.pl/pliki/rozklady/3_Jednomianowy_n_2.ods Jednomianowy (n = 2)]
 +
 +
 +
 +
 +
 +
== Rozkład postaci <math>f(x) = \tfrac{3}{2} \sqrt{x}</math> ==
 +
 +
Rozważmy następującą funkcję gęstości prawdopodobieństwa:
 +
 +
::<math>f(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < 0\\
 +
  \frac{3}{2} \sqrt{x} & \text{dla} & x \in [0, 1]\\
 +
  0 & \text{dla} & x > 1
 +
\end{array} \right.</math>
 +
 +
Czytelnik łatwo sprawdzi, że:
 +
 +
::<math>\int^{+ \infty}_{- \infty} f(t)dt = 1</math>
 +
 +
 +
=== Dystrybuanta ===
 +
 +
::<math>F(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < 0\\
 +
  x^{3 / 2} & \text{dla} & x \in [0, 1]\\
 +
  1 & \text{dla} & x > 1
 +
\end{array} \right.</math>
 +
 +
 +
=== Dystrybuanta odwrotna ===
 +
 +
::<math>F^{- 1} (x) = x^{2 / 3}</math>
 +
 +
Jeżeli <math>u_i \in U (0, 1)</math>, to liczby <math>x_i = (u_i)^{2 / 3}</math> będą należały do rozkładu <math>f(x) = \tfrac{3}{2} \sqrt{x}</math> określonego na odcinku <math>[0, 1]</math>.
 +
 +
 +
=== Krzywa opisująca histogram ===
 +
 +
::<math>g(k) = N \cdot f (k \Delta) \cdot \Delta = N \cdot \frac{3}{2}
 +
\cdot \sqrt{k \Delta} \cdot \Delta = \frac{3}{2} \cdot N \Delta^{3 / 2} \cdot \sqrt{k}</math>
 +
 +
Dla <math>N = 10^5</math>, <math>\Delta = 0.01</math> otrzymujemy: <math>g(k) = 150 \sqrt{k}</math>
 +
 +
 +
Przykład histogramu rozkładu postaci <math>f (x) = \tfrac{3}{2} \sqrt{x}</math> Czytelnik znajdzie w arkuszu kalkulacyjnym: [https://henryk-dabrowski.pl/pliki/rozklady/4_Pierwiastek.ods Pierwiastek]
 +
 +
 +
 +
 +
 +
== Rozkład postaci <math>f(x) = \tfrac{1}{2 \sqrt{ax}}</math> ==
 +
 +
Dla <math>a > 0</math> określamy następującą funkcję gęstości prawdopodobieństwa:
 +
 +
::<math>f(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x \leqslant 0\\
 +
  \frac{1}{2 \sqrt{ax}} & \text{dla} & x \in (0, a]\\
 +
  0 & \text{dla} & x > a
 +
\end{array} \right.</math>
 +
 +
Czytelnik łatwo sprawdzi, że:
 +
 +
::<math>\int^{+ \infty}_{- \infty} f(t)dt = 1</math>
 +
 +
 +
=== Dystrybuanta ===
 +
 +
::<math>F(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < 0\\
 +
  \sqrt{\frac{x}{a}} & \text{dla} & x \in [0, a]\\
 +
  1 & \text{dla} & x > a
 +
\end{array} \right.</math>
 +
 +
 +
=== Dystrybuanta odwrotna ===
 +
 +
::<math>F^{- 1} (x) = ax^2</math>
 +
 +
Jeżeli <math>u_i \in U (0, 1)</math>, to liczby <math>x_i = au^2_i \in [0, a]</math> będą należały do rozkładu <math>f(x) = \tfrac{1}{2 \sqrt{ax}}</math> określonego na odcinku <math>(0, a]</math>.
 +
 +
 +
=== Krzywa opisująca histogram ===
 +
 +
::<math>g(k) = N \cdot f (k \Delta) \cdot \Delta = N \cdot \frac{1}{2\sqrt{ak \Delta}} \cdot \Delta = \frac{N \sqrt{\Delta}}{2 \sqrt{a}} \cdot \frac{1}{\sqrt{k}}</math>
 +
 +
 +
Dla <math>a = 25</math>, <math>N = 10^5</math>, <math>\Delta = 0.25</math> otrzymujemy: <math>g(k) = \tfrac{5000}{\sqrt{k}}</math>
 +
 +
 +
Przykład histogramu rozkładu postaci <math>f (x) = \tfrac{1}{10 \sqrt{x}}</math> określonego na odcinku <math>(0, 25]</math> Czytelnik znajdzie w arkuszu kalkulacyjnym: [https://henryk-dabrowski.pl/pliki/rozklady/5_Odwrotnosc_pierwiastka.ods Odwrotność pierwiastka]
 +
 +
 +
 +
 +
 +
== Rozkład wykładniczy <math>f(x) = \lambda e^{- \lambda x}</math> ==
 +
 +
Dla rozkładu wykładniczego funkcja gęstości prawdopodobieństwa jest określona następująco:
 +
 +
::<math>f(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < 0\\
 +
  \lambda e^{- \lambda x} & \text{dla} & x \geqslant 0
 +
\end{array} \right.</math>
 +
 +
gdzie <math>\lambda > 0</math>.
 +
 +
 +
=== Dystrybuanta ===
 +
 +
::<math>F(x) = \left\{ \begin{array}{lll}
 +
  0 & \text{dla} & x < 0\\
 +
  1 - e^{- \lambda x} & \text{dla} & x \geqslant 0
 +
\end{array} \right.</math>
 +
 +
 +
=== Dystrybuanta odwrotna ===
 +
 +
::<math>F^{- 1} (x) = - \frac{1}{\lambda} \cdot \log (1 - x)</math>
 +
 +
Jeżeli <math>u_i \in U (0, 1)</math>, to liczby <math>x_i = - \frac{1}{\lambda} \cdot \log (1 - u_i)</math> będą należały do rozkładu wykładniczego <math>f(x) = \lambda e^{- \lambda x}</math> określonego na półprostej <math>[0, +\infty)</math>.
 +
 +
 +
=== Krzywa opisująca histogram ===
 +
 +
::<math>g(k) = N \cdot \lambda e^{- \lambda \cdot k \Delta} \cdot \Delta = N \Delta \cdot \exp (- (\lambda \Delta) \cdot k)</math>
 +
 +
Dla <math>\lambda = 1</math> oraz <math>N = 10^5</math>, <math>\Delta = 0.1</math> otrzymujemy: <math>g(k) = 10000 \cdot e^{- 0.1 \cdot k}</math>
 +
 +
 +
Przykład histogramu rozkładu wykładniczego <math>f(x) = e^{- x}</math> Czytelnik znajdzie w arkuszu kalkulacyjnym: [https://henryk-dabrowski.pl/pliki/rozklady/6_Wykladniczy.ods Wykładniczy]
 +
 +
 +
 +
 +
 +
== Rozkład normalny <math>N (\mu, \sigma^2)</math> ==
 +
 +
Rozkładem normalnym nazywamy rozkład, dla którego funkcja gęstości prawdopodobieństwa ma postać:
 +
 +
::<math>f(x) = \frac{1}{\sigma \sqrt{2 \pi}} \cdot \exp \left( -
 +
\frac{(x - \mu)^2}{2 \sigma^2} \right)</math>
 +
 +
gdzie <math>\mu \in \mathbb{R}</math> i <math>\sigma > 0</math>.
 +
 +
 +
=== Dystrybuanta ===
 +
 +
::<math>F(x) = \int^x_{- \infty} f (t) dt = \frac{1}{\sqrt{\pi}} \int^{\frac{x - \mu}{\sigma \sqrt{2}}}_{- \infty} e^{-u^2} du = \frac{1}{\sqrt{\pi}} \int^0_{- \infty} e^{- u^2} du + \frac{1}{\sqrt{\pi}} \int^{\frac{x - \mu}{\sigma \sqrt{2}}}_0 e^{- u^2} du</math>
 +
 +
Ponieważ
 +
 +
::<math>\frac{1}{\sqrt{\pi}} \int^0_{- \infty} e^{- u^2} du = \frac{1}{2}</math>
 +
 +
to
 +
::<math>F(x) = \frac{1}{2} \left( 1 + \text{erf}\left( \frac{x - \mu}{\sigma \sqrt{2}} \right) \right)</math>
 +
 +
Funkcję <math>\text{erf}(x)</math> nazywamy funkcją błędu Gaussa i jest to funkcja nieelementarna:
 +
 +
::<math>\text{erf}(x) = \frac{2}{\sqrt{\pi}} \int^x_0 e^{- t^2} dt</math>
 +
 +
Łatwo można pokazać, że <math>\text{erf}(x)</math> jest funkcją nieparzystą:
 +
 +
::<math>\text{erf}(-x) = - \text{erf}(x)</math>
 +
 +
 +
W arkuszu LibreOffice <math>\text{erf}(x)</math> jest dostępna pod nazwą FUNKCJA.BŁ.DOKŁ(). Dostępna jest też komplementarna funkcja błędu <math>\text{erfc}(x) = 1 - \text{erf}(x)</math> pod nazwą KOMP.FUNKCJA.BŁ.DOKŁ(). Funkcja odwrotna funkcji <math>\text{erf}(x)</math> również nie jest elementarna. Dlatego uzyskanie liczb <math>x_i \in N (\mu, \sigma^2)</math> na bazie liczb <math>u_i \in U (0, 1)</math> wymaga nieco innego podejścia.
 +
 +
 +
=== Metoda Boxa - Mullera ===
 +
 +
Zamiast jednej zmiennej losowej o standardowym rozkładzie normalnym <math>N(0, 1)</math>, rozważmy dwie niezależne zmienne losowe o takim rozkładzie. Funkcja gęstości prawdopodobieństwa dla takiej pary niezależnych zmiennych losowych będzie iloczynem gęstości prawdopodobieństwa tych funkcji:
 +
 +
::<math>f(x, y) = f (x) f (y) = \frac{1}{\sqrt{2 \pi}} e^{- x^2 / 2} \cdot \frac{1}{\sqrt{2 \pi}} e^{- x^2 / 2} = \frac{1}{2 \pi} e^{- (x^2 + y^2) / 2}</math>
 +
 +
 +
Przechodząc do współrzędnych biegunowych
 +
::<math>\left\{ \begin{array}{l}
 +
  x = r \cdot \cos (\varphi)\\
 +
  y = r \cdot \sin (\varphi)
 +
\end{array} \right.</math>
 +
 +
 +
gdzie <math>r \geqslant 0</math> i <math>\varphi \in \left [ 0, 2\pi \right )</math>, otrzymujemy:
 +
 +
::<math>f (r, \varphi) = \frac{1}{2 \pi} e^{- r^2 / 2}</math>
 +
 +
 +
Funkcję gęstości prawdopodobieństwa <math>f (r, \varphi)</math> możemy zapisać w postaci iloczynu:
 +
 +
::<math>f (r, \varphi) = g (r) h (\varphi)</math>
 +
 +
 +
Widzimy, że <math>h (\varphi) = \frac{1}{2 \pi} = \text{const}</math> jest unormowaną funkcją gęstości prawdopodobieństwa zmiennej <math>\varphi</math>. Oznacza to, że rozkład <math>\varphi</math> jest rozkładem równomiernym <math>U (0, 2 \pi)</math>, a liczba <math>\varphi</math> może być zapisana w postaci <math>\varphi = 2 \pi \cdot u</math>, gdzie <math>u</math> jest liczbą z równomiernego rozkładu <math>U(0, 1)</math>.
 +
 +
 +
Iloczyn dystrybuant <math>G(r) H (\varphi)</math> jest określony całką we współrzędnych biegunowych:
 +
 +
::<math>G (\hat{r}) H (\hat{\varphi}) = \int^{\hat{r}}_0 \int^{\hat{\varphi}}_0 g(r) h (\varphi) rdrd \varphi = \int^{\hat{r}}_0 g(r)rdr \int^{\hat{\varphi}}_0 h (\varphi) d \varphi</math>
 +
 +
 +
Zatem dystrybuanta <math>G (\hat{r})</math> jest równa:
 +
 +
::<math>G (\hat{r}) = \int^{\hat{r}}_0 g(r)rdr = \int^{\hat{r}}_0 e^{- r^2 / 2} rdr = - e^{- r^2 / 2} \biggr|^{\hat{r}}_0 = 1 - e^{- \hat{r}^2 / 2}</math>
 +
 +
Całkę nieoznaczoną <math>\int e^{- r^2 / 2} rdr = -e^{- r^2 / 2}</math> wyliczamy dokonując podstawienia <math>t = -r^2/2</math>.
 +
 +
 +
Wracając do zmiennej <math>r</math>, mamy:
 +
 +
::<math>G(r) = 1 - e^{- r^2 / 2}</math>
 +
 +
 +
Łatwo znajdujemy dystrybuantę odwrotną:
 +
 +
::<math>G^{- 1} (r) = \sqrt{- 2 \log (1 - r)}</math>
 +
 +
 +
Jeżeli <math>v_i \in U (0, 1)</math>, to liczby <math>\sqrt{- 2 \log (1 - v_i)}</math> będą należały do rozkładu prawdopodobieństwa odpowiadającego funkcji <math>g(r)</math>.
 +
 +
 +
Zatem parze liczb <math>u, v \in U (0, 1)</math> odpowiadają liczby <math>\varphi, r</math>
 +
 +
::<math>\left\{ \begin{array}{l}
 +
  \varphi = 2 \pi \cdot u\\
 +
  r = \sqrt{- 2 \log (1 - v)}
 +
\end{array} \right.</math>
 +
 +
z rozkładów opisywanych funkcjami gęstości <math>h (\varphi)</math> i <math>g(r)</math>, a tym liczbom odpowiada para liczb <math>x, y</math>
 +
 +
::<math>\left\{ \begin{array}{l}
 +
  x = \sqrt{- 2 \log (1 - v)} \cdot \cos (2 \pi \cdot u)\\
 +
  y = \sqrt{- 2 \log (1 - v)} \cdot \sin (2 \pi \cdot u)
 +
\end{array} \right.</math>
 +
 +
które należą do standardowych rozkładów normalnych <math>N(0, 1)</math>.
 +
 +
 +
=== Wnioski ===
 +
 +
Jeżeli <math>u, v \in U (0, 1)</math>, to liczby
 +
::<math>\left\{ \begin{array}{l}
 +
  x = \sqrt{- 2 \log (1 - u)} \cdot \cos (2 \pi \cdot v)\\
 +
  y = \sqrt{- 2 \log (1 - u)} \cdot \sin (2 \pi \cdot v)
 +
\end{array} \right.</math>
 +
 +
będą należały do standardowego rozkładu normalnego <math>N(0, 1)</math>.
 +
 +
 +
 +
Uogólniając postępowanie z poprzedniego punktu, można łatwo pokazać, że jeżeli <math>u, v \in U (0, 1)</math>, to liczby
 +
 +
::<math>\left\{ \begin{array}{l}
 +
  x = \mu + \sigma \sqrt{- 2 \log (1 - u)} \cdot \cos (2 \pi \cdot v)\\
 +
  y = \mu + \sigma \sqrt{- 2 \log (1 - u)} \cdot \sin (2 \pi \cdot v)
 +
\end{array} \right.</math>
 +
 +
będą należały do rozkładu normalnego <math>N (\mu, \sigma^2)</math>.
 +
 +
 +
 +
Przykład histogramu rozkładu normalnego <math>f (x) = \frac{1}{\sqrt{2 \pi}} e^{- x^2}</math> Czytelnik znajdzie w arkuszu kalkulacyjnym: [https://henryk-dabrowski.pl/pliki/rozklady/7_Normalny.ods Normalny]
  
[[LibreOffice Calc – makra | <b>LibreOffice Calc – makra</b>]]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[[Henryk Dąbrowski | <b>Strona główna</b>]]
 
  
  

Aktualna wersja na dzień 22:36, 18 wrz 2022

06.01.2021



Gęstość prawdopodobieństwa i dystrybuanta

Rozważmy funkcję [math]\displaystyle{ f(x) }[/math] określoną na [math]\displaystyle{ \mathbb{R} }[/math], nieujemną i całkowalną. Powiemy, że [math]\displaystyle{ f(x) }[/math] jest gęstością rozkładu prawdopodobieństwa [math]\displaystyle{ P }[/math], jeżeli dla dowolnego zbioru [math]\displaystyle{ A \subset \mathbb{R} }[/math] jest

[math]\displaystyle{ P(A)=\int\limits_A f(x)dx }[/math]

gdzie [math]\displaystyle{ P(A) }[/math] jest prawdopodobieństwem przypisanym zbiorowi [math]\displaystyle{ A }[/math].

Z powyższej definicji wynika natychmiast, że funkcja [math]\displaystyle{ f(x) }[/math] musi być unormowana:

[math]\displaystyle{ \int^{+ \infty}_{- \infty} f(x)dx = 1 }[/math]


Dystrybuantą gęstości prawdopodobieństwa [math]\displaystyle{ f(x) }[/math] nazywamy funkcję:

[math]\displaystyle{ F(x) = \int^x_{- \infty} f(t)dt }[/math]


Prawdopodobieństwo, że zmienna losowa przyjmie wartość należącą do przedziału [math]\displaystyle{ [a, b] }[/math] wynosi:

[math]\displaystyle{ P(a \leqslant x \leqslant b) = \int^b_a f(t)dt = F (b) - F (a) }[/math]



Rozkład równomierny [math]\displaystyle{ U(a, b) }[/math]

Rozkładem równomiernym (prostokątnym) nazywamy rozkład prawdopodobieństwa, dla którego gęstość prawdopodobieństwa [math]\displaystyle{ f(x) }[/math] jest równa:

[math]\displaystyle{ f(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt a\\ \frac{1}{b - a} & \text{dla} & x \in [a, b]\\ 0 & \text{dla} & x \gt b \end{array} \right. }[/math]


Tak zdefiniowany rozkład równomierny będziemy oznaczali [math]\displaystyle{ U(a, b) }[/math]. Dystrybuanta tego rozkładu jest określona wzorem:

[math]\displaystyle{ F(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt a\\ \frac{x - a}{b - a} & \text{dla} & x \in [a, b]\\ 1 & \text{dla} & x \gt b \end{array} \right. }[/math]


Zbiór liczb należących do rozkładu równomiernego [math]\displaystyle{ U(0, 1) }[/math] możemy łatwo uzyskać. Przykładowo w arkuszu kalkulacyjnym LibreOffice dostępna jest funkcja [math]\displaystyle{ \text{LOS}() }[/math], która zwraca przypadkową liczbę z przedziału [math]\displaystyle{ [0, 1) }[/math]. Pisząc makro mamy dostępną analogiczną funkcję [math]\displaystyle{ \text{Rnd}() }[/math]. Liczby losowe generowane przez programy komputerowe nazywamy liczbami pseudolosowymi.

Dysponując liczbami losowymi [math]\displaystyle{ u_i }[/math] należącymi do rozkładu równomiernego [math]\displaystyle{ U(0, 1) }[/math] możemy łatwo uzyskać liczby losowe [math]\displaystyle{ x_i }[/math] należące do rozkładu równomiernego [math]\displaystyle{ U(a, b) }[/math]. Wystarczy skorzystać ze wzoru:

[math]\displaystyle{ x_i = a + (b - a) u_i }[/math]


Przykład histogramu rozkładu równomiernego [math]\displaystyle{ U (0, 1) }[/math] Czytelnik znajdzie w arkuszu kalkulacyjnym: Równomierny



Dystrybuanta odwrotna

Dystrybuanta odwrotna [math]\displaystyle{ F^{- 1} (u) }[/math] przekształca zmienną losową [math]\displaystyle{ U(0,1) }[/math] o rozkładzie równomiernym w zmienną losową [math]\displaystyle{ X }[/math] o rozkładzie [math]\displaystyle{ f(x) }[/math], któremu odpowiada dystrybuanta [math]\displaystyle{ F(x) }[/math]:

[math]\displaystyle{ X = F^{- 1} (U) }[/math]

Punktowi [math]\displaystyle{ u \in [0, 1] }[/math] zostaje przypisany punkt [math]\displaystyle{ x = F^{- 1} (u) \in [a, b] }[/math]. Granice przedziału [math]\displaystyle{ [a, b] }[/math] mogą być w ogólności niewłaściwe.


Przykładowo dystrybuanta odwrotna zmiennej losowej o rozkładzie [math]\displaystyle{ f(x) = e^{- x} }[/math], gdzie [math]\displaystyle{ x \in [0, + \infty) }[/math] jest równa [math]\displaystyle{ F^{- 1} (x) = - \log (1 - x) }[/math]. Zatem wylosowana liczba [math]\displaystyle{ u_1 = 0.25 \in [0.2, 0.3) }[/math] z rozkładu [math]\displaystyle{ U[0, 1] }[/math] przejdzie w punkt

[math]\displaystyle{ x_1 = - \log (1 - u_1) = 0.125 \in [0.1, 0.2) }[/math]

z rozkładu wykładniczego [math]\displaystyle{ f(x) = e^{- x} }[/math]. Podobnie liczba [math]\displaystyle{ u_2 = 0.95 \in [0.9, 0.1) }[/math] przejdzie w punkt

[math]\displaystyle{ x_2 = - \log (1 - u_2) = 1.301 \in [1.3, 1.4) }[/math]

Czyli liczby te trafią do innych podprzedziałów, będą zliczane w innych miejscach i utworzą inny histogram. Tak jak to pokazano na rysunku:


Dystrybuanta odwrotna.png


Przykłady histogramów rozkładu równomiernego [math]\displaystyle{ U (0, 1) }[/math] i wykładniczego [math]\displaystyle{ f(x) = e^{-x} }[/math] (wygenerowanego z rozkładu równomiernego) Czytelnik znajdzie w arkuszach kalkulacyjnych:

Równomierny
Wykładniczy



Przedstawimy teraz kilka przykładów zastosowania tego faktu.

Rozkład jednomianowy [math]\displaystyle{ f(x) = (n + 1)x^n }[/math]

Rozważmy funkcję gęstości prawdopodobieństwa postaci:

[math]\displaystyle{ f(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt 0\\ (n + 1) x^n & \text{dla} & x \in [0, 1]\\ 0 & \text{dla} & x \gt 1 \end{array} \right. }[/math]


Łatwo sprawdzamy, że

[math]\displaystyle{ \int^{+ \infty}_{- \infty} f(t)dt = \int^1_0 f (t) dt = (n + 1) \int^1_0 t^n dt = t^{n + 1} \biggr|^1_0 = 1 }[/math]


Dystrybuanta

[math]\displaystyle{ F(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt 0\\ x^{n + 1} & \text{dla} & x \in [0, 1]\\ 1 & \text{dla} & x \gt 1 \end{array} \right. }[/math]


Dystrybuanta odwrotna

[math]\displaystyle{ F^{- 1} (x) = \sqrt[n + 1]{x} }[/math]

Jeżeli [math]\displaystyle{ u_i \in U (0, 1) }[/math], to liczby [math]\displaystyle{ x_i = \sqrt[n + 1]{u_i} \in [0, 1] }[/math] będą należały do rozkładu [math]\displaystyle{ f(x) = (n + 1) x^n }[/math] określonego na odcinku [math]\displaystyle{ [0, 1] }[/math].


Krzywa opisująca histogram

Załóżmy, że:

  • wygenerowaliśmy [math]\displaystyle{ N }[/math] liczb losowych [math]\displaystyle{ u_i \in U (0, 1) }[/math]
  • obliczyliśmy wartości [math]\displaystyle{ x_i = \sqrt[n + 1]{u_i} }[/math]
  • podzieliliśmy przedział zmienności liczb [math]\displaystyle{ x_i }[/math] (w naszym przypadku [math]\displaystyle{ [0, 1] }[/math]) na podprzedziały każdy o ustalonej szerokości [math]\displaystyle{ \Delta }[/math]
  • pogrupowaliśmy [math]\displaystyle{ x_i }[/math] w poszczególnych podprzedziałach i wyznaczyliśmy ilość [math]\displaystyle{ g(k) }[/math] liczb [math]\displaystyle{ x_i }[/math] w [math]\displaystyle{ k }[/math]-tym podprzedziale


Jakiej zależności [math]\displaystyle{ g(k) }[/math] należy się spodziewać? Prawdopodobieństwo tego, że zmienna losowa przyjmie wartość z [math]\displaystyle{ k }[/math]-tego przedziału o szerokości [math]\displaystyle{ \Delta }[/math] wyraża się wzorem:

[math]\displaystyle{ P((k - 1) \Delta \leqslant x_i \leqslant k \Delta) = \int^{k \Delta}_{(k - 1) \Delta} f(t)dt \approx f (k \Delta) \cdot \Delta }[/math]

Przybliżenie jest tym lepsze, im mniejsza jest szerokość przedziałów [math]\displaystyle{ \Delta }[/math]. Należy zatem oczekiwać zależności:

[math]\displaystyle{ g(k) = N \cdot f (k \Delta) \cdot \Delta = N \Delta \cdot f (k \Delta) }[/math]


Dla rozkładu jednomianowego na odcinku [math]\displaystyle{ [0, 1] }[/math] otrzymamy:

[math]\displaystyle{ g(k) = N \cdot f (k \Delta) \cdot \Delta = N \cdot (n + 1) \cdot (k \Delta)^n \cdot \Delta = (n + 1) N \cdot \Delta^{n + 1} \cdot k^n }[/math]


Przykład dla [math]\displaystyle{ n = 1 }[/math] i [math]\displaystyle{ n = 2 }[/math]

Niech [math]\displaystyle{ N = 10^5 }[/math], [math]\displaystyle{ \Delta = 0.01 }[/math]

dla [math]\displaystyle{ n = 1 }[/math]: [math]\displaystyle{ g(k) = 20 k }[/math]

dla [math]\displaystyle{ n = 2 }[/math]: [math]\displaystyle{ g(k) = 0.3 k^2 }[/math]


Przykłady histogramów rozkładu jednomianowego [math]\displaystyle{ f(x) = (n + 1)x^n }[/math], dla [math]\displaystyle{ n = 1, 2 }[/math] Czytelnik znajdzie w arkuszach kalkulacyjnych:

Jednomianowy (n = 1)
Jednomianowy (n = 2)



Rozkład postaci [math]\displaystyle{ f(x) = \tfrac{3}{2} \sqrt{x} }[/math]

Rozważmy następującą funkcję gęstości prawdopodobieństwa:

[math]\displaystyle{ f(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt 0\\ \frac{3}{2} \sqrt{x} & \text{dla} & x \in [0, 1]\\ 0 & \text{dla} & x \gt 1 \end{array} \right. }[/math]

Czytelnik łatwo sprawdzi, że:

[math]\displaystyle{ \int^{+ \infty}_{- \infty} f(t)dt = 1 }[/math]


Dystrybuanta

[math]\displaystyle{ F(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt 0\\ x^{3 / 2} & \text{dla} & x \in [0, 1]\\ 1 & \text{dla} & x \gt 1 \end{array} \right. }[/math]


Dystrybuanta odwrotna

[math]\displaystyle{ F^{- 1} (x) = x^{2 / 3} }[/math]

Jeżeli [math]\displaystyle{ u_i \in U (0, 1) }[/math], to liczby [math]\displaystyle{ x_i = (u_i)^{2 / 3} }[/math] będą należały do rozkładu [math]\displaystyle{ f(x) = \tfrac{3}{2} \sqrt{x} }[/math] określonego na odcinku [math]\displaystyle{ [0, 1] }[/math].


Krzywa opisująca histogram

[math]\displaystyle{ g(k) = N \cdot f (k \Delta) \cdot \Delta = N \cdot \frac{3}{2} \cdot \sqrt{k \Delta} \cdot \Delta = \frac{3}{2} \cdot N \Delta^{3 / 2} \cdot \sqrt{k} }[/math]

Dla [math]\displaystyle{ N = 10^5 }[/math], [math]\displaystyle{ \Delta = 0.01 }[/math] otrzymujemy: [math]\displaystyle{ g(k) = 150 \sqrt{k} }[/math]


Przykład histogramu rozkładu postaci [math]\displaystyle{ f (x) = \tfrac{3}{2} \sqrt{x} }[/math] Czytelnik znajdzie w arkuszu kalkulacyjnym: Pierwiastek



Rozkład postaci [math]\displaystyle{ f(x) = \tfrac{1}{2 \sqrt{ax}} }[/math]

Dla [math]\displaystyle{ a \gt 0 }[/math] określamy następującą funkcję gęstości prawdopodobieństwa:

[math]\displaystyle{ f(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \leqslant 0\\ \frac{1}{2 \sqrt{ax}} & \text{dla} & x \in (0, a]\\ 0 & \text{dla} & x \gt a \end{array} \right. }[/math]

Czytelnik łatwo sprawdzi, że:

[math]\displaystyle{ \int^{+ \infty}_{- \infty} f(t)dt = 1 }[/math]


Dystrybuanta

[math]\displaystyle{ F(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt 0\\ \sqrt{\frac{x}{a}} & \text{dla} & x \in [0, a]\\ 1 & \text{dla} & x \gt a \end{array} \right. }[/math]


Dystrybuanta odwrotna

[math]\displaystyle{ F^{- 1} (x) = ax^2 }[/math]

Jeżeli [math]\displaystyle{ u_i \in U (0, 1) }[/math], to liczby [math]\displaystyle{ x_i = au^2_i \in [0, a] }[/math] będą należały do rozkładu [math]\displaystyle{ f(x) = \tfrac{1}{2 \sqrt{ax}} }[/math] określonego na odcinku [math]\displaystyle{ (0, a] }[/math].


Krzywa opisująca histogram

[math]\displaystyle{ g(k) = N \cdot f (k \Delta) \cdot \Delta = N \cdot \frac{1}{2\sqrt{ak \Delta}} \cdot \Delta = \frac{N \sqrt{\Delta}}{2 \sqrt{a}} \cdot \frac{1}{\sqrt{k}} }[/math]


Dla [math]\displaystyle{ a = 25 }[/math], [math]\displaystyle{ N = 10^5 }[/math], [math]\displaystyle{ \Delta = 0.25 }[/math] otrzymujemy: [math]\displaystyle{ g(k) = \tfrac{5000}{\sqrt{k}} }[/math]


Przykład histogramu rozkładu postaci [math]\displaystyle{ f (x) = \tfrac{1}{10 \sqrt{x}} }[/math] określonego na odcinku [math]\displaystyle{ (0, 25] }[/math] Czytelnik znajdzie w arkuszu kalkulacyjnym: Odwrotność pierwiastka



Rozkład wykładniczy [math]\displaystyle{ f(x) = \lambda e^{- \lambda x} }[/math]

Dla rozkładu wykładniczego funkcja gęstości prawdopodobieństwa jest określona następująco:

[math]\displaystyle{ f(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt 0\\ \lambda e^{- \lambda x} & \text{dla} & x \geqslant 0 \end{array} \right. }[/math]

gdzie [math]\displaystyle{ \lambda \gt 0 }[/math].


Dystrybuanta

[math]\displaystyle{ F(x) = \left\{ \begin{array}{lll} 0 & \text{dla} & x \lt 0\\ 1 - e^{- \lambda x} & \text{dla} & x \geqslant 0 \end{array} \right. }[/math]


Dystrybuanta odwrotna

[math]\displaystyle{ F^{- 1} (x) = - \frac{1}{\lambda} \cdot \log (1 - x) }[/math]

Jeżeli [math]\displaystyle{ u_i \in U (0, 1) }[/math], to liczby [math]\displaystyle{ x_i = - \frac{1}{\lambda} \cdot \log (1 - u_i) }[/math] będą należały do rozkładu wykładniczego [math]\displaystyle{ f(x) = \lambda e^{- \lambda x} }[/math] określonego na półprostej [math]\displaystyle{ [0, +\infty) }[/math].


Krzywa opisująca histogram

[math]\displaystyle{ g(k) = N \cdot \lambda e^{- \lambda \cdot k \Delta} \cdot \Delta = N \Delta \cdot \exp (- (\lambda \Delta) \cdot k) }[/math]

Dla [math]\displaystyle{ \lambda = 1 }[/math] oraz [math]\displaystyle{ N = 10^5 }[/math], [math]\displaystyle{ \Delta = 0.1 }[/math] otrzymujemy: [math]\displaystyle{ g(k) = 10000 \cdot e^{- 0.1 \cdot k} }[/math]


Przykład histogramu rozkładu wykładniczego [math]\displaystyle{ f(x) = e^{- x} }[/math] Czytelnik znajdzie w arkuszu kalkulacyjnym: Wykładniczy



Rozkład normalny [math]\displaystyle{ N (\mu, \sigma^2) }[/math]

Rozkładem normalnym nazywamy rozkład, dla którego funkcja gęstości prawdopodobieństwa ma postać:

[math]\displaystyle{ f(x) = \frac{1}{\sigma \sqrt{2 \pi}} \cdot \exp \left( - \frac{(x - \mu)^2}{2 \sigma^2} \right) }[/math]

gdzie [math]\displaystyle{ \mu \in \mathbb{R} }[/math] i [math]\displaystyle{ \sigma \gt 0 }[/math].


Dystrybuanta

[math]\displaystyle{ F(x) = \int^x_{- \infty} f (t) dt = \frac{1}{\sqrt{\pi}} \int^{\frac{x - \mu}{\sigma \sqrt{2}}}_{- \infty} e^{-u^2} du = \frac{1}{\sqrt{\pi}} \int^0_{- \infty} e^{- u^2} du + \frac{1}{\sqrt{\pi}} \int^{\frac{x - \mu}{\sigma \sqrt{2}}}_0 e^{- u^2} du }[/math]

Ponieważ

[math]\displaystyle{ \frac{1}{\sqrt{\pi}} \int^0_{- \infty} e^{- u^2} du = \frac{1}{2} }[/math]

to

[math]\displaystyle{ F(x) = \frac{1}{2} \left( 1 + \text{erf}\left( \frac{x - \mu}{\sigma \sqrt{2}} \right) \right) }[/math]

Funkcję [math]\displaystyle{ \text{erf}(x) }[/math] nazywamy funkcją błędu Gaussa i jest to funkcja nieelementarna:

[math]\displaystyle{ \text{erf}(x) = \frac{2}{\sqrt{\pi}} \int^x_0 e^{- t^2} dt }[/math]

Łatwo można pokazać, że [math]\displaystyle{ \text{erf}(x) }[/math] jest funkcją nieparzystą:

[math]\displaystyle{ \text{erf}(-x) = - \text{erf}(x) }[/math]


W arkuszu LibreOffice [math]\displaystyle{ \text{erf}(x) }[/math] jest dostępna pod nazwą FUNKCJA.BŁ.DOKŁ(). Dostępna jest też komplementarna funkcja błędu [math]\displaystyle{ \text{erfc}(x) = 1 - \text{erf}(x) }[/math] pod nazwą KOMP.FUNKCJA.BŁ.DOKŁ(). Funkcja odwrotna funkcji [math]\displaystyle{ \text{erf}(x) }[/math] również nie jest elementarna. Dlatego uzyskanie liczb [math]\displaystyle{ x_i \in N (\mu, \sigma^2) }[/math] na bazie liczb [math]\displaystyle{ u_i \in U (0, 1) }[/math] wymaga nieco innego podejścia.


Metoda Boxa - Mullera

Zamiast jednej zmiennej losowej o standardowym rozkładzie normalnym [math]\displaystyle{ N(0, 1) }[/math], rozważmy dwie niezależne zmienne losowe o takim rozkładzie. Funkcja gęstości prawdopodobieństwa dla takiej pary niezależnych zmiennych losowych będzie iloczynem gęstości prawdopodobieństwa tych funkcji:

[math]\displaystyle{ f(x, y) = f (x) f (y) = \frac{1}{\sqrt{2 \pi}} e^{- x^2 / 2} \cdot \frac{1}{\sqrt{2 \pi}} e^{- x^2 / 2} = \frac{1}{2 \pi} e^{- (x^2 + y^2) / 2} }[/math]


Przechodząc do współrzędnych biegunowych

[math]\displaystyle{ \left\{ \begin{array}{l} x = r \cdot \cos (\varphi)\\ y = r \cdot \sin (\varphi) \end{array} \right. }[/math]


gdzie [math]\displaystyle{ r \geqslant 0 }[/math] i [math]\displaystyle{ \varphi \in \left [ 0, 2\pi \right ) }[/math], otrzymujemy:

[math]\displaystyle{ f (r, \varphi) = \frac{1}{2 \pi} e^{- r^2 / 2} }[/math]


Funkcję gęstości prawdopodobieństwa [math]\displaystyle{ f (r, \varphi) }[/math] możemy zapisać w postaci iloczynu:

[math]\displaystyle{ f (r, \varphi) = g (r) h (\varphi) }[/math]


Widzimy, że [math]\displaystyle{ h (\varphi) = \frac{1}{2 \pi} = \text{const} }[/math] jest unormowaną funkcją gęstości prawdopodobieństwa zmiennej [math]\displaystyle{ \varphi }[/math]. Oznacza to, że rozkład [math]\displaystyle{ \varphi }[/math] jest rozkładem równomiernym [math]\displaystyle{ U (0, 2 \pi) }[/math], a liczba [math]\displaystyle{ \varphi }[/math] może być zapisana w postaci [math]\displaystyle{ \varphi = 2 \pi \cdot u }[/math], gdzie [math]\displaystyle{ u }[/math] jest liczbą z równomiernego rozkładu [math]\displaystyle{ U(0, 1) }[/math].


Iloczyn dystrybuant [math]\displaystyle{ G(r) H (\varphi) }[/math] jest określony całką we współrzędnych biegunowych:

[math]\displaystyle{ G (\hat{r}) H (\hat{\varphi}) = \int^{\hat{r}}_0 \int^{\hat{\varphi}}_0 g(r) h (\varphi) rdrd \varphi = \int^{\hat{r}}_0 g(r)rdr \int^{\hat{\varphi}}_0 h (\varphi) d \varphi }[/math]


Zatem dystrybuanta [math]\displaystyle{ G (\hat{r}) }[/math] jest równa:

[math]\displaystyle{ G (\hat{r}) = \int^{\hat{r}}_0 g(r)rdr = \int^{\hat{r}}_0 e^{- r^2 / 2} rdr = - e^{- r^2 / 2} \biggr|^{\hat{r}}_0 = 1 - e^{- \hat{r}^2 / 2} }[/math]

Całkę nieoznaczoną [math]\displaystyle{ \int e^{- r^2 / 2} rdr = -e^{- r^2 / 2} }[/math] wyliczamy dokonując podstawienia [math]\displaystyle{ t = -r^2/2 }[/math].


Wracając do zmiennej [math]\displaystyle{ r }[/math], mamy:

[math]\displaystyle{ G(r) = 1 - e^{- r^2 / 2} }[/math]


Łatwo znajdujemy dystrybuantę odwrotną:

[math]\displaystyle{ G^{- 1} (r) = \sqrt{- 2 \log (1 - r)} }[/math]


Jeżeli [math]\displaystyle{ v_i \in U (0, 1) }[/math], to liczby [math]\displaystyle{ \sqrt{- 2 \log (1 - v_i)} }[/math] będą należały do rozkładu prawdopodobieństwa odpowiadającego funkcji [math]\displaystyle{ g(r) }[/math].


Zatem parze liczb [math]\displaystyle{ u, v \in U (0, 1) }[/math] odpowiadają liczby [math]\displaystyle{ \varphi, r }[/math]

[math]\displaystyle{ \left\{ \begin{array}{l} \varphi = 2 \pi \cdot u\\ r = \sqrt{- 2 \log (1 - v)} \end{array} \right. }[/math]

z rozkładów opisywanych funkcjami gęstości [math]\displaystyle{ h (\varphi) }[/math] i [math]\displaystyle{ g(r) }[/math], a tym liczbom odpowiada para liczb [math]\displaystyle{ x, y }[/math]

[math]\displaystyle{ \left\{ \begin{array}{l} x = \sqrt{- 2 \log (1 - v)} \cdot \cos (2 \pi \cdot u)\\ y = \sqrt{- 2 \log (1 - v)} \cdot \sin (2 \pi \cdot u) \end{array} \right. }[/math]

które należą do standardowych rozkładów normalnych [math]\displaystyle{ N(0, 1) }[/math].


Wnioski

Jeżeli [math]\displaystyle{ u, v \in U (0, 1) }[/math], to liczby

[math]\displaystyle{ \left\{ \begin{array}{l} x = \sqrt{- 2 \log (1 - u)} \cdot \cos (2 \pi \cdot v)\\ y = \sqrt{- 2 \log (1 - u)} \cdot \sin (2 \pi \cdot v) \end{array} \right. }[/math]

będą należały do standardowego rozkładu normalnego [math]\displaystyle{ N(0, 1) }[/math].


Uogólniając postępowanie z poprzedniego punktu, można łatwo pokazać, że jeżeli [math]\displaystyle{ u, v \in U (0, 1) }[/math], to liczby

[math]\displaystyle{ \left\{ \begin{array}{l} x = \mu + \sigma \sqrt{- 2 \log (1 - u)} \cdot \cos (2 \pi \cdot v)\\ y = \mu + \sigma \sqrt{- 2 \log (1 - u)} \cdot \sin (2 \pi \cdot v) \end{array} \right. }[/math]

będą należały do rozkładu normalnego [math]\displaystyle{ N (\mu, \sigma^2) }[/math].


Przykład histogramu rozkładu normalnego [math]\displaystyle{ f (x) = \frac{1}{\sqrt{2 \pi}} e^{- x^2} }[/math] Czytelnik znajdzie w arkuszu kalkulacyjnym: Normalny