Rozkłady dyskretne


Tomasz Bartuś



UWAGA!!! materialy w tworzeniu

Dyskretną (skokową) zmienną losową nazywamy zmienną losową jeżeli zbiór jej wartości jest skończony lub co najwyżej przeliczalny.

Dystrybuanta dyskretnej zmiennej losowej

Dystrybuanta dyskretnej zmiennej losowej może być określona za pomocą nierówności słabej () lub mocnej ().

Dystrybuanta skokowej zmiennej losowej

Wartość przeciętna (średnia, oczekiwana, nadzieja matematyczna) dyskretnej zmiennej losowej

Wartość przeciętna skokowej zmiennej losowej

Warariancja dyskretnej zmiennej losowej

Wariancja zmiennej losowej

Wariancja skokowej zmiennej losowej

Obliczanie dystrybuanty z definicji nie zawsze jest łatwe. Pomocnym okazać się może związek pomiędzy wartością oczekiwaną, a wariancją:

1. Rozkład równomierny (jednostajny, prostokątny) (ang.: uniform distribition)

Jeżeli zmienna losowa posiada skończoną liczbę realizacji, a prawopodobieństwo zdarzenia polegającego na realizacji dowolnej zmiennej losowej jest jednakowe, mówimy wtedy o rozkładzie jednostajnym.

Rozkład jednostajny
Fig. 1. Rozkład jednostajny

Prawdopodobieństwo zajścia dowolnego zdarzenia z przestrzeni zdarzeń elementarnych jest stałe i dane wzorem:

Prawdopodobieństwo zajścia zdarzenia x w rozkładzie jednostajnym

gdzie:
n - liczebność zbioru zdarzeń elementarnych.

2. Rozkład dwupunktowy

Rozkład dwupunktowy stosuje się w przypadku zmiennych losowych, które przyjmują wyłącznie dwie wartości. Można więc opisywać nim doświadczenia mogące się zakończyć na dwa sposoby np. rzut monetą (orzeł lub reszka). W praktyce, służy w badaniach populacji dzielących się na dwie kategorie np. ruda i skała płonna. Istnieją więc dwie realizacje zmiennej losowej X: X = {1, 0}. Gdy zmienna losowa przyjmuje wartość "1", przyjęło się mówić, że doświadczenie zakończyło się sukcesem, gdy natomiast zmienna przyjęła wartość "0", zakończyło się porażką.

Rozkład zmiennej losowej

.
Tab.1. Tabelka realizacji zmiennej losowej X w rozkładzie dwupunktowym
i 1 2
xi 0 1
pi q p

gdzie:
pi - prawdopodobieństwa realizacji zmiennej losowej X,
xi - realizacje zmiennej losowej X.

Rozkład dwupunktowy
Fig. 2. Rozkład dwupunktowy
Rozkład dwupunktowy: prawdopodobieństwo porażki Rozkład dwupunktowy: prawdopodobieństwo sukcesu
Zależność p i q

Rozkład dwupunktowy: rozkład

Wartość przeciętna zmiennej losowej

Rozkład dwupunktowy: wartość przeciętna

Wariancja zmiennej losowej


Rozkład dwupunktowy: wariancja

3. Rozkład dwumianowy (dwupunktowy, Bernoulliego) (ang.: Bernoulli; binomial distribution)

Rozkład Bernoulliego jest w praktyce najczęściej spotykanym rozkładem zmiennej losowej. Stosujemy go wówczas gdy wykonujemy n niezależnych doświadczeń (wynik każdego nich nie zależy od doświadczeń poprzednich), przy czym każde z doświadczeń ma, podobnie jak w rozkładzie dwupunktowym jedno z dwóch możliwych wyników: "sukces" lub "porażkę". Tak więc prawdopodobieństwo sukcesu jest w każdym z doświadczeń takie samo. Jako wartość zmiennej losowej przyjmujemy ilość sukcesów. Zmienna losowa może zatem przyjmować wartości: X X = {0, 1, 2, 3,..., N}.

Rozkład zmiennej losowej

.

Zdefiniujmy zmienną losową X równą liczbie sukcesów k (np. wyrzucenie orła) w N=9 doświadczeniach (np. rzutach monetą).
Załóżmy, ze otrzymaliśmy wynik: O, O, R, O, R, R, O, O, R

gdzie:
O - oznacza wyrzucenie "orła",
R - oznacza wyrzucenie "reszki".
N=9; k=5;

Jakie jest prawdopodobieństwo otrzymania takiego ciągu?

Prawdopodobieństwo, że za pierwszym i następnymi razami wyrzucimy orła jest równe p. W związku z tym, że zdarzenia są niezależne, prawdopodobieństwo otrzymania takiego ciągu jest równe iloczynowi prawdopodoboieństw kolejnych zdarzeń.

W związku z tym, że interesują nas wszystkie możliwe ustawienia wyników (wariacje), mnożymy wszystko przez dwumian Newtona i otrzymujemy:

Rozkład dwumianowy
Zależność p i q

gdzie:
N - ilość doświadczeń,
k - ilość sukcesów w N doświadczeniach,

Wartość przeciętna zmiennej losowej

Zdefiniujmy zmienną losową Y równą liczbie sukcesów k w N doświadczeniach.
Każdy z wyników otrzymanych w pojedynczym doświadczeniu zależy od innej zmiennej losowej Z, mającej dwie realizacje Z: Z={0, 1}.

Y Z realizacje zmiennej losowej Z
y0=0 z1, z2, z3, ..., zN 0, 0, 0, ..., 0
y1=1 z1, z2, z3, ..., zN 0, 0, 1, ..., 0
y2=2 z1, z2, z3, ..., zN 1, 0, 1, ..., 0
... ... ...
yn=N z1, z2, z3,...zN 1, 1, 1, ..., 1

Rozkład dwumianowy: wartość przeciętna
Rozkład dwumianowy: wartość przeciętna

Wariancja zmiennej losowej

Rozkład dwumianowy: wariancja

PRZYKŁAD
 

Dwóch równorzędnych graczy gra w szachy. Co jest bardziej prawdopodobne dla każdego z nich:
1. wygrać dwie partie z czterech?,
2. czy trzy z sześciu?.
Partie remisowe nie są brane pod uwagę.

ROZWIĄZANIE

Tab. 1. Tabela prawdopodobieństwa zdarzeń
co jest bardziej prawdopodobne? N k
2 partie z 4 4 2
3 partie z 6 6 3

gdzie:
N - ilość doświadczeń,
k- ilość sukcesów w N doświadczeniach.

Rozkład dwumianowy
Zależność p i q

gdzie:
P(S) - prawdopodobieństwo sukcesu,
P(P) - prawdopodobieństwo porażki,


ODPOWIEDŹ


3. Rozkład Poissona (ang.: Poisson beta distribution)


Rozkład zmiennej losowej

Rozkład Poissona stanowi szczególny przypadek rozkładu dwumianowego (Bernoulliego), w którym prawdopodobieństwo sukcesu (p) jest bardzo małe, a liczba niezależnych doświadczeń (N) na tyle duża, że iloczyn:

Np=const=λ

jest wielkością stałą, dodatnią i niezbyt dużą.

Rozkład Poissona

Wartość przeciętna zmiennej losowej.

Rozkład Poissona: wartość przeciętna

Wariancja zmiennej losowej.

Rozkład Poissona: wariancja

Rozkład Poissona stosujemy wszędzie tam, gdzie liczba obserwowanych doświadczeń niezależnych N w przestrzeni lub czasie jest bardzo duża, a prawdopodobieństwo sukcesu w pojedyńczym doświadczeniu p bardzo małe. Przykłady:
- rozpad promieniotwórczy: liczba jąder n duża, prawdopodobieństwo rozpadu konkretnego jądra bardzo małe;
- zderzenia cząstek elementarnych, duża ilość cząstek, mała szansa na zderzenie;

Zjawisko emisji cząstek α zachodzi w ekstremalnie krótkim czasie patrząc z punktu widzenia czasu geologicznego także trzęsienia Ziemi mogą być traktowane jako zjawiska epizodyczne, podobnie obecność drumlinów (polodowcowe wzgórki) czy też ponorów (wchłony wód) mogą byc uważane za zjawiska punktowe w porównaniu z wielkością regionów.

Analiza każdego zagadnienia wymaga obliczenia ilości zdarzeń w przyjętych interwałach przestrzeni lub czasu. Możemy np. policzyć ilość erupcji wulkanicznych w 25-letnich okresach czy rozkład ziarn granatów w cienkich przedziałach płaszczyzn foliacji łupków. Pytanie kiedy mamy do czynienia z losowym i niezależnym modelem zdarzeń i czy model ten odpowiada rozkładowi Poissona? Zdarzenia mogą być uważane za losowe i niezależne jeżeli:

  1. prawopodobieństwo pojedynczego zdarzenia w bardzo krótkim interwale czasu lub przestrzeni jest w przybliżeniu proporcjonalne do długości tego interwału (czyli bardzo małe)
  2. Prawdopodobieństwo zajścia większej niż jedno ilości zdarzeń w każdym z interwałów jest zbliżone do zera (możemy stworzyć interwały wystarczająco małe do stworzenia takich warunków). Założenie to oznacza w praktyce, że w każdym z interwałów będzie odnotowane "0" lub "1" zdarzenie
  3. Pojawienie się lub brak zdarzenia jest od siebie niezależne
 
 

Wstęp:

 
 
 
 

Badanie jednej zmiennej

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Badanie postaci rozkładów

 
 
 
 
 
 
 
 

Testowanie zgodności rozkładów z rozkładem N(0, 1)

 
 
 
 
 
 

Współzależność dwóch cech

 
 
 
 
 
 

Analiza wariancji

 
 
 
 
Analiza wariancji (obliczenia)
 
 
Testy jednorodności wariancji w grupach (testowanie założeń ANOVA)
 
 
 
 
 
 

Analiza danych kierunkowych

 
 
 
 
 
 
 
 
 
 

Dodatki

 
 
 
 

Dane

Dane do ćwiczeń,
UWAGA!:

Dostępnych jest 60 zestawów danych. Każdy zestaw składa się z dwóch dokumentów (.doc) oznaczonych odpowiednio w nazwie pliku litermi "A" lub "B" oraz jednym dokumentem .sta (Statistica 5.0) (Sz. cz. A). W pliku: instrukcja_ST_5.doc zamieszczono szczegółową instrukcję do ćwiczeń autorstwa dr inż. Wojciecha Masteja, a w pliku: Sz-srf.xls dane do wykreślenia map.

Zadania

z rachunku prawdopodobieństwa i statystyki

Zestaw zadań 1 (1-10)
Zestaw zadań 2 (11-16)
Zestaw zadań 3 (17-27)
Zestaw zadań 4 (28-32)
Zestaw zadań 5 (33-43)
Zestaw zadań 6 (44-56)
Zestaw zadań 7 (57-63)
Zestaw zadań 8 (64-69)
Cały zestaw (1-69)
Cały zestaw (1-69)

Dystrybuanty znanych rozkładów

 
 
Rozkład Normalny
 
Rozkład Χ2 (chi kwadrat)
 
Rozkład t-Studenta
 

Kalkulatory dystrybuant

 
 
Rozkład Normalny
 
Rozkład F (Fischera-Snedecora)
 
Rozkład t - Studenta
 
Rozkład Χ2 (chi kwadrat)
 

Inne

 
 
II rok - Metryczka teczki z ćwiczeniami ze statystyki
 

Linki

 
 
Wielojęzyczny słownik statystyczny
 
 
polska wersja Elektronicznego Podręcznika Statystyki - Serwis oprogramowania Statistica
 
 

Wyniki kolokwium

 
 
 
(30.06.08)
 
(26.01.08)
 
(26.01.08)
 
(15.12.07)