Test losowości rozkładu zdarzeń


Tomasz Bartuś



Na podstawie: (Swan A.R.H., Sandilands M., 1995)

Losowość zdarzeń oznacza, że wystąpienie jednego zdarzenia nie oddziaływuje probabilistycznie na możliwość wystąpienia innego zdarzenia. W geologii mamy najczęściej do czynienia z innymi sytuacjami. Trzęsienie ziemi lub erupcja wulkanu oddziałują na prawdopodobieństo kolejnych zdarzeń tego typu.

Wyobraźmy sobie, że w ciągu okresu czasu wynoszącego 100 lat, mamy do czynienia z 10-cioma zdarzeniami o rozkładzie losowym. Jeżeli cały analizowany okres podzielimy na dekady, to okaże się, że w większości dekad będzie miało miejsce jedno zdarzenie, być może w kilku dekadach zdarzenia będą dwa lub nie będzie ich wcale. Dekad o ilości zdarzeń większej od dwóch, z uwagi na niezwykle małe prawdopodobieństwo takiego wystąpienia, nie będzie zapewne wcale. Rozkład częstotliwości wystąpienia zdarzeń losowych z powyższego przykładu przyjmie model Poissona.

UWAGA: Rozkład Poissona jest jednym z rozkładów dyskretnych (skokowych). Stosuje się go w przypadku określania prawdopodobieństwa zajścia zdarzeń stosunkowo rzadkich i niezależnych od siebie przy występowaniu dużej ilości doświadczeń.
Rozkład Poissona jest przybliżeniem rozkładu Bernoulliego dla dużych prób i przy małym prawdopodobieństwie zajścia zdarzenia sprzyjającego.

PRZYKŁAD
 

Fig. 1. przedstawia rozkład horyzontów tufitowych obserwowanych w wybranym profilu geologicznym. Liczby oznaczajš położenie horyzontów tufitowych względem podstawy profilu

Rozkłady horyzontów tufitowych obserwowanych w profilu geologicznym
Fig. 1. Rozkład horyzontów tufitowych w profilu geologicznym

Jeżeli zdażenia jakimi są poziomy skał piroklastycznych związane z okresami nasilonej działalności wulkanicznej występują w sekwencji losowo, wtedy liczba obserwacji w każdym z regularnie interwałów profilu podlegać będzie rozkładowi Poissona. Jednocześnie trzeba pamiętać, że tego typu zdarzenia w większym stopniu związane są z procesami sedymentacyjnymi niż cyklicznością zjawisk wulkanicznych.

Jeżeli użyjemy interwałów 3 m miąższości wtedy otrzymamy następujące wyniki:

nr interwał [m] liczba obserwacji (j)
1 0-3 2
2 3-6 3
3 6-9 1
4 9-12 1
5 12-15 2
6 15-18 1
7 18-21 0
8 21-24 2
9 24-27 1
10 27-30 0
11 30-33 2
12 33-36 0
13 36-39 1
14 39-42 0
15 42-45 1

Tak więc rozkład zmiennej losowej jaką jest liczba poziomów tufitowych w interwałach o stałej miąższości równej 3 m będzie wyglądał następująco:

j Oj
0 4
1 6
2 4
3 1
4 0

Aby zbadać czy otrzymany rozkład jest zgodny z teoretycznym rozkładem Poissona o znanej gęstości prawdopodobieństwa zdarzeń. użyjemy testu χ2.

Chi kwadrat

gdzie:
Oj - zdażenia obserwowane [ang. Observed];
Ej - zdażenia spodziewane [ang. Expected].

Stawiamy hipotezę zerową w brzmieniu:

H0: rozkład zdarzeń występowania tufitów w badanym profilu ma charakter losowy

Prawdopodobieństwo, że zmienna losowa jaką jest liczba poziomów tufitowych przypadająca na każdy z regularnych interwałów obliczamy ze wzoru na rozkład Poissona [szczegóły zob.: Rozkłady zmiennych losowych dyskretnych].

P(X = k) = (λk / k!) e

gdzie:
λ - wartość przeciętna (oczekiwana) zmiennej losowej,
k - zmienna losowa będąca liczbą sukcesów (liczba zdarzeń elementarnych w interwale)

λ = N p

gdzie:
N - liczba doświadczeń (liczba poziomów tufitowych - u nas N = 17),
p - prawdopodobieństwo sukcesu w pojedynczym doświadczeniu

Z klasycznej definicji prawdopodobieństwa:

p = 1 / T

gdzie:
T - liczba regularnych interwałów (u nas T = 15),
tak więc:

P(X = k) = (N / Tk / k!) e-(N/T)
PRZYKŁAD cd.
 
k (N/T)k k! (N/T)k/k! Ek
0 1 1 1.0 4.829
1 1.133 1 1.333 5.470
2 1.284 2 0.642 3.101
3 1.456 6 0.243 1.173
4 1.649 24 0.069 0.333
5 1.870 120 0.013 0.063

W związku z zaleceniem dla testu χ2 aby łączyć klasy w których liczba oczekiwanych elementów jest mniejsza niż 5, połączono zmienne losowe 2, 3, 4 i 5 w jedną klasę 2-.

k Ok Ek χ2
0 4 4.829 0,142
1 6 5.470 0.051
2- 5 4.701 0.019
Σ 15 15 0.212

Tak więc:
χ2 = 0.212
α = 0.05
df = k - p - 1 = k - 1 = 2
χ2α, df = 5.99

χ2 < χ2α, df

Z tego wynika, że nie mamy podstaw do odrzucenia hipotezy zerowej (H0), co jednocześnie oznacza, że nie możemy wykluczyć, że rozkład tufitów w badanym profilu ma rozkład losowy.

 
 

Wstęp:

 
 
 
 

Badanie jednej zmiennej

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Badanie postaci rozkładów

 
 
 
 
 
 
 
 

Testowanie zgodności rozkładów z rozkładem N(0, 1)

 
 
 
 
 
 

Współzależność dwóch cech

 
 
 
 
 
 

Analiza wariancji

 
 
 
 
Analiza wariancji (obliczenia)
 
 
Testy jednorodności wariancji w grupach (testowanie założeń ANOVA)
 
 
 
 
 
 

Analiza danych kierunkowych

 
 
 
 
 
 
 
 
 
 

Dodatki

 
 
 
 

Dane

Dane do ćwiczeń,
UWAGA!:

Dostępnych jest 60 zestawów danych. Każdy zestaw składa się z dwóch dokumentów (.doc) oznaczonych odpowiednio w nazwie pliku litermi "A" lub "B" oraz jednym dokumentem .sta (Statistica 5.0) (Sz. cz. A). W pliku: instrukcja_ST_5.doc zamieszczono szczegółową instrukcję do ćwiczeń autorstwa dr inż. Wojciecha Masteja, a w pliku: Sz-srf.xls dane do wykreślenia map.

Zadania

z rachunku prawdopodobieństwa i statystyki

Zestaw zadań 1 (1-10)
Zestaw zadań 2 (11-16)
Zestaw zadań 3 (17-27)
Zestaw zadań 4 (28-32)
Zestaw zadań 5 (33-43)
Zestaw zadań 6 (44-56)
Zestaw zadań 7 (57-63)
Zestaw zadań 8 (64-69)
Cały zestaw (1-69)
Cały zestaw (1-69)

Dystrybuanty znanych rozkładów

 
 
Rozkład Normalny
 
Rozkład Χ2 (chi kwadrat)
 
Rozkład t-Studenta
 

Kalkulatory dystrybuant

 
 
Rozkład Normalny
 
Rozkład F (Fischera-Snedecora)
 
Rozkład t - Studenta
 
Rozkład Χ2 (chi kwadrat)
 

Inne

 
 
II rok - Metryczka teczki z ćwiczeniami ze statystyki
 

Linki

 
 
Wielojęzyczny słownik statystyczny
 
 
polska wersja Elektronicznego Podręcznika Statystyki - Serwis oprogramowania Statistica
 
 

Wyniki kolokwium

 
 
 
(30.06.08)
 
(26.01.08)
 
(26.01.08)
 
(15.12.07)