Testowanie obecności trendu w rozkładzie zdarzeń


Tomasz Bartuś



Na podstawie: (Swan A.R.H., Sandilands M., 1995)

Niezależnie od obserwowanej zmienności badanego parametru w profilach skał, trendy malejącej lub rosnącej częstotliwości zdarzeń mogą mieć nadrzędne znaczenie dla predykcji i zrozumienia zachodzącego procesu geologicznego.

Zmiany częstotliwości zdarzeń mogą być ilościowo określane na podstawie zmian długości interwałów pomiędzy tymi zdarzeniami. Dobrym sposobem na wstępną weryfikację hipotezy o istnieniu trendu w rozkładzie zdarzeń jest wykreślenie wykresu, w którym na osi OX zaznaczamy numery kolejnych interwałów pomiędzy zdarzeniami elementarnymi, a na osi OY długość tych inerwałów (np. mierzone miąższością) (zob. Fig. 2). Poziome wydłużenie chmury punktów będzie oznaczało stałą długość interwałów pomiędzy zdarzeniami, a więc brak zależności o typie trendu. Jeśli istnieją jakiekolwiek trendy taki wykres umożliwi ich wykrycie. Miarą siły tredów będzie analiza korelacyjna długości przerw pomiędzy zdarzeniami od kolejnych zdarzeń. Numer zdarzenia jest liczbą porządkową, dlatego do testowania istotności korelacji powinniśmy użyć nieparametrycznego współczynnika korelacji. Stawiamy hipotezę zerową o braku istnienia rosnącego bądź malejącego trendu w rozkładzie (częstości wystąpień) zdarzeń elementarnych. Do testowania zależności możemy wykorzystać współczynnik korelacji rangowej Spearmana.

Współczynnik korelacji rangowej Spearmana dla trendów w długości interwałów

H0: nie ma trendów w zmianach dlugości interwałów
H1: interwały stają się coraz krótsze/dłuższe

Współczynnik korelacji rangowej Spearmana dla trendów w długości interwałów

gdzie:
hi - długość i-tego interwału,
n - liczba interwałów (równa liczbie zdarzeń elementarnych - 1)

PRZYKŁAD
 

Fig. 1. przedstawia rozkład horyzontów tufitowych obserwowanych w wybranym profilu geologicznym.

Rozkłady horyzontów tufitowych obserwowanych w profilu geologicznym
Fig. 1. Rozkład horyzontów tufitowych w profilu geologicznym. Liczby oznaczają położenie horyzontów tufitowych względem podstawy profilu

Tab. 1. Położenie horyzontów tufitowych w profilu geologicznym (licząc od jego podstawy [m]) i grubości interwałów [m] pomiędzy nimi
Zdarzenie 0.5   2.3   3.2   4.2   4.9   7.0   11.4   12.7   14.6  
Interwał   1.8   0.9   1.0   0.7   2.1   4.4   1.3   1.9   1.4
Zdarzenie 16.0   21.5   22.5   25.8   30.3   31.9   36.2   42.8      
Interwał   5.5   1.0   3.3   4.5   1.6   4.3   6.6        

Wykres długości interwałów pomiędzy zdarzeniami elementarnymi
Fig. 2. Wykres długości interwałów pomiędzy zdarzeniami elementarnymi

Za pomocą współczynnika korelacji rang Spearmana (zob. Korelacja rang) musimy ocenić korelację pomiędzy liczbą zdarzeń elementarnych a długością interwałów.

Współczynnik korelacji rangowej Spearmana dla trendów w długości interwałów

Stawiamy hipotezy:
H0: nie ma trendów w zmianach dlugości interwałów,
H1: istnieją trendy w długościach interwałów.

Tab. 2. Obliczenia rang interwałów (R(hi)) oraz wyrażeń (i - R(hi))2 niezbędne do obliczenia współczynnika korelacji rangowej Spearmana. zob. obliczanie rang
numer interwału
i
Interwał
hi
Ranga interwału
R(hi)
(i - R(hi))2
1 1,8 8 49
2 0,9 2 0
3 1,0 3,5 0,25
4 0,7 1 9
5 2,1 10 25
6 4,4 13 49
7 1,3 5 4
8 1,9 9 1
9 1,4 6 9
10 5,5 15 25
11 1,0 3,5 56,25
12 3,3 11 1
13 4,5 14 1
14 1,6 7 49
15 4,3 12 9
16 6,6 16 0
Σ 287,5

r' = 1 - (6 × 287,5) / 16 × (162 - 1) = 1 - (1725 / 4080) = 0,577

Dla przyjętego poziomu istotności α = 0,05 oraz liczby badanych interwałów n = 16 znajdujemy wartość krytyczną statystyki r'α n dla testu Rayleigh'a (Fig. 3).

Wykres długości interwałów pomiędzy zdarzeniami elementarnymi
Fig. 3. Wartości krytyczne testu Rayleigh'a dla współczynnika korelacji r'

Obliczona wartość testu (r' = 0.577) jest większa od wartości krytycznej (r'α n = 0,4265) dlatego odrzucamy postawioną hipotezę zerową H0 i przyjmujemy hipotezę alternatywną H1 w brzmieniu: Na przyjętym poziomie istotności nie ma podstaw do odrzucenia hipotezy alternatywnej o istnieniu trendu w rozkładzie horyzontów tufitowych badanego profilu osadów. Obliczona dodatnia wartość r' świadczy to o tym, że długość interwałów rośnie idąc w dół profilu. Zdarzenia z górnej części profilu stają się znacznie bardziej rozłożone w czasie.

 
 

Wstęp:

 
 
 
 

Badanie jednej zmiennej

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Badanie postaci rozkładów

 
 
 
 
 
 
 
 

Testowanie zgodności rozkładów z rozkładem N(0, 1)

 
 
 
 
 
 

Współzależność dwóch cech

 
 
 
 
 
 

Analiza wariancji

 
 
 
 
Analiza wariancji (obliczenia)
 
 
Testy jednorodności wariancji w grupach (testowanie założeń ANOVA)
 
 
 
 
 
 

Analiza danych kierunkowych

 
 
 
 
 
 
 
 
 
 

Dodatki

 
 
 
 

Dane

Dane do ćwiczeń,
UWAGA!:

Dostępnych jest 60 zestawów danych. Każdy zestaw składa się z dwóch dokumentów (.doc) oznaczonych odpowiednio w nazwie pliku litermi "A" lub "B" oraz jednym dokumentem .sta (Statistica 5.0) (Sz. cz. A). W pliku: instrukcja_ST_5.doc zamieszczono szczegółową instrukcję do ćwiczeń autorstwa dr inż. Wojciecha Masteja, a w pliku: Sz-srf.xls dane do wykreślenia map.

Zadania

z rachunku prawdopodobieństwa i statystyki

Zestaw zadań 1 (1-10)
Zestaw zadań 2 (11-16)
Zestaw zadań 3 (17-27)
Zestaw zadań 4 (28-32)
Zestaw zadań 5 (33-43)
Zestaw zadań 6 (44-56)
Zestaw zadań 7 (57-63)
Zestaw zadań 8 (64-69)
Cały zestaw (1-69)
Cały zestaw (1-69)

Dystrybuanty znanych rozkładów

 
 
Rozkład Normalny
 
Rozkład Χ2 (chi kwadrat)
 
Rozkład t-Studenta
 

Kalkulatory dystrybuant

 
 
Rozkład Normalny
 
Rozkład F (Fischera-Snedecora)
 
Rozkład t - Studenta
 
Rozkład Χ2 (chi kwadrat)
 

Inne

 
 
II rok - Metryczka teczki z ćwiczeniami ze statystyki
 

Linki

 
 
Wielojęzyczny słownik statystyczny
 
 
polska wersja Elektronicznego Podręcznika Statystyki - Serwis oprogramowania Statistica
 
 

Wyniki kolokwium

 
 
 
(30.06.08)
 
(26.01.08)
 
(26.01.08)
 
(15.12.07)