Analiza danych kierunkowych


Tomasz Bartuś



na podstawie: (Krawczyk, Słomka, 1982)

Dane kierunkowe są przedstawiane w postaci wektorów (najczęściej wartości kątowych). Ten szczególny rodzaj danych ma głębokie zastosowanie w naukach przyrodniczych, a w szczególności w naukach o Ziemi. W analizach GIS, na podstawie pomiarów meteorologicznych, jesteśmy często zmuszeni określić średni kierunek wiatru wiejącego na danym obszarze. W sedymentologii, na podstawie pomierzonych zwrotów hieroglifów prądowych, chcemy znać rozkład kierunków paleotransportu w basenach sedymentacyjnych. We wszystkich tego typu przypadkach stosujemy procedury analizy danych kierunkowych.

Tak jak szereg rozdzielczy, a w praktyce, najczęściej histogram, służy do opisu populacji danych skalarnych, tak w przypadku danych wektorowych do opisu populacji służy szereg rozdzielczy lub najczęściej wykres rozetowy (diagram róża). Podobnie jak histogram, tak i te wykresy przedstawia się dla liczebności lub częstości wyrażonej procentem udziału danego kierunku w całej populacji próby.

Wyznaczanie kierunku średniego

Kierunek średni jest odpowiednikiem średniej arytmetycznej dla danych skalarnych. Należy zwrócić uwagę, że średni kierunek ma swój sens w przypadku rozkładów jednomodalnych. W przypadku rozkładów wielomodalnych, najlepszym rozwiązaniem jest podział populacji próby na jednomodalne podpopulacje i określenie dla każdej osobnego kierunku średniego. Oblicza się go ze wzoru:

Kierunek średni

gdzie:
φ - element populacji próbny,
n - liczebność zbioru danych.

Wyznaczanie współczynnika koncentracji

Współczynnik koncentracji jest miarą rozrzutu wektorów danych od kierunku średniego. Im wyższa wartość współczynnika, tym wyższa koncentracja wartości cech wokół kierunku średniego. Oblicza się go ze wzoru zamieszczonego poniżej. W praktyce wartość współczynnika koncentracji mnożona jest przez 100% i interpretowana jako procent populacji próby skumulowana wokół kierunku średniego.

Współczynnik koncentracji

Istotność kierunku średniego

Badamy czy poszczególne dane są wystarczająco skupione wokół kierunku średniego, by można było mówić o jego istnieniu w populacji generalnej. Hipoteza zerowa głosi, że wektory próbkowe są zorientowane losowo w różnych kierunkach.

H0: L = 0;

Odrzucenie hipotezy zerowej, na przyjętym poziomie istotności (α), jest równoznaczne z przyjęciem kierunku średniego.

Test dla małych prób

Gdy dysponujemy niewielką liczbą danych pomiarowych, należy zastosować test zaproponowany przez J.S. Rao. Na wstępie należy uporządkować dane pomiarowe (φi) od wartości najmniejszej do największej. W kolejnym kroku procedury obliczamy:

Ti = φi+1 - φi

dla i = 1,2,..., n-1; oraz:

Tn = φ1 - φn+ 360

Do weryfikacji hipotezy zerowej służy statystyka:

Istotność kierunku średniego - test dla małych prób

wartości krytyczne statystyki przedstawia Tab.1

Tab.1. wartości krytyczne statystyki U
n α
0.1 0.05 0.01
2 162.00 171.00 178.20
3 174.24 193.68 219.24
4 171.72 186.48 221.04
5 168.84 183.60 212.04
6 166.32 180.72 206.04
7 164.88 177.84 202.68
8 163.44 175.68 198.36
9 162.36 173.52 195.12
10 161.28 172.08 192.24
11 160.20 170.28 189.72
12 159.48 169.20 187.56
13 158.40 167.76 185.76
14 157.68 166.68 183.96
15 156.96 165.60 182.16
16 156.60 164.88 180.72
17 155.88 164.16 179.64
18 155.16 163.08 178.20
19 154.80 162.36 177.12
20 154.44 161.64 176.04
źródło: Rao J.S., Sengupta S.: Mathematical Techniques for Paleocurrent Analysis: Treatment of Directional Data. Journ. Int. Assoc. Math. Geol., vol. 4, no 3, str.: 235-248.

Jeżeli obliczona wartość statystyki przekracza wartość krytyczną (dla danego poziomu istotności), H0 należy odrzucić.

Test dla dużych prób

Gdy dysponujemy znaczną ilością danych (min. kilkadziesiąt elementów), do weryfikacji hipotezy zerowej o losowym orientacji wektorów, możemy użyć testu χ2. Należy zbudować szereg rozdzielczy, a następnie obliczyć wartość statystyki:

Istotność kierunku średniego - test dla dużych prób

gdzie:
k - ilość klas szeregu rozdzielczego,
li - liczebność i-tej klasy,
n - liczba elementów próby.

W warunkach słuszności hipotezy zerowej, statystyka χ2 ma rozkład χ2 z k-1 stopniami swobody.

UWAGA
 

Wykonując niezbędne obliczenia w arkuszu kalkulacyjnym MS Excell, należy pamiętać, że funkcje tego programu takie jak SIN, COS, ATAN itp. wykorzystują w obliczeniach zapis kątowy wyrażony w radianach pi. Chcąc używać zapisu w stopniach, ZAWSZE, przy pomocy odpowiednich funkcji, należy radiany przeliczyć na stopnie. Więcej informacji można znaleźć w helpie do MS Excell, po naciśnięciu klawisza F1 i wpisaniu do wyszukiwarki odpowiedniej funkcji (np.: sin).

Radian (rad) jest jednostką uzupełniająca układu SI. Jest to kąt płaski równy kątowi między dwoma promieniami koła, wycinającymi z okręgu tego koła łuk o długości równej promieniowi.

Radian

1 rad = 180o/Π = ok. 57.29578o

Wzory przeliczeniowe:

stopnie na radiany
radiany na stopnie
 
 

Wstęp:

 
 
 
 

Badanie jednej zmiennej

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Badanie postaci rozkładów

 
 
 
 
 
 
 
 

Testowanie zgodności rozkładów z rozkładem N(0, 1)

 
 
 
 
 
 

Współzależność dwóch cech

 
 
 
 
 
 

Analiza wariancji

 
 
 
 
Analiza wariancji (obliczenia)
 
 
Testy jednorodności wariancji w grupach (testowanie założeń ANOVA)
 
 
 
 
 
 

Analiza danych kierunkowych

 
 
 
 
 
 
 
 
 
 

Dodatki

 
 
 
 

Dane

Dane do ćwiczeń,
UWAGA!:

Dostępnych jest 60 zestawów danych. Każdy zestaw składa się z dwóch dokumentów (.doc) oznaczonych odpowiednio w nazwie pliku litermi "A" lub "B" oraz jednym dokumentem .sta (Statistica 5.0) (Sz. cz. A). W pliku: instrukcja_ST_5.doc zamieszczono szczegółową instrukcję do ćwiczeń autorstwa dr inż. Wojciecha Masteja, a w pliku: Sz-srf.xls dane do wykreślenia map.

Zadania

z rachunku prawdopodobieństwa i statystyki

Zestaw zadań 1 (1-10)
Zestaw zadań 2 (11-16)
Zestaw zadań 3 (17-27)
Zestaw zadań 4 (28-32)
Zestaw zadań 5 (33-43)
Zestaw zadań 6 (44-56)
Zestaw zadań 7 (57-63)
Zestaw zadań 8 (64-69)
Cały zestaw (1-69)
Cały zestaw (1-69)

Dystrybuanty znanych rozkładów

 
 
Rozkład Normalny
 
Rozkład Χ2 (chi kwadrat)
 
Rozkład t-Studenta
 

Kalkulatory dystrybuant

 
 
Rozkład Normalny
 
Rozkład F (Fischera-Snedecora)
 
Rozkład t - Studenta
 
Rozkład Χ2 (chi kwadrat)
 

Inne

 
 
II rok - Metryczka teczki z ćwiczeniami ze statystyki
 

Linki

 
 
Wielojęzyczny słownik statystyczny
 
 
polska wersja Elektronicznego Podręcznika Statystyki - Serwis oprogramowania Statistica
 
 

Wyniki kolokwium

 
 
 
(30.06.08)
 
(26.01.08)
 
(26.01.08)
 
(15.12.07)