Testowanie założeń ANOVA


Tomasz Bartuś



UWAGA!!! materialy w tworzeniu

Zakłada się, że wariancje w obrębie wydzielonych grup układu są sobie równe; założenie to określa się mianem założenia jednorodności wariancji. Wariancję błędu (wewnątrzgrupową) oblicza się jako sumę kwadratów w obrębie grupy. W przypadku kiedy wariancje w dwóch grupach różnią się między sobą, wówczas ich dodawanie nie jest właściwe i nie daje oszacowania wspólnej wariancji wewnątrzgrupowej (ponieważ nie istnieje wspólna wariancja) (Statistica PL, 1997 str. 1703). Niespelnienie tego zalozenia moze prowadzic do zawyzania wartosci testu F i do zbyt wielu odrzucen H0. Weryfikacji założenia dokonuje się z wykorzystaniem następujących testów:

Test Bartletta

Dotyczy on populacji normalnych, dla których chcemy sprawdzić hipotezę o równości wariancji we wszystkich podpopulacjach. Test ten oparty jest na pewnej statystyce, która ma rozkład asymptotyczny Χ2. Zbieżność do rozkładu Χ2 jest przy tym bardzo szybka, tak, że można go stosować nawet dla bardzo małych prób. W literaturze jest znanych kilka postaci wzoru na statystykę Bartletta. Aby uniknąć kłopotów z logarytmami naturalnymi, zostanie przytoczona postać wzoru z wykorzystaniem tylko logarytmów dziesiętnych - stąd stała występująca w tym wzorze 2,303 (jest to ln 10). Ze względu na dużą liczbę pracochłonnych rachunków testów dokonuje się jedynie przy użyciu komputerów (Greń J., 1976).

Jeżeli zalożymy, że mamy k podpopulacji o rozkładach normalnych losujemy niezależnie do próby n elementów. Mamy więc k losowych prób o liczebnościach n. Wyniki każdej próby oznaczamy symbolem xij (i = 1, 2, ..., k; j = 1, 2,..., ni), a średnie xi śr.

Chcemy sprawdzić hipotezę o jednorodności wariancji we wszystkich podpopulacjach.
H0: σ21 = σ22 =... = σ2k
H1: nie wszystkie σ2i są jednakowe

Z wyników k prób o liczebnościach ni oblicza się według kolejnych wzorów:

symbole logarytmów oznaczają logarytmy dziesiętne.

Statystyka ta ma przy założeniu prawdziwości hipotezy H0 rozkład asymptotyczny Χ2 z k - 1 stopniami swobody. Z tablicy rozkładu Χ2, dla ustalonego z góry poziomu istotności α; i dla k - 1 stopni swobody, odczytujemy wartość krytyczną Χ2α.

Reguła decyzyjna: Ilekroć z porównania obliczonej wartości σ2 z wartością krytyczną σ2α otrzymamy nierówność:

Χ2Χ2α

podejmujemy decyzję odrzucenia sprawdzanej H0.

Gdy natomiast:

Χ2 < Χ2α

nie ma podstaw do odrzucenia H0.

Test Cochrana

Test Hartleya (test Fmax)

Jeśli założymy, że każda populacja ma rozkład normalny i że ich wariancje są równe
σ2i (i = 1, 2, ..., k),

to możemy zweryfikować hipotezy H0: σ21 = σ22 = .... = σ2k
H1: nie wszystkie σ2i są jednakowe

Reguła decyzyjna: odrzucamy H0, jeżeli:

Fobl. max > Fmax(α){k, df i (max)}

 
Fmax(α){kvi(max)} odczytujemy ze specjalnej tablicy, gdzie:
k - liczba czynników;
dfi(max) - największa liczba stopni swobody spośród próbek;

Fobl. max = σ2max / σ2min

PRZYKŁAD
 

Wariancje próbek dla poszczególnych grup wynoszą: 114,8; 325,1; 292,0. Stąd:
Fobl. max = 325,1/114,8 = 2,83
α=0,05; k = 3; dfi(max) = 9;
Ftabl = 5,34
Fobl. max < Ftabl
Stąd wniosek: Nie ma podstaw do odrzucenia hipotezy H0.

Test Levene'a

  • mocny test;
  • dla każdej zmiennej zależnej przeprowadzana jest ANOVA na podstawie bezwzględnych odchyleń wartości od średnich grupowych;
  • jeżeli test Levene'a okaże się istotny to H0 o jednorodności wariancji w grupach należy odrzucić.

ale F jest mocną statystyką gdy:

  1. liczebności w grupach są >10 (i w przypadku równych n);
  2. średnie w grupach nie są skorelowane z odchyleniami standardowymi w tych grupach;

Test jednorodności wariancji nie podważa ANOVA. Test Levene'a nie jest odporny na nierówne ilości elementó w grupach.
(STATSOFT 1516, 1521).

Test Browna - Forsythe'a

  • test podobny do Levene'a;
  • jest bardziej odporny na odchylenia od normalności zmiennych zależnych w grupach;
  • można go stosować przy różnych liczebnościach elementów w grupach;
  • zamiast wykonywać ANOVA na odchyleniach od średniej, można to samo robić na odchyleniach od median grupowych;
  • opiera się na założeniu jednorodności wariancji (?);

(STATSOFT 1516, 1522).

 
 

Wstęp:

 
 
 
 

Badanie jednej zmiennej

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Badanie postaci rozkładów

 
 
 
 
 
 
 
 

Testowanie zgodności rozkładów z rozkładem N(0, 1)

 
 
 
 
 
 

Współzależność dwóch cech

 
 
 
 
 
 

Analiza wariancji

 
 
 
 
Analiza wariancji (obliczenia)
 
 
Testy jednorodności wariancji w grupach (testowanie założeń ANOVA)
 
 
 
 
 
 

Analiza danych kierunkowych

 
 
 
 
 
 
 
 
 
 

Dodatki

 
 
 
 

Dane

Dane do ćwiczeń,
UWAGA!:

Dostępnych jest 60 zestawów danych. Każdy zestaw składa się z dwóch dokumentów (.doc) oznaczonych odpowiednio w nazwie pliku litermi "A" lub "B" oraz jednym dokumentem .sta (Statistica 5.0) (Sz. cz. A). W pliku: instrukcja_ST_5.doc zamieszczono szczegółową instrukcję do ćwiczeń autorstwa dr inż. Wojciecha Masteja, a w pliku: Sz-srf.xls dane do wykreślenia map.

Zadania

z rachunku prawdopodobieństwa i statystyki

Zestaw zadań 1 (1-10)
Zestaw zadań 2 (11-16)
Zestaw zadań 3 (17-27)
Zestaw zadań 4 (28-32)
Zestaw zadań 5 (33-43)
Zestaw zadań 6 (44-56)
Zestaw zadań 7 (57-63)
Zestaw zadań 8 (64-69)
Cały zestaw (1-69)
Cały zestaw (1-69)

Dystrybuanty znanych rozkładów

 
 
Rozkład Normalny
 
Rozkład Χ2 (chi kwadrat)
 
Rozkład t-Studenta
 

Kalkulatory dystrybuant

 
 
Rozkład Normalny
 
Rozkład F (Fischera-Snedecora)
 
Rozkład t - Studenta
 
Rozkład Χ2 (chi kwadrat)
 

Inne

 
 
II rok - Metryczka teczki z ćwiczeniami ze statystyki
 

Linki

 
 
Wielojęzyczny słownik statystyczny
 
 
polska wersja Elektronicznego Podręcznika Statystyki - Serwis oprogramowania Statistica
 
 

Wyniki kolokwium

 
 
 
(30.06.08)
 
(26.01.08)
 
(26.01.08)
 
(15.12.07)