Obciążenie estymatora wariancji


Tomasz Bartuś



[na podstawie: Tarasiuk J., Wirtualne Wademekum Statystyki]

Przez długi czas nie mogłem zrozumieć nieintuicyjnego (n - 1) w mianowniku estymatora wariancji populacji będącej częścią zbiorowości generalnej. W przypadku estymatora średniej arytmetycznej wzór jest jasny i klarowny. Suma wszystkich wartości badanej cechy zostaje po prostu podzielona przez całkowitą liczbę obserwacji. Postaram się wytłumaczyć skąd się bierze wspomniane (n - 1) w mianowniku wariancji.

Tok rozumowania rozpoczniemy od założenia co by było gdyby estymator wariancji, tak jak w przypadku estymatora wartości średniej miał w mianowniku samo n.

Estymator wariancji

Gdzie:
S2x - estymator wariancji populacji próby (wariancja próbkowa)
n - liczba elementów populacji próby,
xi - i-ty element populacji próby,
- średnia z populacji próby (średnia próbkowa),

Estymator jest zmienną losową. Jeżeli policzymy wartość wariancji próbkowej (S2x) dla wielu różnych prób, zawsze otrzymamy inną wartość estymatora.

Estymator jest nieobciążony, jeżeli wartość oczekiwana (wartość przeciętna) z estymatora (E(S2x)) jest równa wartości estymowanego parametru (Θ). W tym przypadku należałoby zadać pytanie czy estymator wariancji (S2x) (wariancja próbkowa) jest równy wariancji z populacji generalnej (σ2). Wszystko co trzeba teraz zrobić to sprawdzić czy tak jest w tym przypadku.

W związku z tym, że wartość oczekiwana ze stałej (tutaj = 1 / n jest równa tej stałej (własności wartości oczekiwanej)), możemy napisać:

Wartość oczewkiwana estymatora wariancji

Zastosujmy trik polegający na dodaniu i odjęciu wartości średniej z populacji generalnej (μ)

Wartość oczekiwana sumy zmiennych losowych jest równa sumie wartości oczekiwanych tych zmiennych (własności wartości oczekiwanej):

a)
Wartość oczekiwana kwadratu odchyłek zmiennej losowej X od jej wartości oczekiwanej (przeciętnej), z definicji jest równa wariancji zmiennej losowej:

Wartość oczewkiwana estymatora wariancji

b)

Wariancja iloczynu stałej (w tym przypadku 1 / n) i zmiennej losowej, równa się iloczynowi kwadratu tej stałej i wariancji tej zmiennej (własności wariancji zmiennej losowej):

wariancja sumy zmiennych losowych jest równa sumie wariancji tych zmiennych (własności wariancji zmiennej losowej):

każda zmienna xi podlega temu samemu rozkładowi. Jest to rozkład zmiennej losowej X. Tak więc wariancja każdej ze zmiennych xi jest równa wariancji zmiennej losowej X:

Widać więc, że wartość oczekiwana estymatora wariancji zależy od n. Estymator jest więc obciążony. Wartość oczekiwana nie może być równa wartości wyestymowanej. Jak zatem powinien wyglądać estymator nieobciążony. Oczywiście w mianowniku zamiast n powinien mieć n - 1.

 
 

Wstęp:

 
 
 
 

Badanie jednej zmiennej

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Badanie postaci rozkładów

 
 
 
 
 
 
 
 

Testowanie zgodności rozkładów z rozkładem N(0, 1)

 
 
 
 
 
 

Współzależność dwóch cech

 
 
 
 
 
 

Analiza wariancji

 
 
 
 
Analiza wariancji (obliczenia)
 
 
Testy jednorodności wariancji w grupach (testowanie założeń ANOVA)
 
 
 
 
 
 

Analiza danych kierunkowych

 
 
 
 
 
 
 
 
 
 

Dodatki

 
 
 
 

Dane

Dane do ćwiczeń,
UWAGA!:

Dostępnych jest 60 zestawów danych. Każdy zestaw składa się z dwóch dokumentów (.doc) oznaczonych odpowiednio w nazwie pliku litermi "A" lub "B" oraz jednym dokumentem .sta (Statistica 5.0) (Sz. cz. A). W pliku: instrukcja_ST_5.doc zamieszczono szczegółową instrukcję do ćwiczeń autorstwa dr inż. Wojciecha Masteja, a w pliku: Sz-srf.xls dane do wykreślenia map.

Zadania

z rachunku prawdopodobieństwa i statystyki

Zestaw zadań 1 (1-10)
Zestaw zadań 2 (11-16)
Zestaw zadań 3 (17-27)
Zestaw zadań 4 (28-32)
Zestaw zadań 5 (33-43)
Zestaw zadań 6 (44-56)
Zestaw zadań 7 (57-63)
Zestaw zadań 8 (64-69)
Cały zestaw (1-69)
Cały zestaw (1-69)

Dystrybuanty znanych rozkładów

 
 
Rozkład Normalny
 
Rozkład Χ2 (chi kwadrat)
 
Rozkład t-Studenta
 

Kalkulatory dystrybuant

 
 
Rozkład Normalny
 
Rozkład F (Fischera-Snedecora)
 
Rozkład t - Studenta
 
Rozkład Χ2 (chi kwadrat)
 

Inne

 
 
II rok - Metryczka teczki z ćwiczeniami ze statystyki
 

Linki

 
 
Wielojęzyczny słownik statystyczny
 
 
polska wersja Elektronicznego Podręcznika Statystyki - Serwis oprogramowania Statistica
 
 

Wyniki kolokwium

 
 
 
(30.06.08)
 
(26.01.08)
 
(26.01.08)
 
(15.12.07)