Szeregi rozdzielcze
Tomasz Bartuś
Miary położenia, rozrzutu, skośności i asymetrii w zależności od liczebności próby obliczamy na podstawie szeregu pozycyjnego (dla prób mało licznych - poniżej 30 przypadków) lub szeregu rozdzielczego (dla prób licznych - powyżej 30 przypadków).
Szereg pozycyjny tworzy się przez uszeregowanie danych według wzrastającej wartości.
X1 < X2..... < Xn
Szereg rozdzielczy tworzy się przez uszeregowanie danych według wzrastającej lub malejącej wartości i podzielenie powstałego szeregu na rozłączne podzbiory zwane grupami.
W wyniku takiego podziału otrzymujemy bardziej jednorodne grupy. Obliczając częstości wystąpień w danej grupie otrzymujemy szereg rozdzielczy. Każdy szereg rozdzielczy charakteryzują przedziały klasowe grup i ilości przypadków występujących w kolejnych grupach. Szereg rozdzielczy reprezentuje postać rozkładu danych populacji próby.
PROCEDURA:
- uszereguj dane wg. wzrastającej wartości badanego parametru,
- podziel powstały szereg na m klas według reguł:
-
- wszystkie przypadki muszą trafić do jednego z przedziałów klasowych,
- liczba przedziałów klasowych nie powinna być zbyt duża ani zbyt mała,
- najczęściej liczba przedziałów klasowych waha się w około 10 (8-15),
- najlepszym sposobem doboru ilości klas jest metoda prób i błędów,
- szerokość przedziałów klasowych w miarę możliwości powinna być stała,
- granice przedzialow klasowych, o ile to możliwe powinny być liczbami całkowitymi lub "zaokrąglonymi" liczbami rzeczywistymi (1,5; 1,75 itp.),
- można kierować się znanymi z literatury regułami tworzenia grup:
-
- optymalną liczbę przedziłów klasowych k dla próbki o liczebności n można obliczyć z sugestii Huntsbergera:
k = 1 + 3.3 log n (Mucha J., 1994),
- ilość przedziałów klasowych może przybliżać wyciągnięcie pierwiastka kwadratowego z ilości obserwacji (Swan A.R.H., 1995),
- zakres zmienności badanego parametru obliczamy ze wzoru:
Δx = xmax - xmin,
- optymalną szerokość przedziłów klasowych Δx można obliczyć ze wzoru:
Δx = xmax - xmin / 1 + 3,3 log n,
- oblicz liczebności wystąpień przypadków dla poszczególnych grup (li);
- w praktyce zamiast liczebności najczęściej używa się częstości wystąpień (pi) wyrażonych w procentach:
pi = li / n ⋅ 100%;
- najczęściej szereg rozdzielczy przedstawia się w formie tabelarycznej,
- wizualną ocenę struktury populacji próby najwygodniej jest przeprowadzić za pomocą graficznej reprezentacji szeregu rozdzielczego - histogramu
Pomierzone średnice 40-tu amonitów [cm] wynoszą:
3,2 | 3,7 | 3,9 | 3,4 | 3,1 | 3,1 | 3,1 | 3,9 | 3,5 | 3,3 |
3,6 | 3,8 | 3,7 | 3,0 | 3,5 | 3,2 | 3,5 | 3,7 | 3,9 | 3,6 |
3,4 | 2,9 | 3,2 | 3,4 | 2,9 | 3,6 | 3,7 | 3,3 | 3,4 | 4,0 |
3,8 | 3,7 | 3,3 | 2,9 | 3,1 | 3,2 | 3,6 | 3,5 | 3,3 | 3,4 |
podsumujmy:
wszystkich przypadków: n = 40;
przybliżeniem ilości klas będzie pierwiastek kwadratowy z 40, k = ok. 6;
wartość minimalna xmin = 2,9;
wartość maksymalna xmax = 4,0;
Różnica pomiędzy xmax - xmin = ΔX = 1,1;
szerokość przedziału klasowego: ΔX / k = 0,18 (dla wygody wartość tą rozszerzamy do 0,2);
Szereg rozdzielczy przedstawiono poniżej w formie tabelarycznej.
Szereg rozdzielczy:
lp. | przedział | liczebności (li) | częstości (pi) [%] |
1. | 2,85-3,05 | 4 | 10 |
2. | 3,05-3,25 | 8 | 20 |
3. | 3,25-3,45 | 9 | 22,5 |
4. | 3,45-3,65 | 8 | 20 |
5. | 3,65-3,85 | 7 | 17,5 |
6. | 3,85-4,05 | 4 | 10 |
| | Σ = 40 | Σ = 100% |
UWAGA!: Przy testowaniu zgodności rozkładów z rozkładami teoretycznymi (np. rozkładem normalnym) testem Χ2 (czyt.: chi-kwadrat), klasy zawierające mniej niż 5 elementów są łączone z jedną z klas sąsiednich.