Szeregi rozdzielcze


Tomasz Bartuś



Miary położenia, rozrzutu, skośności i asymetrii w zależności od liczebności próby obliczamy na podstawie szeregu pozycyjnego (dla prób mało licznych - poniżej 30 przypadków) lub szeregu rozdzielczego (dla prób licznych - powyżej 30 przypadków).

Szereg pozycyjny tworzy się przez uszeregowanie danych według wzrastającej wartości.

X1 < X2..... < Xn

Szereg rozdzielczy tworzy się przez uszeregowanie danych według wzrastającej lub malejącej wartości i podzielenie powstałego szeregu na rozłączne podzbiory zwane grupami.
W wyniku takiego podziału otrzymujemy bardziej jednorodne grupy. Obliczając częstości wystąpień w danej grupie otrzymujemy szereg rozdzielczy. Każdy szereg rozdzielczy charakteryzują przedziały klasowe grup i ilości przypadków występujących w kolejnych grupach. Szereg rozdzielczy reprezentuje postać rozkładu danych populacji próby.



PROCEDURA:

  1. uszereguj dane wg. wzrastającej wartości badanego parametru,
  2. podziel powstały szereg na m klas według reguł:
    • wszystkie przypadki muszą trafić do jednego z przedziałów klasowych,
    • liczba przedziałów klasowych nie powinna być zbyt duża ani zbyt mała,
    • najczęściej liczba przedziałów klasowych waha się w około 10 (8-15),
    • najlepszym sposobem doboru ilości klas jest metoda prób i błędów,
    • szerokość przedziałów klasowych w miarę możliwości powinna być stała,
    • granice przedzialow klasowych, o ile to możliwe powinny być liczbami całkowitymi lub "zaokrąglonymi" liczbami rzeczywistymi (1,5; 1,75 itp.),
    • można kierować się znanymi z literatury regułami tworzenia grup:
      • optymalną liczbę przedziłów klasowych k dla próbki o liczebności n można obliczyć z sugestii Huntsbergera:
        k = 1 + 3.3 log n (Mucha J., 1994),
      • ilość przedziałów klasowych może przybliżać wyciągnięcie pierwiastka kwadratowego z ilości obserwacji (Swan A.R.H., 1995),
      • zakres zmienności badanego parametru obliczamy ze wzoru:
        Δx = xmax - xmin,
      • optymalną szerokość przedziłów klasowych Δx można obliczyć ze wzoru:
        Δx = xmax - xmin / 1 + 3,3 log n,
  3. oblicz liczebności wystąpień przypadków dla poszczególnych grup (li);
  4. w praktyce zamiast liczebności najczęściej używa się częstości wystąpień (pi) wyrażonych w procentach:
    pi = li / n ⋅ 100%;
  5. najczęściej szereg rozdzielczy przedstawia się w formie tabelarycznej,
  6. wizualną ocenę struktury populacji próby najwygodniej jest przeprowadzić za pomocą graficznej reprezentacji szeregu rozdzielczego - histogramu
PRZYKŁAD
 

Pomierzone średnice 40-tu amonitów [cm] wynoszą:

3,23,73,93,43,13,13,13,93,53,3
3,63,83,73,03,53,23,53,73,93,6
3,42,93,23,42,93,63,73,33,44,0
3,83,73,32,93,13,23,63,53,33,4

podsumujmy:
wszystkich przypadków: n = 40;
przybliżeniem ilości klas będzie pierwiastek kwadratowy z 40, k = ok. 6;
wartość minimalna xmin = 2,9;
wartość maksymalna xmax = 4,0;
Różnica pomiędzy xmax - xmin = ΔX = 1,1;
szerokość przedziału klasowego: ΔX / k = 0,18 (dla wygody wartość tą rozszerzamy do 0,2);
Szereg rozdzielczy przedstawiono poniżej w formie tabelarycznej.

Szereg rozdzielczy:

lp.przedziałliczebności
(li)
częstości
(pi) [%]
1.2,85-3,05410
2.3,05-3,25820
3.3,25-3,45922,5
4.3,45-3,65820
5.3,65-3,85717,5
6.3,85-4,05410
  Σ = 40Σ = 100%

UWAGA!: Przy testowaniu zgodności rozkładów z rozkładami teoretycznymi (np. rozkładem normalnym) testem Χ2 (czyt.: chi-kwadrat), klasy zawierające mniej niż 5 elementów są łączone z jedną z klas sąsiednich.

 
 

Wstęp:

 
 
 
 

Badanie jednej zmiennej

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Badanie postaci rozkładów

 
 
 
 
 
 
 
 

Testowanie zgodności rozkładów z rozkładem N(0, 1)

 
 
 
 
 
 

Współzależność dwóch cech

 
 
 
 
 
 

Analiza wariancji

 
 
 
 
Analiza wariancji (obliczenia)
 
 
Testy jednorodności wariancji w grupach (testowanie założeń ANOVA)
 
 
 
 
 
 

Analiza danych kierunkowych

 
 
 
 
 
 
 
 
 
 

Dodatki

 
 
 
 

Dane

Dane do ćwiczeń,
UWAGA!:

Dostępnych jest 60 zestawów danych. Każdy zestaw składa się z dwóch dokumentów (.doc) oznaczonych odpowiednio w nazwie pliku litermi "A" lub "B" oraz jednym dokumentem .sta (Statistica 5.0) (Sz. cz. A). W pliku: instrukcja_ST_5.doc zamieszczono szczegółową instrukcję do ćwiczeń autorstwa dr inż. Wojciecha Masteja, a w pliku: Sz-srf.xls dane do wykreślenia map.

Zadania

z rachunku prawdopodobieństwa i statystyki

Zestaw zadań 1 (1-10)
Zestaw zadań 2 (11-16)
Zestaw zadań 3 (17-27)
Zestaw zadań 4 (28-32)
Zestaw zadań 5 (33-43)
Zestaw zadań 6 (44-56)
Zestaw zadań 7 (57-63)
Zestaw zadań 8 (64-69)
Cały zestaw (1-69)
Cały zestaw (1-69)

Dystrybuanty znanych rozkładów

 
 
Rozkład Normalny
 
Rozkład Χ2 (chi kwadrat)
 
Rozkład t-Studenta
 

Kalkulatory dystrybuant

 
 
Rozkład Normalny
 
Rozkład F (Fischera-Snedecora)
 
Rozkład t - Studenta
 
Rozkład Χ2 (chi kwadrat)
 

Inne

 
 
II rok - Metryczka teczki z ćwiczeniami ze statystyki
 

Linki

 
 
Wielojęzyczny słownik statystyczny
 
 
polska wersja Elektronicznego Podręcznika Statystyki - Serwis oprogramowania Statistica
 
 

Wyniki kolokwium

 
 
 
(30.06.08)
 
(26.01.08)
 
(26.01.08)
 
(15.12.07)