Populacja a odchylenie standardowe próby
W statystyce do opisu zbioru danych odpowiadającego jego centralnej tendencji, rozproszeniu i skośności używa się kilku wskaźników. Odchylenie standardowe jest jedną z najpowszechniejszych miar rozproszenia danych z centrum zbioru danych.
Ze względu na trudności praktyczne nie będzie możliwe wykorzystanie danych z całej populacji podczas testowania hipotezy. Dlatego wykorzystujemy wartości danych z próbek do wnioskowania o populacji. W takiej sytuacji są one nazywane estymatorami, ponieważ szacują wartości parametrów populacji.
Niezwykle ważne jest, aby w wnioskowaniu używać obiektywnych estymatorów. Mówi się, że estymator jest nieobciążony, jeśli oczekiwana wartość tego estymatora jest równa parametrowi populacji. Na przykład używamy średniej próbki jako nieobciążonego estymatora średniej populacji. (Z matematycznego punktu widzenia można wykazać, że oczekiwana wartość średniej próby jest równa średniej populacji). W przypadku szacowania odchylenia standardowego populacji odchylenie standardowe próby jest również estymatorem nieobciążonym.
Co to jest odchylenie standardowe populacji?
Gdy można uwzględnić dane z całej populacji (na przykład w przypadku spisu ludności), można obliczyć odchylenie standardowe populacji. Aby obliczyć odchylenie standardowe populacji, najpierw oblicza się odchylenia wartości danych od średniej populacji. Średnia kwadratowa (średnia kwadratowa) odchyleń nazywana jest odchyleniem standardowym populacji.
W klasie liczącej 10 uczniów można łatwo zebrać dane o uczniach. Jeśli hipoteza jest testowana na tej populacji studentów, nie ma potrzeby stosowania wartości próbnych. Na przykład, waga 10 uczniów (w kilogramach) wynosi 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Następnie średnia waga dziesięciu osób (w kilogramach) wynosi (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, czyli 71 (w kilogramach). To jest średnia populacji.
Teraz, aby obliczyć odchylenie standardowe populacji, obliczamy odchylenia od średniej. Odpowiednie odchylenia od średniej wynoszą (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 i (79 - 71) = 8. Suma kwadratów odchylenia wynosi (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Odchylenie standardowe populacji wynosi √ (366/10) = 6,05 (w kilogramach). 71 to dokładna średnia waga uczniów w klasie, a 6,05 to dokładne odchylenie standardowe wagi od 71.
Co to jest odchylenie standardowe próbki?
Gdy dane z próby (o rozmiarze n) są wykorzystywane do oszacowania parametrów populacji, obliczane jest odchylenie standardowe próby. Najpierw obliczane są odchylenia wartości danych od średniej próbki. Ponieważ średnia z próby jest używana zamiast średniej populacji (która jest nieznana), przyjmowanie średniej kwadratowej nie jest właściwe. Aby skompensować wykorzystanie średniej z próby, sumę kwadratów odchyleń dzieli się przez (n-1) zamiast n. Przykładowe odchylenie standardowe to pierwiastek kwadratowy z tego. W symbolach matematycznych S = √ {∑ (x i -ẍ) 2 / (n-1)}, gdzie S to odchylenie standardowe próbki, ẍ to średnia z próby, a x i ’s to punkty danych.
Teraz załóżmy, że w poprzednim przykładzie populacja to uczniowie całej szkoły. Wtedy klasa będzie tylko próbką. Jeżeli do oszacowania zostanie użyta ta próba, odchylenie standardowe próby wyniesie √ (366/9) = 6,38 (w kilogramach), ponieważ 366 zostało podzielone przez 9 zamiast 10 (wielkość próby). Należy zauważyć, że nie ma gwarancji, że będzie to dokładna wartość odchylenia standardowego populacji. To tylko szacunek.
Jaka jest różnica między odchyleniem standardowym populacji a odchyleniem standardowym próbki? • Odchylenie standardowe populacji to dokładna wartość parametru używana do pomiaru dyspersji od centrum, podczas gdy odchylenie standardowe próbki jest dla niej nieobciążonym estymatorem. • Odchylenie standardowe populacji jest obliczane, gdy znane są wszystkie dane dotyczące każdej osoby w populacji. W przeciwnym razie obliczane jest odchylenie standardowe próbki. • Odchylenie standardowe populacji wyrażone jest wzorem σ = √ {∑ (xi-µ) 2 / n}, gdzie µ jest średnią populacji, an jest wielkością populacji, ale odchylenie standardowe próbki jest określone przez S = √ {∑ (xi-ẍ) 2 / (n-1)} gdzie ẍ jest średnią próby, an jest wielkością próby. |