Odchylenie vs odchylenie standardowe
Odchylenie vs odchylenie standardowe
W statystyce opisowej i wnioskowej stosuje się kilka wskaźników do opisania zbioru danych odpowiadającego jego centralnej tendencji, rozproszeniu i skośności. W wnioskowaniu statystycznym są one powszechnie znane jako estymatory, ponieważ szacują wartości parametrów populacji.
Rozrzut jest miarą rozprzestrzeniania się danych wokół środka zbioru danych. Odchylenie standardowe jest jedną z najczęściej stosowanych miar dyspersji. Odchylenia każdego punktu danych od średniej są brane pod uwagę przy obliczaniu odchylenia standardowego. Dlatego można argumentować, że odchylenie standardowe wraz ze średnią zapewni prawie wystarczający obraz zbioru danych.
Rozważ następujący zestaw danych. Waga 10 osób (w kilogramach) wynosi 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Wtedy średnia waga dziesięciu osób (w kilogramach) wynosi 71 (w kilogramach).
Co to jest odchylenie?
W statystyce odchylenie oznacza wielkość, o jaką pojedynczy punkt danych różni się od ustalonej wartości, takiej jak średnia. Ogólnie, niech k będzie wartością stałą, a x 1, x 2,…, x n oznacza zbiór danych. Następnie definiuje się odchylenie x j od k jako (x j - k).
Na przykład w powyższym zestawie danych odpowiednie odchylenia od średniej wynoszą (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 i (79 - 71) = 8.
Co to jest odchylenie standardowe?
Gdy można uwzględnić dane z całej populacji (na przykład w przypadku spisu ludności), można obliczyć odchylenie standardowe populacji. Aby obliczyć odchylenie standardowe populacji, najpierw oblicza się odchylenia wartości danych od średniej populacji. Średnia kwadratowa (średnia kwadratowa) odchyleń nazywana jest odchyleniem standardowym populacji. W symbolach σ = √ {∑ (x i -µ) 2 / n}, gdzie µ jest średnią populacji, a n jest wielkością populacji.
Gdy dane z próby (o rozmiarze n) są wykorzystywane do oszacowania parametrów populacji, obliczane jest odchylenie standardowe próby. Najpierw obliczane są odchylenia wartości danych od średniej próbki. Ponieważ średnia z próby jest używana zamiast średniej populacji (która jest nieznana), przyjmowanie średniej kwadratowej nie jest właściwe. Aby skompensować użycie średniej z próby, sumę kwadratów odchyleń dzieli się przez (n-1) zamiast n. Przykładowe odchylenie standardowe to pierwiastek kwadratowy z tego. W symbolach matematycznych S = √ {∑ (x i -ẍ) 2 / (n-1)}, gdzie S to odchylenie standardowe próbki, ẍ to średnia próbki, a xi to punkty danych.
W poprzednim zestawie danych suma kwadratów odchylenia wynosi (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Zatem odchylenie standardowe populacji wynosi √ (366/10) = 6,05 (w kilogramach). (Zakładając, że badana populacja składa się z 10 osób, od których pobrano dane).
Jaka jest różnica między odchyleniem a odchyleniem standardowym? • Odchylenie standardowe jest wskaźnikiem statystycznym i estymatorem, ale odchylenie nim nie jest. • Odchylenie standardowe jest miarą rozproszenia zbioru danych z centrum, podczas gdy odchylenie odnosi się do ilości, o jaką pojedynczy punkt danych różni się od ustalonej wartości. |