JAK ZNALEŹĆ ODCHYLENIE STANDARDOWE W R?

W tym artykule omówimy, jak znaleźć odchylenie standardowe w Język programowania R . Odchylenie standardowe R jest miarą rozproszenia wartości. Można go również zdefiniować jako pierwiastek kwadratowy z wariancji.

Wzór odchylenia standardowego próbki:

$s = sqrt { Frac {1} {N-1} Displaystyle suma limits_ {i = 1} ^ N (x_i- overline {x}) ^ 2 }$

Gdzie,

s = odchylenie standardowe próbki
N = Liczba podmiotów
= Średnia jednostek

Zasadniczo istnieją dwa różne sposoby obliczania odchylenia standardowego w języku programowania R. Obydwa zostały omówione poniżej.

Metoda 1: Naiwne podejście

W tej metodzie obliczania odchylenia standardowego będziemy używać powyższego standardowego wzoru na odchylenie standardowe próbki w języku R.

Przykład 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Wyjście:

[1]   25.53886

Przykład 2:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Wyjście:

[1] 2.676004

Metoda 2: Używanie sd()

Funkcja sd() służy do zwracania odchylenia standardowego.

Składnia: sd(x, na.rm = FAŁSZ)

Parametry:

x: wektor numeryczny, macierz lub ramka danych.na.rm: usunąć brakujące wartości?

Powrót: Przykładowe odchylenie standardowe x.

Przykład 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)>

Wyjście:

[1] 25.53886

Przykład 2:

R

v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Wyjście:

[1] 23.52175

Przykład 3:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Wyjście:

[1] 2.676004

Oblicz odchylenie standardowe ramki danych:

Obiema metodami możemy obliczyć odchylenie standardowe ramki danych. możemy wziąć zbiór danych tęczówki i dla każdej kolumny obliczymy odchylenie standardowe.

Przykład 1:

R

data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)>

Wyjście:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377

Za pomocą funkcji Apply możemy również obliczyć odchylenie standardowe dla całej ramki danych.

R

# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)>

Wyjście:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377

Kolumny od 1 do 4 zbioru danych tęczówki, które są kolumnami liczbowymi zawierającymi pomiary zmiennych, są wybierane przy użyciu wyrażenia iris[, 1:4] w powyższym kodzie.

Funkcja sd jest stosowana do każdej kolumny (oznaczonej cyfrą 2) wybranego podzbioru zbioru danych tęczówki przy użyciu funkcji Apply. Wynikowe wartości odchylenia standardowego są zapisywane w wektorze std_deviation dla każdej kolumny.