Ako nájsť štandardnú odchýlku v R?
V tomto článku budeme diskutovať o tom, ako nájsť štandardnú odchýlku v R Programovací jazyk . Smerodajná odchýlka R je mierou rozptylu hodnôt. Môže byť tiež definovaná ako druhá odmocnina rozptylu.
Vzorec štandardnej odchýlky vzorky:
kde,
- s = štandardná odchýlka vzorky
- N = Počet subjektov
-
= Priemer entít
V zásade existujú dva rôzne spôsoby, ako vypočítať štandardnú odchýlku v programovacom jazyku R, pričom oba sú uvedené nižšie.
Metóda 1: Naivný prístup
Pri tejto metóde výpočtu smerodajnej odchýlky budeme používať vyššie uvedený štandardný vzorec vzorovej smerodajnej odchýlky v jazyku R.
Príklad 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Výkon:
[1] 25.53886
Príklad 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Výkon:
[1] 2.676004
Metóda 2: Použitie sd()
Funkcia sd() sa používa na vrátenie štandardnej odchýlky.
Syntax: sd(x, na.rm = FALSE)
Parametre:
x: číselný vektor, matica alebo dátový rámec.na.rm: odstrániť chýbajúce hodnoty?
Návrat: Vzorová smerodajná odchýlka x.
Príklad 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Výkon:
[1] 25.53886
Príklad 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Výkon:
[1] 23.52175
Príklad 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Výkon:
[1] 2.676004
Vypočítajte smerodajnú odchýlku dátového rámca:
Oboma metódami môžeme vypočítať smerodajnú odchýlku dátového rámca. môžeme vziať súbor údajov o dúhovke a pre každý stĺpec vypočítame štandardnú odchýlku.
Príklad 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Výkon:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Môžeme tiež vypočítať štandardnú odchýlku pre celý dátový rámec spolu s pomocou funkcie Apply.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Výkon:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Stĺpce 1 až 4 množiny údajov o dúhovke, čo sú číselné stĺpce nesúce merania premenných, sa vyberajú pomocou výrazu iris[, 1:4] v kóde vyššie.
Funkcia sd sa aplikuje na každý stĺpec (označený 2) vybranej podmnožiny množiny údajov o dúhovke pomocou funkcie použiť. Výsledné hodnoty štandardnej odchýlky sú uložené vo vektore std_deviation pre každý stĺpec.
= Priemer entít