Kako najti standardno odstopanje v R?
V tem članku bomo razpravljali o tem, kako najti standardno odstopanje Programski jezik R . Standardni odklon R je merilo razpršitve vrednosti. Lahko se definira tudi kot kvadratni koren variance.
Formula standardnega odklona vzorca:
kje,
- s = standardni odklon vzorca
- N = število entitet
-
= povprečje entitet
V bistvu obstajata dva različna načina za izračun standardne deviacije v programskem jeziku R, oba sta obravnavana spodaj.
Metoda 1: Naivni pristop
Pri tej metodi izračuna standardnega odklona bomo uporabili zgornjo standardno formulo vzorčnega standardnega odklona v jeziku R.
Primer 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Izhod:
[1] 25.53886
Primer 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Izhod:
[1] 2.676004
2. način: Uporaba sd()
Funkcija sd() se uporablja za vrnitev standardnega odklona.
Sintaksa: sd(x, na.rm = FALSE)
Parametri:
x: numerični vektor, matrika ali podatkovni okvir.na.rm: odstraniti manjkajoče vrednosti?
Vrnitev: Vzorčni standardni odklon x.
Primer 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Izhod:
[1] 25.53886
Primer 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Izhod:
[1] 23.52175
Primer 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Izhod:
[1] 2.676004
Izračunajte standardni odklon podatkovnega okvira:
Standardni odklon podatkovnega okvira lahko izračunamo z obema metodama. lahko vzamemo nabor podatkov šarenice in za vsak stolpec izračunamo standardni odklon.
Primer 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Izhod:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Standardno odstopanje lahko izračunamo tudi za celoten podatkovni okvir skupaj s pomočjo funkcije apply.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Izhod:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Stolpci od 1 do 4 nabora podatkov šarenice, ki so številčni stolpci s spremenljivimi meritvami, so izbrani z uporabo izraza šarenica[, 1:4] v zgornji kodi.
Funkcija sd se uporabi za vsak stolpec (označen z 2) izbrane podnabora nabora podatkov šarenice z uporabo funkcije za uporabo. Dobljene vrednosti standardnega odklona se shranijo v vektor std_deviation za vsak stolpec.
= povprečje entitet