Com trobar la desviació estàndard a R?
En aquest article, parlarem de com trobar la desviació estàndard en Llenguatge de programació R . La desviació estàndard R és la mesura de la dispersió dels valors. També es pot definir com l'arrel quadrada de la variància.
Fórmula de la desviació estàndard de la mostra:
on,
- s = desviació estàndard de la mostra
- N = Nombre d'entitats
-
= Mitjana de les entitats
Bàsicament, hi ha dues maneres diferents de calcular la desviació estàndard en el llenguatge de programació R, totes dues es discuteixen a continuació.
Mètode 1: Enfocament ingenu
En aquest mètode de càlcul de la desviació estàndard, utilitzarem la fórmula estàndard anterior de la desviació estàndard de la mostra en llenguatge R.
Exemple 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Sortida:
[1] 25.53886
Exemple 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Sortida:
[1] 2.676004
Mètode 2: utilitzant sd()
La funció sd() s'utilitza per retornar la desviació estàndard.
Sintaxi: sd(x, na.rm = FALSE)
Paràmetres:
x: un vector numèric, una matriu o un marc de dades.na.rm: s'eliminaran els valors que falten?
Tornada: La desviació estàndard mostral de x.
Exemple 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Sortida:
[1] 25.53886
Exemple 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Sortida:
[1] 23.52175
Exemple 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Sortida:
[1] 2.676004
Calcula la desviació estàndard del marc de dades:
Podem calcular la desviació estàndard del marc de dades mitjançant els dos mètodes. podem prendre el conjunt de dades de l'iris i per a cada columna, calcularem la desviació estàndard.
Exemple 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Sortida:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
També podem calcular la desviació estàndard per a tot el marc de dades juntament amb l'ajuda de la funció d'aplicació.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Sortida:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Les columnes 1 a 4 del conjunt de dades de l'iris, que són les columnes numèriques que porten les mesures variables, s'escullen mitjançant l'expressió iris[, 1:4] del codi anterior.
La funció sd s'aplica a cada columna (marcada amb 2) del subconjunt escollit del conjunt de dades d'iris mitjançant la funció d'aplicació. Els valors de desviació estàndard resultants es guarden al vector std_deviation per a cada columna.
= Mitjana de les entitats