Hur hittar man standardavvikelse i R?
I den här artikeln kommer vi att diskutera hur man hittar standardavvikelsen i R programmeringsspråk . Standardavvikelsen R är måttet på spridningen av värdena. Det kan också definieras som kvadratroten av variansen.
Formel för provets standardavvikelse:
var,
- s = provets standardavvikelse
- N = Antal enheter
-
= Medelvärde av enheter
I grund och botten finns det två olika sätt att beräkna standardavvikelse i programmeringsspråk R, båda diskuteras nedan.
Metod 1: Naivt förhållningssätt
I den här metoden för att beräkna standardavvikelsen kommer vi att använda ovanstående standardformel för provet standardavvikelse i R-språk.
Exempel 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produktion:
[1] 25.53886
Exempel 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produktion:
[1] 2.676004
Metod 2: Använd sd()
Funktionen sd() används för att returnera standardavvikelsen.
Syntax: sd(x, na.rm = FALSE)
Parametrar:
x: en numerisk vektor, matris eller dataframe.na.rm: saknade värden tas bort?
Lämna tillbaka: Provets standardavvikelse för x.
Exempel 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Produktion:
[1] 25.53886
Exempel 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produktion:
[1] 23.52175
Exempel 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produktion:
[1] 2.676004
Beräkna standardavvikelsen för dataramen:
Vi kan beräkna standardavvikelsen för dataramen med båda metoderna. vi kan ta irisdatauppsättningen och för varje kolumn kommer vi att beräkna standardavvikelsen.
Exempel 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Produktion:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Vi kan även beräkna standardavvikelsen för hela dataramen tillsammans med hjälp av appliceringsfunktionen.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Produktion:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Kolumnerna 1 till 4 i irisdatauppsättningen, som är de numeriska kolumnerna som bär de variabla måtten, väljs med uttrycket iris[, 1:4] i koden ovan.
sd-funktionen tillämpas på varje kolumn (markerad med 2) i den valda delmängden av irisdatauppsättningen med hjälp av appliceringsfunktionen. De resulterande standardavvikelsevärdena sparas i std_deviation-vektorn för varje kolumn.
= Medelvärde av enheter