Hvordan finder man standardafvigelse i R?
I denne artikel vil vi diskutere, hvordan man finder standardafvigelsen i R Programmeringssprog . Standardafvigelse R er målet for spredningen af værdierne. Det kan også defineres som kvadratroden af varians.
Formel for prøvestandardafvigelse:
hvor,
- s = prøvestandardafvigelse
- N = Antal enheder
-
= Gennemsnit af enheder
Grundlæggende er der to forskellige måder at beregne standardafvigelse i R-programmeringssprog på, begge er diskuteret nedenfor.
Metode 1: Naiv tilgang
I denne metode til beregning af standardafvigelsen vil vi bruge ovenstående standardformel for prøvestandardafvigelsen i R-sprog.
Eksempel 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produktion:
[1] 25.53886
Eksempel 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produktion:
[1] 2.676004
Metode 2: Brug sd()
Funktionen sd() bruges til at returnere standardafvigelsen.
Syntaks: sd(x, na.rm = FALSK)
Parametre:
x: en numerisk vektor, matrix eller dataramme.na.rm: manglende værdier fjernes?
Vend tilbage: Prøvestandardafvigelsen af x.
Eksempel 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Produktion:
[1] 25.53886
Eksempel 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produktion:
[1] 23.52175
Eksempel 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produktion:
[1] 2.676004
Beregn standardafvigelsen for datarammen:
Vi kan beregne standardafvigelsen for datarammen ved hjælp af begge metoder. vi kan tage irisdatasættet og for hver kolonne beregner vi standardafvigelsen.
Eksempel 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Produktion:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Vi kan også beregne standardafvigelsen for hele datarammen sammen ved hjælp af appliceringsfunktionen.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Produktion:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Kolonne 1 til 4 i irisdatasættet, som er de numeriske kolonner, der bærer de variable målinger, vælges ved hjælp af udtrykket iris[, 1:4] i koden ovenfor.
sd-funktionen anvendes på hver kolonne (markeret med 2) i den valgte delmængde af irisdatasættet ved hjælp af appliceringsfunktionen. De resulterende standardafvigelsesværdier gemmes i std_deviation-vektoren for hver kolonne.
= Gennemsnit af enheder