Hvordan finne standardavvik i R?
I denne artikkelen vil vi diskutere hvordan du finner standardavviket i R programmeringsspråk . Standardavvik R er målet for spredningen av verdiene. Det kan også defineres som kvadratroten av variansen.
Formel for prøvestandardavvik:
hvor,
- s = prøvestandardavvik
- N = Antall enheter
-
= Gjennomsnitt av enheter
I utgangspunktet er det to forskjellige måter å beregne standardavvik i R-programmeringsspråk, begge er diskutert nedenfor.
Metode 1: Naiv tilnærming
I denne metoden for å beregne standardavviket vil vi bruke standardformelen ovenfor for prøvestandardavviket i R-språk.
Eksempel 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produksjon:
[1] 25.53886
Eksempel 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produksjon:
[1] 2.676004
Metode 2: Bruk sd()
Funksjonen sd() brukes til å returnere standardavviket.
Syntaks: sd(x, na.rm = FALSE)
Parametere:
x: en numerisk vektor, matrise eller dataramme.na.rm: manglende verdier fjernes?
Komme tilbake: Eksempelets standardavvik på x.
Eksempel 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Produksjon:
[1] 25.53886
Eksempel 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produksjon:
[1] 23.52175
Eksempel 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produksjon:
[1] 2.676004
Beregn standardavviket til datarammen:
Vi kan beregne standardavviket til datarammen ved å bruke begge metodene. vi kan ta iris-datasettet og for hver kolonne vil vi beregne standardavviket.
Eksempel 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Produksjon:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Vi kan også beregne standardavviket for hele datarammen sammen ved hjelp av applikasjonsfunksjonen.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Produksjon:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Kolonne 1 til 4 i iris-datasettet, som er de numeriske kolonnene som bærer de variable målingene, er valgt ved å bruke uttrykket iris[, 1:4] i koden ovenfor.
sd-funksjonen brukes på hver kolonne (merket med 2) i det valgte delsettet av iris-datasettet ved å bruke funksjonen. De resulterende standardavviksverdiene lagres i std_deviation-vektoren for hver kolonne.
= Gjennomsnitt av enheter