HVORDAN FINDER MAN STANDARDAFVIGELSE I R?

I denne artikel vil vi diskutere, hvordan man finder standardafvigelsen i R Programmeringssprog . Standardafvigelse R er målet for spredningen af værdierne. Det kan også defineres som kvadratroden af varians.

Formel for prøvestandardafvigelse:

$s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }$

hvor,

s = prøvestandardafvigelse
N = Antal enheder
= Gennemsnit af enheder

Grundlæggende er der to forskellige måder at beregne standardafvigelse i R-programmeringssprog på, begge er diskuteret nedenfor.

Metode 1: Naiv tilgang

I denne metode til beregning af standardafvigelsen vil vi bruge ovenstående standardformel for prøvestandardafvigelsen i R-sprog.

Eksempel 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Produktion:

[1]   25.53886

Eksempel 2:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Produktion:

[1] 2.676004

Metode 2: Brug sd()

Funktionen sd() bruges til at returnere standardafvigelsen.

Syntaks: sd(x, na.rm = FALSK)

Parametre:

x: en numerisk vektor, matrix eller dataramme.na.rm: manglende værdier fjernes?

Vend tilbage: Prøvestandardafvigelsen af x.

Eksempel 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)>

Produktion:

[1] 25.53886

Eksempel 2:

R

v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Produktion:

[1] 23.52175

Eksempel 3:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Produktion:

[1] 2.676004

Beregn standardafvigelsen for datarammen:

Vi kan beregne standardafvigelsen for datarammen ved hjælp af begge metoder. vi kan tage irisdatasættet og for hver kolonne beregner vi standardafvigelsen.

Eksempel 1:

R

data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)>

Produktion:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377

Vi kan også beregne standardafvigelsen for hele datarammen sammen ved hjælp af appliceringsfunktionen.

R

# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)>

Produktion:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377

Kolonne 1 til 4 i irisdatasættet, som er de numeriske kolonner, der bærer de variable målinger, vælges ved hjælp af udtrykket iris[, 1:4] i koden ovenfor.

sd-funktionen anvendes på hver kolonne (markeret med 2) i den valgte delmængde af irisdatasættet ved hjælp af appliceringsfunktionen. De resulterende standardafvigelsesværdier gemmes i std_deviation-vektoren for hver kolonne.