Cum să găsiți abaterea standard în R?

Cum să găsiți abaterea standard în R?

În acest articol, vom discuta cum să găsim abaterea standard în R limbaj de programare . Abaterea standard R este măsura dispersiei valorilor. Poate fi definit și ca rădăcina pătrată a varianței.

Formula abaterii standard a probei:

s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

Unde,

  • s = abaterea standard a probei
  • N = Numărul de entități
  • overline{x}= Media entităților

Practic, există două moduri diferite de a calcula Deviația standard în limbajul de programare R, ambele fiind discutate mai jos.

Metoda 1: Abordare naivă

În această metodă de calcul a abaterii standard, vom folosi formula standard de mai sus a abaterii standard a eșantionului în limbajul R.

Exemplul 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Ieșire:

[1]   25.53886 

Exemplul 2:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Ieșire:

[1] 2.676004 

Metoda 2: Folosind sd()

Funcția sd() este utilizată pentru a returna abaterea standard.

Sintaxă: sd(x, na.rm = FALS)

Parametri:

    x: un vector numeric, o matrice sau un cadru de date.na.rm: valorile lipsă vor fi eliminate?

Întoarcere: Abaterea standard a eșantionului a lui x.

Exemplul 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)>

Ieșire:

[1] 25.53886 

Exemplul 2:

R

v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Ieșire:

[1] 23.52175 

Exemplul 3:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Ieșire:

[1] 2.676004 

Calculați abaterea standard a cadrului de date:

Putem calcula abaterea standard a cadrului de date folosind ambele metode. putem lua setul de date iris și pentru fiecare coloană, vom calcula abaterea standard.

Exemplul 1:

R

data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)>

Ieșire:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377 

De asemenea, putem calcula abaterea standard pentru întregul cadru de date împreună cu ajutorul funcției de aplicare.

R

# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)>

Ieșire:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377 

Coloanele de la 1 la 4 ale setului de date iris, care sunt coloanele numerice care transportă măsurătorile variabile, sunt alese folosind expresia iris[, 1:4] din codul de mai sus.

Funcția sd este aplicată fiecărei coloane (marcate cu 2) din subsetul ales al setului de date iris folosind funcția de aplicare. Valorile deviației standard rezultate sunt salvate în vectorul std_deviation pentru fiecare coloană.