Come trovare la deviazione standard in R?
In questo articolo discuteremo come trovare la deviazione standard in Linguaggio di programmazione R . La deviazione standard R è la misura della dispersione dei valori. Può anche essere definita come la radice quadrata della varianza.
Formula della deviazione standard del campione:
Dove,
- s = deviazione standard del campione
- N = Numero di entità
-
= Media delle entità
Fondamentalmente, esistono due modi diversi per calcolare la deviazione standard nel linguaggio di programmazione R, entrambi discussi di seguito.
Metodo 1: approccio ingenuo
In questo metodo di calcolo della deviazione standard, utilizzeremo la formula standard sopra riportata della deviazione standard del campione in linguaggio R.
Esempio 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produzione:
[1] 25.53886
Esempio 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Produzione:
[1] 2.676004
Metodo 2: utilizzo di sd()
La funzione sd() viene utilizzata per restituire la deviazione standard.
Sintassi: sd(x, na.rm = FALSO)
parametri:
x: un vettore numerico, una matrice o un frame di dati.na.rm: i valori mancanti devono essere rimossi?
Ritorno: La deviazione standard campionaria di x.
Esempio 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Produzione:
[1] 25.53886
Esempio 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produzione:
[1] 23.52175
Esempio 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Produzione:
[1] 2.676004
Calcolare la deviazione standard del frame di dati:
Possiamo calcolare la deviazione standard del frame di dati utilizzando entrambi i metodi. possiamo prendere il set di dati dell'iride e per ogni colonna calcoleremo la deviazione standard.
Esempio 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Produzione:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Possiamo anche calcolare la deviazione standard per l'intero frame di dati insieme all'aiuto della funzione di applicazione.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Produzione:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Le colonne da 1 a 4 del set di dati iris, che sono le colonne numeriche che trasportano le misurazioni delle variabili, vengono scelte utilizzando l'espressione iris[, 1:4] nel codice precedente.
La funzione sd viene applicata a ciascuna colonna (contrassegnata da 2) del sottoinsieme scelto del set di dati iris utilizzando la funzione apply. I valori di deviazione standard risultanti vengono salvati nel vettore std_deviation per ciascuna colonna.
= Media delle entità