Kā atrast R standarta novirzi?
Šajā rakstā mēs apspriedīsim, kā atrast standarta novirzi R programmēšanas valoda . Standarta novirze R ir vērtību izkliedes mērs. To var definēt arī kā dispersijas kvadrātsakni.
Parauga standartnovirzes formula:
kur,
- s = parauga standartnovirze
- N = entītiju skaits
-
= entītiju vidējais rādītājs
Pamatā ir divi dažādi veidi, kā aprēķināt standarta novirzi R programmēšanas valodā, un abi tie ir apskatīti tālāk.
1. metode: naiva pieeja
Šajā standartnovirzes aprēķināšanas metodē mēs izmantosim iepriekš minēto parauga standartnovirzes standarta formulu R valodā.
1. piemērs:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Izvade:
[1] 25.53886
2. piemērs:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Izvade:
[1] 2.676004
2. metode: izmantojot sd()
Funkciju sd() izmanto, lai atgrieztu standarta novirzi.
Sintakse: sd(x, na.rm = FALSE)
Parametri:
x: skaitlisks vektors, matrica vai dati frame.na.rm: vai noņemt trūkstošās vērtības?
Atgriezties: Parauga standartnovirze x.
1. piemērs:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Izvade:
[1] 25.53886
2. piemērs:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Izvade:
[1] 23.52175
3. piemērs:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Izvade:
[1] 2.676004
Aprēķiniet datu rāmja standarta novirzi:
Mēs varam aprēķināt datu rāmja standarta novirzi, izmantojot abas metodes. mēs varam ņemt varavīksnenes datu kopu, un katrai kolonnai mēs aprēķināsim standarta novirzi.
1. piemērs:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Izvade:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Mēs varam arī aprēķināt standarta novirzi visam datu kadram kopā ar pielietošanas funkcijas palīdzību.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Izvade:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Varavīksnenes datu kopas 1. līdz 4. kolonna, kas ir skaitliskās kolonnas, kurās ir mainīgie mērījumi, tiek izvēlētas, izmantojot izteiksmi varavīksnenes[, 1:4] iepriekš minētajā kodā.
Funkcija sd tiek lietota katrai kolonnai (atzīmēta ar 2) izvēlētajā varavīksnenes datu kopas apakškopā, izmantojot lietotnes funkciju. Iegūtās standarta novirzes vērtības tiek saglabātas katras kolonnas vektorā std_deviation.
= entītiju vidējais rādītājs