Kuinka löytää R:n keskihajonta?
Tässä artikkelissa keskustelemme siitä, kuinka löytää standardipoikkeama R Ohjelmointikieli . Keskihajonta R on arvojen hajaantumisen mitta. Se voidaan määritellä myös varianssin neliöjuureksi.
Näytteen keskihajonnan kaava:
missä,
- s = näytteen keskihajonta
- N = kokonaisuuksien lukumäärä
-
= Entiteettien keskiarvo
Periaatteessa on kaksi eri tapaa laskea standardipoikkeama R-ohjelmointikielellä, molempia käsitellään alla.
Menetelmä 1: Naiivi lähestymistapa
Tässä keskihajonnan laskentamenetelmässä käytämme yllä olevaa standardikaavaa näytteen keskihajonnasta R-kielellä.
Esimerkki 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Lähtö:
[1] 25.53886
Esimerkki 2:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)> |
Lähtö:
[1] 2.676004
Tapa 2: sd()
Funktiota sd() käytetään keskihajonnan palauttamiseen.
Syntaksi: sd(x, na.rm = EPÄTOSI)
Parametrit:
x: numeerinen vektori, matriisi tai data frame.na.rm: puuttuvat arvot poistetaan?
Palata: Näytteen keskihajonna x.
Esimerkki 1:
R
v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)> |
Lähtö:
[1] 25.53886
Esimerkki 2:
R
v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Lähtö:
[1] 23.52175
Esimerkki 3:
R
v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)> |
Lähtö:
[1] 2.676004
Laske tietokehyksen keskihajonta:
Voimme laskea datakehyksen keskihajonnan molemmilla menetelmillä. voimme ottaa iiristietojoukon ja jokaiselle sarakkeelle laskemme keskihajonnan.
Esimerkki 1:
R
data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)> |
Lähtö:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377
Voimme myös laskea keskihajonnan koko datakehykselle Apply-funktion avulla.
R
# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)> |
Lähtö:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377
Iris-tietojoukon sarakkeet 1–4, jotka ovat muuttujan mittauksia sisältäviä numeerisia sarakkeita, valitaan käyttämällä yllä olevan koodin lauseketta iris[, 1:4].
sd-funktiota sovelletaan jokaiseen sarakkeeseen (merkitty numerolla 2) valitussa iiristietojoukon osajoukossa käyttämällä soveltamistoimintoa. Tuloksena saadut keskihajonnan arvot tallennetaan kunkin sarakkeen std_poikkeamavektoriin.
= Entiteettien keskiarvo