Boxplots v jeziku R
Škatlasti graf je grafikon, ki se uporablja za prikaz informacij v obliki porazdelitve z risanjem škatlastih grafov za vsakega od njih. Ta porazdelitev podatkov temelji na petih nizih (minimum, prvi kvartil, mediana, tretji kvartil in maksimum).
Boxplots v Programski jezik R
Boxplots so ustvarjeni v R z uporabo boxplot() funkcijo.
Sintaksa: boxplot(x, podatki, zareza, varwidth, imena, glavni)
Parametri:
x: Ta parameter se nastavi kot vektor ali formula. podatki: Ta parameter nastavi podatkovni okvir. zareza: ta parameter je oznaka za vodoravno os. varwidth: ta parameter je logična vrednost. Nastavite kot true, da narišete širino polja sorazmerno z velikostjo vzorca. main: ta parameter je naslov grafikona. imena: Ta parameter so oznake skupin, ki bodo prikazane pod vsakim poljem.
Ustvarjanje nabora podatkov
Da bi razumeli, kako lahko ustvarimo polje:
- Uporabljamo nabor podatkov mtcars.
- Poglejmo stolpca mpg in cyl v mtcars.
R
input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))> |
Izhod:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6
Ustvarjanje Boxplota
Ustvarjanje grafa Boxplot.
- Vzemite parametre, ki so potrebni za izdelavo boxplota.
- Zdaj narišemo graf za razmerje med mpg in cyl.
R
# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )> |
Izhod:
Škatla v R
Boxplot z zarezo
Če želite narisati polje z uporabo zareze:
- S pomočjo Notcha lahko ugotovimo, kako se med seboj ujemajo mediane različnih skupin podatkov.
R
# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )> |
Izhod:
Škatla v R
stolpec: Uporablja vektor barv (my_colors) za spreminjanje barve polnila polj.
meje: Nastavi barvo robov polja na črno.
zareza: Za ponazoritev intervalov zaupanja je v polja dodana zareza.
širina zareze: Upravlja širino zarez.
medcol: Naredi barvo srednje črte belo.
whiskcol: Nastavi barvo brkov na črno z ukazom whiskcol.
boxwex: Spremeni širino polj.
outpch : nastavi oblike izstopajočih na polne kroge.
outcol: Spremeni barvo izstopajočih vrednosti v črno.
Multiple Boxplot
Tukaj ustvarjamo več okvirjev. Posamezni podatki, za katere je zahtevana predstavitev v škatli, temeljijo na funkciji.
R
# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))> |
Izhod:
Več škatlastih ploskev v R
- V tej kodi začnemo z navajanjem spremenljivk v vektorju spremenljivk, za katere želimo narediti škatlaste diagrame. V tem primeru sem dodal mpg, disp, hp in wt, vendar lahko ta seznam spremenite, da bo ustrezal vašim potrebam.
- Postavitev grafikona se nato ustvari z uporabo funkcije par in sintakse mfrow = c(1, length(variables)), ki ustvari mrežo z eno vrstico in toliko stolpci, kot je spremenljivk v vektorju spremenljivk.
- Znotraj zanke uporabljamo funkcijo boxplot za ustvarjanje škatlastega prikaza za vsako spremenljivko. Funkcija get(var) dinamično potegne ujemajoče se vrednosti stolpcev iz nabora podatkov. Z uporabo danih nastavitev spremenimo videz vsake škatlaste risbe.