Boxplots v jazyku R
Krabicový graf je graf, ktorý sa používa na zobrazenie informácií vo forme distribúcie pomocou kreslenia boxplots pre každý z nich. Toto rozdelenie údajov je založené na piatich súboroch (minimum, prvý kvartil, medián, tretí kvartil a maximum).
Boxplots in R Programovací jazyk
Boxplots sú vytvorené v R pomocou boxplot() funkciu.
Syntax: boxplot(x, údaje, zárez, varwidth, názvy, hlavné)
Parametre:
x: Tento parameter sa nastavuje ako vektor alebo vzorec. data: Tento parameter nastavuje dátový rámec. zárez: Tento parameter je označenie pre horizontálnu os. varwidth: Tento parameter je logická hodnota. Nastavte ako true, aby sa šírka rámčeka vykreslila úmerná veľkosti vzorky. main: Tento parameter je názov grafu. names: Tento parameter sú štítky skupín, ktoré sa zobrazia pod každým rámčekom.
Vytvorenie množiny údajov
Aby sme pochopili, ako môžeme vytvoriť boxplot:
- Používame súbor údajov mtcars.
- Pozrime sa na stĺpce mpg a cyl v mtcars.
R
input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))> |
Výkon:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6
Vytvorenie Boxplot
Vytvorenie grafu Boxplot.
- Vezmite parametre, ktoré sú potrebné na vytvorenie boxplotu.
- Teraz nakreslíme graf vzťahu medzi mpg a cyl.
R
# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )> |
Výkon:
Krabicový pozemok v R
Boxplot pomocou notch
Ak chcete nakresliť krabicový graf pomocou zárezu:
- Pomocou Notch môžeme zistiť, ako sa mediány rôznych skupín údajov navzájom zhodujú.
R
# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )> |
Výkon:
Krabicový pozemok v R
stĺpec: Používa vektor farieb (my_colors) na zmenu farby výplne polí.
hranice: Nastaví farbu okrajov poľa na čiernu.
zárez: Na ilustráciu intervalov spoľahlivosti je do políčok pridaný zárez.
šírka zárezu: Riadi šírku zárezov.
lekár: Zmení farbu strednej čiary na bielu.
whiskcol: Nastaví farbu fúzov na čiernu pomocou príkazu whiskcol.
boxwex: Upravuje šírku políčok.
outpch : Nastaví tvary odľahlých hodnôt na plné kruhy.
outcol: Zmení farbu odľahlých hodnôt na čiernu.
Viacnásobný boxplot
Tu vytvárame viacero boxplots. Jednotlivé dáta, pre ktoré sa vyžaduje reprezentácia boxplotu, sú založené na funkcii.
R
# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))> |
Výkon:
Viacnásobné krabicové grafy v R
- V tomto kóde začneme zoznamom premenných vo vektore premenných, pre ktoré chceme vytvoriť krabicové grafy. V tomto príklade som pridal mpg, disp, hp a wt, ale tento zoznam môžete zmeniť podľa svojich potrieb.
- Rozloženie grafu sa potom vytvorí pomocou funkcie par a syntaxe mfrow = c(1, dĺžka(premenné)), ktorá vygeneruje mriežku s jedným riadkom a toľkými stĺpcami, koľko je premenných vo vektore premenných.
- Vo vnútri cyklu používame funkciu boxplot na vygenerovanie krabicového grafu pre každú premennú. Funkcia get(var) dynamicky vytiahne zodpovedajúce hodnoty stĺpcov z množiny údajov. Pomocou daných nastavení zmeníme vzhľad každého krabicového grafu.