Boxplots v jazyce R
Krabicový graf je graf, který se používá k zobrazení informací ve formě distribuce vykreslením krabicových grafů pro každý z nich. Toto rozdělení dat je založeno na pěti souborech (minimum, první kvartil, medián, třetí kvartil a maximum).
Boxplots in Programovací jazyk R
Boxplots jsou vytvořeny v R pomocí boxplot() funkce.
Syntax: boxplot(x, data, notch, varwidth, names, main)
Parametry:
x: Tento parametr se nastavuje jako vektor nebo vzorec. data: Tento parametr nastavuje datový rámec. notch: Tento parametr je označení pro horizontální osu. varwidth: Tento parametr je logická hodnota. Nastavte jako true pro vykreslení šířky rámečku úměrné velikosti vzorku. main: Tento parametr je název grafu. names: Tento parametr jsou štítky skupin, které se zobrazí pod každým polem.
Vytvoření datové sady
Abychom pochopili, jak můžeme vytvořit boxplot:
- Používáme datovou sadu mtcars.
- Podívejme se na sloupce mpg a cyl v mtcars.
R
input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))> |
Výstup:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6
Vytvoření Boxplotu
Vytvoření grafu Boxplot.
- Vezměte parametry, které jsou nutné k vytvoření boxplotu.
- Nyní nakreslíme graf vztahu mezi mpg a cyl.
R
# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )> |
Výstup:
Krabicový pozemek v R
Boxplot pomocí notch
Chcete-li nakreslit boxplot pomocí zářezu:
- Pomocí Notch můžeme zjistit, jak se mediány různých datových skupin vzájemně shodují.
R
# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )> |
Výstup:
Box Plot v R
col: Používá vektor barev (my_colors) ke změně barvy výplně polí.
hranice: Nastaví barvu ohraničení rámečku na černou.
zářez: Pro ilustraci intervalů spolehlivosti je do polí přidán zářez.
šířka zářezu: Spravuje šířku zářezů.
lékař: Udělá barvu střední čáry bílou.
whiskcol: Nastaví barvu vousů na černou pomocí příkazu whiskcol.
boxwex: Upraví šířku polí.
outpch : Nastaví tvary odlehlých hodnot na plné kruhy.
outcol: Změní barvu odlehlých hodnot na černou.
Vícenásobný boxplot
Zde vytváříme několik boxplotů. Jednotlivá data, pro která je vyžadována reprezentace boxplotu, jsou založena na funkci.
R
# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))> |
Výstup:
Více krabicových grafů v R
- V tomto kódu začneme seznamem proměnných ve vektoru proměnných, pro které chceme vytvořit krabicové grafy. V tomto příkladu jsem přidal mpg, disp, hp a wt, ale tento seznam můžete změnit, aby vyhovoval vašim potřebám.
- Rozvržení grafu je pak vytvořeno pomocí funkce par a syntaxe mfrow = c(1, délka(proměnné)), která generuje mřížku s jedním řádkem a tolika sloupci, kolik je proměnných ve vektoru proměnných.
- Pomocí funkce boxplot uvnitř smyčky vygenerujeme krabicový graf pro každou proměnnou. Funkce get(var) dynamicky stahuje odpovídající hodnoty sloupců z datové sady. Pomocí daných nastavení změníme vzhled každého krabicového grafu.