Boxploturi în limbajul R
Un grafic cu casete este o diagramă care este utilizată pentru a afișa informații sub formă de distribuție prin desenarea unor diagrame cu casete pentru fiecare dintre ele. Această distribuție a datelor se bazează pe cinci seturi (minimum, primul quartila, mediana, al treilea quartila și maxim).
Boxplots în R limbaj de programare
Boxploturile sunt create în R utilizând boxplot() funcţie.
Sintaxă: boxplot(x, date, notch, varwidth, names, main)
Parametri:
x: Acest parametru se setează ca un vector sau o formulă. date: Acest parametru setează cadrul de date. crestătură: Acest parametru este eticheta pentru axa orizontală. varwidth: Acest parametru este o valoare logică. Setați ca adevărat pentru a desena lățimea casetei proporțională cu dimensiunea eșantionului. main: Acest parametru este titlul diagramei. nume: acest parametru sunt etichetele grupurilor care vor fi afișate sub fiecare boxplot.
Crearea unui set de date
Pentru a înțelege cum putem crea un boxplot:
- Folosim setul de date mtcars.
- Să ne uităm la coloanele mpg și cyl în mtcars.
R
input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))> |
Ieșire:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6
Crearea Boxplot-ului
Crearea graficului Boxplot.
- Luați parametrii necesari pentru a realiza un boxplot.
- Acum desenăm un grafic pentru relația dintre mpg și cyl.
R
# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )> |
Ieșire:
Box plot în R
Boxplot folosind notch
Pentru a desena un boxplot folosind o crestătură:
- Cu ajutorul Notch, putem afla cum medianele diferitelor grupuri de date se potrivesc între ele.
R
# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )> |
Ieșire:
Box Plot în R
col: Utilizează un vector de culori (my_colors) pentru a schimba culoarea de umplere a casetelor.
frontiere: Setează culoarea chenarelor casetei la negru.
crestătură: Pentru a ilustra intervalele de încredere, se adaugă o crestătură în casete.
lățimea crestăturii: Gestionează lățimea crestăturilor.
medcol: Face culoarea liniei mediane albe.
whiskcol: Setează culoarea mustăților la negru cu comanda whiskcol.
boxwex: Modifică lățimea casetelor.
outpch : Setează formele valorii aberante la cercuri solide.
outcol: Schimbă culoarea valorii aberante în negru.
Boxplot multiplu
Aici creăm mai multe boxplot. Datele individuale pentru care este necesară o reprezentare boxplot se bazează pe funcție.
R
# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))> |
Ieșire:
Diagrame cu case multiple în R
- În acest cod, începem prin a enumera variabilele din vectorul de variabile pentru care dorim să facem diagrame cu casete. Am adăugat mpg, disp, hp și wt în acest exemplu, dar puteți modifica această listă pentru a se potrivi nevoilor dvs.
- Aspectul grafic este apoi creat folosind funcția par și sintaxa mfrow = c(1, length(variables)), care generează o grilă cu un rând și atâtea coloane câte variabile există în vectorul de variabile.
- Folosim funcția boxplot în interiorul buclei pentru a genera un box plot pentru fiecare variabilă. Funcția get(var) extrage în mod dinamic valorile coloanei potrivite din setul de date. Folosind setările date, modificăm aspectul fiecărei casete.