Boxplots en llenguatge R

Boxplots en llenguatge R

Un gràfic de caixa és un gràfic que s'utilitza per mostrar informació en forma de distribució dibuixant diagrames de caixa per a cadascun d'ells. Aquesta distribució de dades es basa en cinc conjunts (mínim, primer quartil, mediana, tercer quartil i màxim).

Boxplots en Llenguatge de programació R

Els diagrames de caixa es creen en R mitjançant l' diagrama de caixa () funció.

Sintaxi: diagrama de caixa (x, dades, notch, varwidth, noms, principal)

Paràmetres:

    x: aquest paràmetre es configura com a vector o fórmula. dades: aquest paràmetre estableix el marc de dades. osca: aquest paràmetre és l'etiqueta per a l'eix horitzontal. varwidth: aquest paràmetre és un valor lògic. Establiu com a cert per dibuixar l'amplada del quadre proporcional a la mida de la mostra. main: aquest paràmetre és el títol del gràfic. noms: aquest paràmetre són les etiquetes de grup que es mostraran sota cada diagrama de caixa.

Creació d'un conjunt de dades

Per entendre com podem crear un diagrama de caixa:

  • Utilitzem el conjunt de dades mtcars.
  • Mirem les columnes mpg i cyl a mtcars.

R




input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))>

Sortida:

 mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6 

Creació del Boxplot

Creació del gràfic Boxplot.

  • Preneu els paràmetres necessaris per fer un diagrama de caixa.
  • Ara dibuixem un gràfic per a la relació entre mpg i cil.

R




# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )>

Sortida:

Box plot a RGeeksforgeeks

Parcel·la de caixa a R

Boxplot utilitzant notch

Per dibuixar un diagrama de caixa amb una osca:

  • Amb l'ajuda de Notch, podem esbrinar com les mitjanes dels diferents grups de dades coincideixen entre si.

R




# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )>

Sortida:

Box plot a RGeeksforgeeks

Parcel·la de caixa a R

col·loqui: Utilitza un vector de colors (my_colors) per canviar el color de farciment dels quadres.
fronteres: Estableix el color de les vores del quadre en negre.
osca: Per il·lustrar els intervals de confiança, s'afegeix una osca als quadres.
ample d'osca: Gestiona l'amplada de les osques.
medcol: Fa que el color de la línia mitjana sigui blanc.
whiskcol: Estableix el color dels bigotis en negre amb l'ordre whiskcol.
boxwex: Modifica l'amplada de les caixes.
sortida : estableix les formes dels valors atípics en cercles sòlids.
outcol: Canvia el color dels valors atípics a negre.

Trama de caixa múltiple

Aquí estem creant múltiples diagrames de caixa. Les dades individuals per a les quals es requereix una representació de diagrama de caixa es basen en la funció.

R




# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))>

Sortida:

Múltiples trames de caixa a RGeeksforgeeks

Múltiples trames de caixa a R

  • En aquest codi, comencem enumerant les variables del vector de variables per a les quals volem fer diagrames de caixa. He afegit mpg, disp, hp i wt en aquest exemple, però podeu canviar aquesta llista segons les vostres necessitats.
  • A continuació, es crea el disseny del gràfic utilitzant la funció par i la sintaxi mfrow = c(1, length(variables)), que genera una graella amb una fila i tantes columnes com variables hi hagi al vector de variables.
  • Utilitzem la funció boxplot dins del bucle per generar un diagrama de caixa per a cada variable. La funció get(var) extreu dinàmicament els valors de columna coincidents del conjunt de dades. Utilitzant la configuració donada, alterem l'aspecte de cada diagrama de caixa.