Boxplot in linguaggio R
Un grafico a scatola è un grafico utilizzato per visualizzare le informazioni sotto forma di distribuzione disegnando grafici a scatole per ciascuno di essi. Questa distribuzione dei dati si basa su cinque serie (minimo, primo quartile, mediana, terzo quartile e massimo).
Boxplot inseriti Linguaggio di programmazione R
I boxplot vengono creati in R utilizzando il file diagramma a scatola() funzione.
Sintassi: boxplot(x, dati, notch, varwidth, nomi, main)
parametri:
x: questo parametro imposta come vettore o formula. dati: questo parametro imposta il frame di dati. tacca: questo parametro è l'etichetta per l'asse orizzontale. varwidth: questo parametro è un valore logico. Imposta come true per disegnare una larghezza della casella proporzionale alla dimensione del campione. main: questo parametro è il titolo del grafico. nomi: questo parametro rappresenta le etichette del gruppo che verranno mostrate sotto ciascun boxplot.
Creazione di un set di dati
Per capire come possiamo creare un boxplot:
- Utilizziamo il set di dati mtcars.
- Diamo un'occhiata alle colonne mpg e cyl in mtcars.
R
input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))> |
Produzione:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6
Creazione del boxplot
Creazione del grafico Boxplot.
- Prendi i parametri necessari per creare un boxplot.
- Ora disegniamo un grafico per la relazione tra mpg e cil.
R
# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )> |
Produzione:
Box plot in R
Boxplot utilizzando notch
Per disegnare un boxplot utilizzando una tacca:
- Con l'aiuto di Notch, possiamo scoprire come le mediane dei diversi gruppi di dati corrispondono tra loro.
R
# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )> |
Produzione:
Boxplot in R
col: Utilizza un vettore di colori (my_colors) per modificare il colore di riempimento delle caselle.
frontiere: Imposta il colore dei bordi della casella su nero.
tacca: Per illustrare gli intervalli di confidenza, viene aggiunta una tacca alle caselle.
larghezza della tacca: Gestisce la larghezza delle tacche.
medico: Rende bianco il colore della linea mediana.
whiskcol: Imposta il colore dei baffi su nero con il comando whiskcol.
boxwex: Modifica la larghezza delle caselle.
outp : imposta le forme dei valori anomali su cerchi solidi.
risultato: Cambia il colore dei valori anomali in nero.
Boxplot multipli
Qui stiamo creando più boxplot. I singoli dati per i quali è richiesta una rappresentazione boxplot si basano sulla funzione.
R
# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))> |
Produzione:
Box plot multipli in R
- In questo codice, iniziamo elencando le variabili nel vettore delle variabili per il quale desideriamo creare box plot. In questo esempio ho aggiunto mpg, disp, hp e wt, ma puoi modificare questo elenco in base alle tue esigenze.
- Il layout del grafico viene quindi creato utilizzando la funzione par e la sintassi mfrow = c(1, length(variables)), che genera una griglia con una riga e tante colonne quante sono le variabili nel vettore delle variabili.
- Usiamo la funzione boxplot all'interno del ciclo per generare un boxplot per ciascuna variabile. La funzione get(var) estrae dinamicamente i valori delle colonne corrispondenti dal set di dati. Utilizzando le impostazioni fornite, modifichiamo l'aspetto di ogni box plot.