Boxplots i R Language

Boxplots i R Language

En boksgraf er et diagram som brukes til å vise informasjon i form av distribusjon ved å tegne boksplott for hver av dem. Denne fordelingen av data er basert på fem sett (minimum, første kvartil, median, tredje kvartil og maksimum).

Boxplotter inn R programmeringsspråk

Boxplot lages i R ved å bruke boxplot() funksjon.

Syntaks: boxplot(x, data, notch, varwidth, names, main)

Parametere:

    x: Denne parameteren angis som en vektor eller en formel. data: Denne parameteren setter datarammen. notch: Denne parameteren er etiketten for horisontal akse. varwidth: Denne parameteren er en logisk verdi. Sett som sann for å tegne bredden på boksen i forhold til prøvestørrelsen. main: Denne parameteren er tittelen på diagrammet. navn: Denne parameteren er gruppeetikettene som vises under hvert boksplott.

Opprette et datasett

For å forstå hvordan vi kan lage et boxplot:

  • Vi bruker datasettet mtcars.
  • La oss se på kolonnene mpg og cyl i mtcars.

R




input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))>

Produksjon:

 mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6 

Opprette Boxplot

Opprette Boxplot-grafen.

  • Ta parametrene som kreves for å lage et boxplot.
  • Nå tegner vi en graf for forholdet mellom mpg og cyl.

R




# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )>

Produksjon:

Boksplott i RGeeksforgeeks

Bokstomt i R

Boksplott med hakk

Slik tegner du et boksplott med et hakk:

  • Ved hjelp av Notch kan vi finne ut hvordan medianene til ulike datagrupper samsvarer med hverandre.

R




# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )>

Produksjon:

Boksplott i RGeeksforgeeks

Box Tomt i R

col: Bruker en vektor av farger (mine_farger) for å endre fyllfargen til boksene.
grenser: Setter fargen på bokskantene til svart.
hakk: For å illustrere konfidensintervaller er det lagt til et hakk i boksene.
hakkbredde: Administrerer hakkenes bredde.
medcol: Gjør medianlinjens farge hvit.
whiskcol: Setter værhårens farge til svart med whiskcol-kommandoen.
boxwex: Endrer boksenes bredde.
outpch : Setter uteliggeres former til solide sirkler.
outcol: Endrer fargen til uteliggere til svart.

Multiple Boxplot

Her lager vi flere boxplot. De individuelle dataene som det kreves en boxplot-representasjon for, er basert på funksjonen.

R




# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))>

Produksjon:

Flere boksplott i RGeeksforgeeks

Flere boksplotter i R

  • I denne koden begynner vi med å liste variablene i variabelvektoren som vi ønsker å lage boksplott for. Jeg har lagt til mpg, disp, hp og wt i dette eksemplet, men du kan endre denne listen for å passe dine behov.
  • Kartoppsettet lages deretter ved å bruke par-funksjonen og syntaksen mfrow = c(1, lengde(variabler)), som genererer et rutenett med én rad og like mange kolonner som det er variabler i variabelvektoren.
  • Vi bruker boxplot-funksjonen inne i loopen for å generere et boxplott for hver variabel. Get(var)-funksjonen trekker dynamisk de samsvarende kolonneverdiene fra datasettet. Ved å bruke de gitte innstillingene endrer vi hvert boksplotts utseende.