Boxplots i R-sprog

Boxplots i R-sprog

En boksegraf er et diagram, der bruges til at vise information i form af distribution ved at tegne boxplot for hver af dem. Denne fordeling af data er baseret på fem sæt (minimum, første kvartil, median, tredje kvartil og maksimum).

Boxplots i R Programmeringssprog

Boxplots oprettes i R ved at bruge boxplot() fungere.

Syntaks: boxplot(x, data, notch, varwidth, names, main)

Parametre:

    x: Denne parameter indstilles som en vektor eller en formel. data: Denne parameter indstiller datarammen. notch: Denne parameter er etiketten for vandret akse. varwidth: Denne parameter er en logisk værdi. Indstil som sand for at tegne boksens bredde i forhold til prøvestørrelsen. main: Denne parameter er titlen på diagrammet. navne: Denne parameter er gruppeetiketterne, der vil blive vist under hvert boxplot.

Oprettelse af et datasæt

For at forstå, hvordan vi kan oprette et boxplot:

  • Vi bruger datasættet mtcars.
  • Lad os se på kolonnerne mpg og cyl i mtcars.

R




input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))>

Produktion:

 mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6 

Oprettelse af Boxplot

Oprettelse af Boxplot-grafen.

  • Tag de parametre, der er nødvendige for at lave et boxplot.
  • Nu tegner vi en graf for sammenhængen mellem mpg og cyl.

R




# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )>

Produktion:

Box plot i RGeeksforgeeks

Box plot i R

Boxplot med hak

Sådan tegner du et boxplot ved hjælp af et hak:

  • Ved hjælp af Notch kan vi finde ud af, hvordan medianerne for forskellige datagrupper matcher hinanden.

R




# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )>

Produktion:

Box plot i RGeeksforgeeks

Box Plot i R

col: Bruger en vektor af farver (mine_farver) til at ændre fyldfarven på boksene.
grænser: Indstiller boksens kanter farve til sort.
hak: For at illustrere konfidensintervaller er der tilføjet et hak til boksene.
hakbredde: Styrer hakkenes bredde.
medcol: Gør medianlinjens farve hvid.
whiskcol: Indstiller knurhårens farve til sort med whiskcol-kommandoen.
boxwex: Ændrer boksenes bredde.
outpch : Indstiller outliers' former til solide cirkler.
outcol: Ændrer afvigernes farve til sort.

Multiple Boxplot

Her laver vi flere boxplots. De individuelle data, for hvilke der kræves en boxplot-repræsentation, er baseret på funktionen.

R




# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))>

Produktion:

Flere boksplotter i RGeeksforgeeks

Flere boksplotter i R

  • I denne kode begynder vi med at liste variablerne i den variable vektor, som vi ønsker at lave boksplot for. Jeg har tilføjet mpg, disp, hp og wt i dette eksempel, men du kan ændre denne liste, så den passer til dine behov.
  • Kortlayoutet oprettes derefter ved at bruge par-funktionen og syntaksen mfrow = c(1, length(variables)), som genererer et gitter med en række og lige så mange kolonner, som der er variable i variabelvektoren.
  • Vi bruger boxplot-funktionen inde i løkken til at generere et boxplot for hver variabel. Get(var)-funktionen trækker dynamisk de matchende kolonneværdier fra datasættet. Ved at bruge de givne indstillinger ændrer vi hvert boksplots udseende.