Wykresy pudełkowe w języku R
Wykres pudełkowy to wykres służący do wyświetlania informacji w formie rozkładu poprzez rysowanie wykresów pudełkowych dla każdego z nich. Ten rozkład danych opiera się na pięciu zbiorach (minimum, pierwszy kwartyl, mediana, trzeci kwartyl i maksimum).
Wykresy pudełkowe w Język programowania R
Wykresy pudełkowe są tworzone w R przy użyciu metody wykres pudełkowy() funkcjonować.
Składnia: boxplot(x, dane, wycięcie, varwidth, nazwy, główne)
Parametry:
x: Ten parametr jest ustawiany jako wektor lub formuła. dane: Ten parametr ustawia ramkę danych. notch: Ten parametr jest etykietą osi poziomej. varwidth: Ten parametr jest wartością logiczną. Ustaw jako true, aby narysować szerokość ramki proporcjonalną do rozmiaru próbki. main: Ten parametr jest tytułem wykresu. nazwy: ten parametr to etykiety grup, które będą wyświetlane pod każdym wykresem pudełkowym.
Tworzenie zbioru danych
Aby zrozumieć, jak możemy utworzyć wykres pudełkowy:
- Używamy zbioru danych mtcars.
- Przyjrzyjmy się kolumnom mpg i cyl w mtcars.
R
input <- mtcars[,> c> (> 'mpg'> ,> 'cyl'> )]> print> (> head> (input))> |
Wyjście:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6
Tworzenie wykresu pudełkowego
Tworzenie wykresu pudełkowego.
- Weź parametry wymagane do wykonania wykresu pudełkowego.
- Teraz rysujemy wykres zależności pomiędzy mpg i cyl.
R
# Load the dataset> data> (mtcars)> # Create the box plot> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> ,> > xlab => 'Gear'> ,> > ylab => 'Displacement'> )> |
Wyjście:
Działka pudełkowa w R
Wykres pudełkowy z użyciem wycięcia
Aby narysować wykres skrzynkowy za pomocą wcięcia:
- Za pomocą Notcha możemy dowiedzieć się, jak mediany różnych grup danych pasują do siebie.
R
# Load the dataset> data> (mtcars)> # Set up plot colors> my_colors <-> c> (> '#FFA500'> ,> '#008000'> ,> '#1E90FF'> ,> '#FF1493'> )> # Create the box plot with customized aesthetics> boxplot> (disp ~ gear, data = mtcars,> > main => 'Displacement by Gear'> , xlab => 'Gear'> , ylab => 'Displacement'> ,> > col = my_colors, border => 'black'> , notch => TRUE> , notchwidth = 0.5,> > medcol => 'white'> , whiskcol => 'black'> , boxwex = 0.5, outpch = 19,> > outcol => 'black'> )> # Add a legend> legend> (> 'topright'> , legend => unique> (mtcars$gear),> > fill = my_colors, border => 'black'> , title => 'Gear'> )> |
Wyjście:
Działka pudełkowa w R
przełęcz: Używa wektora kolorów (my_colors), aby zmienić kolor wypełnienia pól.
granice: Ustawia kolor obramowania pudełka na czarny.
karb: Aby zilustrować przedziały ufności, do kwadratów dodano wycięcie.
szerokość wycięcia: Zarządza szerokością nacięć.
lek: Sprawia, że kolor linii środkowej jest biały.
whiskcol: Za pomocą polecenia whiskcol ustawia kolor wąsów na czarny.
pudełkowex: Modyfikuje szerokość pudełek.
outp : ustawia kształty wartości odstających na pełne koła.
wynik: Zmienia kolor wartości odstających na czarny.
Wiele wykresów pudełkowych
Tutaj tworzymy wiele wykresów pudełkowych. Poszczególne dane, dla których wymagana jest reprezentacja wykresu skrzynkowego, opierają się na funkcji.
R
# Load the dataset> data> (mtcars)> # Define the variables for the box plots> variables <-> c> (> 'mpg'> ,> 'disp'> ,> 'hp'> ,> 'wt'> )> # Set up the plotting layout> par> (mfrow => c> (1,> length> (variables)))> # Create the box plots> for> (var> in> variables) {> > boxplot> (> get> (var) ~ gear, data = mtcars,> > main => paste> (> 'Box Plot of'> , var),> > xlab => 'Gear'> ,> > ylab = var,> > col => 'skyblue'> ,> > border => 'black'> ,> > notch => TRUE> ,> > notchwidth = 0.5,> > medcol => 'white'> ,> > whiskcol => 'black'> ,> > boxwex = 0.5,> > outpch = 19,> > outcol => 'black'> )> }> # Reset the plotting layout> par> (mfrow => c> (1, 1))> |
Wyjście:
Wiele działek pudełkowych w R
- W tym kodzie zaczynamy od wylistowania zmiennych w wektorze zmiennych, dla których chcemy utworzyć wykresy pudełkowe. W tym przykładzie dodałem mpg, disp, hp i wt, ale możesz zmienić tę listę, aby dostosować ją do swoich potrzeb.
- Następnie tworzony jest układ wykresu przy użyciu funkcji par i składni mfrow = c(1, długość(zmienne)), która generuje siatkę z jednym wierszem i tyloma kolumnami, ile jest zmiennych w wektorze zmiennych.
- Używamy funkcji boxplot wewnątrz pętli, aby wygenerować wykres pudełkowy dla każdej zmiennej. Funkcja get(var) dynamicznie pobiera pasujące wartości kolumn ze zbioru danych. Korzystając z podanych ustawień zmieniamy wygląd każdego wykresu pudełkowego.