Funkcja pandas.concat() w Pythonie
Funkcja pandas.concat() wykonuje wszystkie zadania związane z wykonywaniem operacji łączenia wraz z osią Obiekty pandy podczas wykonywania opcjonalnej logiki zbioru (zsumowania lub przecięcia) indeksów (jeśli występują) na pozostałych osiach.
Funkcja pandy concat() Składnia
Składnia: concat(obiekty, oś, łączenie, ignorowanie_indeksu, klucze, poziomy, nazwy, weryfikacja_integralności, sortowanie, kopiowanie)
Parametry:
- obs: Obiekty serii lub DataFrame
- oś: oś do łączenia wzdłuż; wartość domyślna = 0
- dołączyć: sposób do obsługi indeksów na innej osi; domyślnie = „zewnętrzny”
- ignorować_indeks: jeśli True, nie używaj wartości indeksów wzdłuż osi konkatenacji; wartość domyślna = Fałsz
- Klucze: sekwencja dodania identyfikatora do indeksów wyników; domyślnie = Brak
- poziomy: określone poziomy (unikalne wartości) do wykorzystania przy konstruowaniu MultiIndexu; domyślnie = Brak
- nazwy: nazwy poziomów w wynikowym indeksie hierarchicznym; domyślnie = Brak
- zweryfikować_integralność: sprawdź, czy nowa połączona oś zawiera duplikaty; wartość domyślna = Fałsz
- sortować: sortuj oś niebędącą konkatenacją, jeśli nie jest już wyrównana, gdy złącze jest „zewnętrzne”; wartość domyślna = Fałsz
- Kopiuj: jeśli Fałsz, nie kopiuj niepotrzebnie danych; domyślnie = Prawda
Zwroty: typ obiektów (Seria DataFrame)
Połącz za pomocą Pand z przykładami
Przykład 1: Łączenie ramek danych w Pythonie
W tym przykładzie łączymy dwie serie z domyślnymi parametrami Pandy .
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2]))> |
Wyjście
Przykład 2: Pandy łączące dwie ramki danych w poziomie z indeksem = 1
W tym przykładzie tworzymy dwie serie Pand ( series1> I series2> ), a następnie łączy je wzdłuż kolumn (oś=1) za pomocą pd.concat()> . Wynikowa ramka DataFrame zawiera obie serie jako kolumny, tworząc nową ramkę DataFrame z dwiema kolumnami.
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2],> > axis> => 1> ))> |
Wyjście
Przykład 3: Łączenie 2 ramek danych i przypisywanie kluczy
tworzy dwie ramki danych ( df1> I df2> ) i łączy je wraz z kluczami przypisanymi do każdej ramki DataFrame pd.concat()> . Powstała ramka DataFrame ma hierarchiczny indeks z kluczami „klucz1” i „klucz2”, rozróżniając pochodzenie każdego zestawu danych.
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > keys> => [> 'key1'> ,> 'key2'> ]))> |
Wyjście
Przykład 4: Łączenie ramek danych w poziomie w Pandach z osią = 1
tworzy dwie ramki danych ( df1> I df2> ) i łączy je wzdłuż kolumn (oś=1) za pomocą pd.concat()> . Wynikowa ramka DataFrame łączy kolumny z obu df1> I df2> , układając je obok siebie .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'C'> : [> 'C0'> ,> 'C1'> ,> 'C2'> ,> 'C3'> ],> > 'D'> : [> 'D0'> ,> 'D1'> ,> 'D2'> ,> 'D3'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > axis> => 1> ))> |
Wyjście
Przykład 5: Łączenie 2 ramek danych z ignorowaniem_index = True
tworzy dwie ramki danych ( df1> I df2> ) z identycznymi kolumnami i łączy je w pionie za pomocą pd.concat()> z ignore_index=True> . Wynikowa ramka DataFrame ma ciągły indeks, ignorując oryginalne indeksy df1> I df2> .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > ignore_index> => True> ))> |
Wyjście
Przykład 6: Łączenie ramki danych z serią
tworzy ramkę danych ( df> ) i serię ( series> ), a następnie łączy je wzdłuż kolumn (oś=1) za pomocą pd.concat()> . Wynikowa ramka DataFrame łączy kolumny z df> i Serię, układając je obok siebie. Uwaga: w instrukcji display znajduje się literówka ( df1> zamiast df> ).
Python3
# importing the module> import> pandas as pd> # creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df:'> , df1)> # creating the Series> series> => pd.Series([> 1> ,> 2> ,> 3> ,> 4> ])> display(> 'series:'> , series)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df, series],> > axis> => 1> ))> |
Wyjście