pandas.concat() v Pythonu
Funkcija pandas.concat() opravi vse težke naloge izvajanja operacij veriženja skupaj z osjo Panda predmeti med izvajanjem izbirne nastavljene logike (unija ali presek) indeksov (če obstajajo) na drugih oseh.
Sintaksa funkcije Panda concat().
Sintaksa: concat(objs, os, pridružitev, ignore_index, ključi, ravni, imena, verify_integrity, sort, copy)
Parametri:
- obs: Serije ali predmeti DataFrame
- os: os za združevanje; privzeto = 0
- pridruži se: način za obdelavo indeksov na drugi osi; privzeto = 'zunanji'
- ignore_index: če je True, ne uporabljajte vrednosti indeksa vzdolž verižne osi; privzeto = False
- ključi: zaporedje za dodajanje identifikatorja indeksom rezultatov; privzeto = Brez
- stopnje: posebne ravni (edinstvene vrednosti) za uporabo pri izdelavi MultiIndexa; privzeto = Brez
- imena: imena za ravni v dobljenem hierarhičnem indeksu; privzeto = Brez
- verify_integrity: preverite, ali nova verižna os vsebuje dvojnike; privzeto = False
- razvrsti: razvrsti os brez veriženja, če še ni poravnana, ko je združevanje 'zunanje'; privzeto = False
- kopirati: če je False, ne kopirajte podatkov po nepotrebnem; privzeto = True
Vrne: vrsta objs (serija DataFrame)
Združite uporabo pand s primeri
Primer 1: Povežite DataFrames v Pythonu
V tem primeru združujemo dve seriji s privzetimi parametri Pande .
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2]))> |
Izhod
Primer 2: Pande, ki vodoravno združujejo dva podatkovna okvira z indeksom = 1
V tem primeru ustvarimo dve seriji Pandas ( series1> in series2> ), nato pa jih poveže vzdolž stolpcev (os=1) z uporabo pd.concat()> . Nastali DataFrame vsebuje obe seriji kot stolpca, kar ustvarja nov DataFrame z dvema stolpcema.
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2],> > axis> => 1> ))> |
Izhod
Primer 3: Združevanje 2 DataFrames in dodeljevanje ključev
ustvari dva podatkovna okvira ( df1> in df2> ) in jih združi skupaj s ključi, dodeljenimi vsakemu DataFrame z uporabo pd.concat()> . Nastali DataFrame ima hierarhični indeks s ključema 'key1' in 'key2', ki razlikujeta izvor vsakega niza podatkov.
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > keys> => [> 'key1'> ,> 'key2'> ]))> |
Izhod
Primer 4: Vodoravno združevanje DataFrames v Pandas z osjo = 1
ustvari dva podatkovna okvira ( df1> in df2> ) in jih poveže vzdolž stolpcev (os=1) z uporabo pd.concat()> . Nastali DataFrame združuje stolpce iz obeh df1> in df2> in jih poravnajte drug ob drugem .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'C'> : [> 'C0'> ,> 'C1'> ,> 'C2'> ,> 'C3'> ],> > 'D'> : [> 'D0'> ,> 'D1'> ,> 'D2'> ,> 'D3'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > axis> => 1> ))> |
Izhod
Primer 5: Združevanje 2 DataFrames z ignore_index = True
ustvari dva podatkovna okvira ( df1> in df2> ) z enakimi stolpci in jih združi navpično z uporabo pd.concat()> z ignore_index=True> . Nastali DataFrame ima neprekinjen indeks, pri čemer se ne upoštevajo izvirni indeksi df1> in df2> .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > ignore_index> => True> ))> |
Izhod
Primer 6: Združevanje DataFrame s serijo
ustvari DataFrame ( df> ) in serija ( series> ), nato jih poveže vzdolž stolpcev (os=1) z uporabo pd.concat()> . Nastali DataFrame združuje stolpce iz df> in serije, tako da ju poravnate drug ob drugem. Opomba: v izjavi o prikazu je tipkarska napaka ( df1> namesto df> ).
Python3
# importing the module> import> pandas as pd> # creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df:'> , df1)> # creating the Series> series> => pd.Series([> 1> ,> 2> ,> 3> ,> 4> ])> display(> 'series:'> , series)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df, series],> > axis> => 1> ))> |
Izhod