funkcia pandas.concat() v Pythone
Funkcia pandas.concat() robí všetku ťažkú prácu pri vykonávaní operácií zreťazenia spolu s osou Predmety pandy pri vykonávaní voliteľnej logiky množiny (zjednotenie alebo priesečník) indexov (ak existujú) na iných osiach.
Syntax funkcie Pandas concat().
Syntax: concat(objs, axis, join, ignore_index, keys, levels, names, over_integrity, sort, copy)
Parametre:
- obs: Séria alebo objekty DataFrame
- os: os zreťaziť pozdĺž; predvolená hodnota = 0
- pripojiť sa: spôsobom zvládnuť indexy na inej osi; predvolené = „vonkajšie“
- ignore_index: ak je pravda, nepoužívajte hodnoty indexu pozdĺž osi zreťazenia; predvolená hodnota = False
- kľúče: sekvencia na pridanie identifikátora k indexom výsledkov; predvolená hodnota = Žiadne
- úrovne: špecifické úrovne (jedinečné hodnoty), ktoré sa majú použiť na zostavenie MultiIndexu; predvolená hodnota = Žiadne
- mená: názvy úrovní vo výslednom hierarchickom indexe; predvolená hodnota = Žiadne
- over_integrity: skontrolujte, či nová zreťazená os obsahuje duplikáty; predvolená hodnota = False
- zoradiť: zoradiť nezreťazenú os, ak už nie je zarovnaná, keď je spojenie „vonkajšie“; predvolená hodnota = False
- kopírovať: ak je False, nekopírujte údaje zbytočne; predvolená hodnota = Pravda
Vrátenie: typ objs (Series of DataFrame)
Reťazenie pomocou Pandy s príkladmi
Príklad 1: Spojte dátové rámce v Pythone
V tomto príklade spájame dve série s predvolenými parametrami pandy .
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2]))> |
Výkon
Príklad 2: Pandy spájajúce dva dátové rámce horizontálne s indexom = 1
V tomto príklade vytvoríme dve série Pandy ( series1> a series2> ) a potom ich zreťazí pozdĺž stĺpcov (os=1) pomocou pd.concat()> . Výsledný DataFrame obsahuje oba Series ako stĺpce, čím vytvára nový DataFrame s dvoma stĺpcami.
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2],> > axis> => 1> ))> |
Výkon
Príklad 3: Reťazenie 2 dátových rámcov a priradenie kľúčov
vytvorí dva dátové rámce ( df1> a df2> ) a zreťazí ich spolu s kľúčmi priradenými ku každému použitému DataFrame pd.concat()> . Výsledný DataFrame má hierarchický index s kľúčmi „key1“ a „key2“, ktorý rozlišuje pôvod každého súboru údajov.
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > keys> => [> 'key1'> ,> 'key2'> ]))> |
Výkon
Príklad 4: Horizontálne zreťazenie dátových rámov v Pandách s osou = 1
vytvorí dva dátové rámce ( df1> a df2> ) a zreťazí ich pozdĺž stĺpcov (os=1) pomocou pd.concat()> . Výsledný DataFrame kombinuje stĺpce z oboch df1> a df2> , pričom ich zarovnáte vedľa seba .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'C'> : [> 'C0'> ,> 'C1'> ,> 'C2'> ,> 'C3'> ],> > 'D'> : [> 'D0'> ,> 'D1'> ,> 'D2'> ,> 'D3'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > axis> => 1> ))> |
Výkon
Príklad 5: Spojenie 2 dátových rámcov s ignore_index = True
vytvorí dva dátové rámce ( df1> a df2> ) s identickými stĺpcami a vertikálne ich zreťazí pomocou pd.concat()> s ignore_index=True> . Výsledný DataFrame má súvislý index, ignorujúci pôvodné indexy df1> a df2> .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > ignore_index> => True> ))> |
Výkon
Príklad 6: Reťazenie dátového rámca so sériou
vytvorí DataFrame ( df> ) a séria ( series> ), potom ich zreťazí pozdĺž stĺpcov (os = 1) pomocou pd.concat()> . Výsledný DataFrame kombinuje stĺpce z df> a Séria, pričom ich zarovnajte vedľa seba. Poznámka: Vo vyhlásení o zobrazení je preklep ( df1> namiesto df> ).
Python3
# importing the module> import> pandas as pd> # creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df:'> , df1)> # creating the Series> series> => pd.Series([> 1> ,> 2> ,> 3> ,> 4> ])> display(> 'series:'> , series)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df, series],> > axis> => 1> ))> |
Výkon