FUNKCIA PANDAS.CONCAT() V PYTHONE

Funkcia pandas.concat() robí všetku ťažkú prácu pri vykonávaní operácií zreťazenia spolu s osou Predmety pandy pri vykonávaní voliteľnej logiky množiny (zjednotenie alebo priesečník) indexov (ak existujú) na iných osiach.

Syntax funkcie Pandas concat().

Syntax: concat(objs, axis, join, ignore_index, keys, levels, names, over_integrity, sort, copy)

Parametre:

obs: Séria alebo objekty DataFrame

os: os zreťaziť pozdĺž; predvolená hodnota = 0

pripojiť sa: spôsobom zvládnuť indexy na inej osi; predvolené = „vonkajšie“

ignore_index: ak je pravda, nepoužívajte hodnoty indexu pozdĺž osi zreťazenia; predvolená hodnota = False

kľúče: sekvencia na pridanie identifikátora k indexom výsledkov; predvolená hodnota = Žiadne

úrovne: špecifické úrovne (jedinečné hodnoty), ktoré sa majú použiť na zostavenie MultiIndexu; predvolená hodnota = Žiadne

mená: názvy úrovní vo výslednom hierarchickom indexe; predvolená hodnota = Žiadne

over_integrity: skontrolujte, či nová zreťazená os obsahuje duplikáty; predvolená hodnota = False

zoradiť: zoradiť nezreťazenú os, ak už nie je zarovnaná, keď je spojenie „vonkajšie“; predvolená hodnota = False

kopírovať: ak je False, nekopírujte údaje zbytočne; predvolená hodnota = Pravda

Vrátenie: typ objs (Series of DataFrame)

Reťazenie pomocou Pandy s príkladmi

Príklad 1: Spojte dátové rámce v Pythone

V tomto príklade spájame dve série s predvolenými parametrami pandy .

Python3

# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2]))>

Výkon

Príklad 2: Pandy spájajúce dva dátové rámce horizontálne s indexom = 1

V tomto príklade vytvoríme dve série Pandy ( series1> a series2> ) a potom ich zreťazí pozdĺž stĺpcov (os=1) pomocou pd.concat()> . Výsledný DataFrame obsahuje oba Series ako stĺpce, čím vytvára nový DataFrame s dvoma stĺpcami.

Python3

Výkon

Príklad 3: Reťazenie 2 dátových rámcov a priradenie kľúčov

vytvorí dva dátové rámce ( df1> a df2> ) a zreťazí ich spolu s kľúčmi priradenými ku každému použitému DataFrame pd.concat()> . Výsledný DataFrame má hierarchický index s kľúčmi „key1“ a „key2“, ktorý rozlišuje pôvod každého súboru údajov.

Python3

# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > keys> => [> 'key1'> ,> 'key2'> ]))>

Výkon

Príklad 4: Horizontálne zreťazenie dátových rámov v Pandách s osou = 1

vytvorí dva dátové rámce ( df1> a df2> ) a zreťazí ich pozdĺž stĺpcov (os=1) pomocou pd.concat()> . Výsledný DataFrame kombinuje stĺpce z oboch df1> a df2> , pričom ich zarovnáte vedľa seba .

Python3

# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'C'> : [> 'C0'> ,> 'C1'> ,> 'C2'> ,> 'C3'> ],> > 'D'> : [> 'D0'> ,> 'D1'> ,> 'D2'> ,> 'D3'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > axis> => 1> ))>

Výkon

Príklad 5: Spojenie 2 dátových rámcov s ignore_index = True

vytvorí dva dátové rámce ( df1> a df2> ) s identickými stĺpcami a vertikálne ich zreťazí pomocou pd.concat()> s ignore_index=True> . Výsledný DataFrame má súvislý index, ignorujúci pôvodné indexy df1> a df2> .

Python3

Výkon

Príklad 6: Reťazenie dátového rámca so sériou

vytvorí DataFrame ( df> ) a séria ( series> ), potom ich zreťazí pozdĺž stĺpcov (os = 1) pomocou pd.concat()> . Výsledný DataFrame kombinuje stĺpce z df> a Séria, pričom ich zarovnajte vedľa seba. Poznámka: Vo vyhlásení o zobrazení je preklep ( df1> namiesto df> ).

Python3

# importing the module> import> pandas as pd> # creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df:'> , df1)> # creating the Series> series> => pd.Series([> 1> ,> 2> ,> 3> ,> 4> ])> display(> 'series:'> , series)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df, series],> > axis> => 1> ))>

Výkon