funkcija pandas.concat() Python
Funkcija pandas.concat() veic visus smagus uzdevumus, veicot savienošanas darbības kopā ar asi Pandas objekti veicot izvēles kopas loģiku (savienojumu vai krustojumu) indeksiem (ja tādi ir) uz citām asīm.
Pandas concat() funkcija Sintakse
Sintakse: concat(objs, ass, pievienošanās, ignore_index, atslēgas, līmeņi, nosaukumi, verify_integrity, kārtot, kopēt)
Parametri:
- obs: Sērijas vai DataFrame objekti
- ass: ass savienošanai gar; noklusējuma = 0
- pievienoties: veidā apstrādāt indeksus uz citas ass; noklusējuma = 'ārējais'
- ignore_index: ja True, neizmantojiet indeksa vērtības gar konkatenācijas asi; noklusējuma = False
- atslēgas: secība, lai rezultātu indeksiem pievienotu identifikatoru; noklusējuma = nav
- līmeņi: īpaši līmeņi (unikālās vērtības), ko izmantot MultiIndex konstruēšanai; noklusējuma = nav
- vārdi: iegūtā hierarhiskā indeksa līmeņu nosaukumi; noklusējuma = nav
- verify_integrity: pārbaudiet, vai jaunajā savienotajā asī nav dublikātu; noklusējuma = False
- kārtot: kārtot nesavienojuma asi, ja tā jau nav izlīdzināta, kad savienošana ir “ārēja”; noklusējuma = False
- kopija: ja ir False, nekopējiet datus bez vajadzības; noklusējuma = True
Atgriež: objs veids (DataFrame sērija)
Savienojiet, izmantojot pandas ar piemēriem
1. piemērs: Savienojiet datu rāmjus programmā Python
Šajā piemērā mēs savienojam divas sērijas ar noklusējuma parametriem Pandas .
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2]))> |
Izvade
2. piemērs: Pandas, kas horizontāli apvieno divus datu kadrus ar indeksu = 1
Šajā piemērā mēs izveidojam divas Pandas sērijas ( series1> un series2> ), un pēc tam savieno tos pa kolonnām (ass = 1), izmantojot pd.concat()> . Iegūtais DataFrame satur abas sērijas kā kolonnas, izveidojot jaunu DataFrame ar divām kolonnām.
Python3
# importing the module> import> pandas as pd> # creating the Series> series1> => pd.Series([> 1> ,> 2> ,> 3> ])> display(> 'series1:'> , series1)> series2> => pd.Series([> 'A'> ,> 'B'> ,> 'C'> ])> display(> 'series2:'> , series2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([series1, series2],> > axis> => 1> ))> |
Izvade
3. piemērs: 2 datu rāmju savienošana un atslēgu piešķiršana
izveido divus DataFrame ( df1> un df2> ), un savieno tos kopā ar taustiņiem, kas piešķirti katram DataFrame, izmantojot pd.concat()> . Iegūtajam DataFrame ir hierarhisks indekss ar atslēgām “key1” un “key2”, kas atšķir katras datu kopas izcelsmi.
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > keys> => [> 'key1'> ,> 'key2'> ]))> |
Izvade
4. piemērs: Datu rāmju savienošana horizontāli pandās ar asi = 1
izveido divus DataFrame ( df1> un df2> ), un savieno tos pa kolonnām (ass = 1), izmantojot pd.concat()> . Iegūtais DataFrame apvieno kolonnas no abām df1> un df2> , izlīdzinot tos blakus .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'C'> : [> 'C0'> ,> 'C1'> ,> 'C2'> ,> 'C3'> ],> > 'D'> : [> 'D0'> ,> 'D1'> ,> 'D2'> ,> 'D3'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > axis> => 1> ))> |
Izvade
5. piemērs: 2 DataFrames savienošana ar ignore_index = True
izveido divus DataFrame ( df1> un df2> ) ar identiskām kolonnām un savieno tās vertikāli, izmantojot pd.concat()> ar ignore_index=True> . Iegūtajam DataFrame ir nepārtraukts indekss, ignorējot sākotnējos indeksus df1> un df2> .
Python3
# importing the module> import> pandas as pd> # creating the DataFrames> df1> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df1:'> , df1)> df2> => pd.DataFrame({> 'A'> : [> 'A4'> ,> 'A5'> ,> 'A6'> ,> 'A7'> ],> > 'B'> : [> 'B4'> ,> 'B5'> ,> 'B6'> ,> 'B7'> ]})> display(> 'df2:'> , df2)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df1, df2],> > ignore_index> => True> ))> |
Izvade
6. piemērs: DataFrame savienošana ar sēriju
izveido DataFrame ( df> ) un sēriju ( series> ), pēc tam savieno tos pa kolonnām (ass = 1), izmantojot pd.concat()> . Iegūtais DataFrame apvieno kolonnas no df> un sēriju, izlīdzinot tās blakus. Piezīme. Displeja paziņojumā ir drukas kļūda ( df1> tā vietā df> ).
Python3
# importing the module> import> pandas as pd> # creating the DataFrame> df> => pd.DataFrame({> 'A'> : [> 'A0'> ,> 'A1'> ,> 'A2'> ,> 'A3'> ],> > 'B'> : [> 'B0'> ,> 'B1'> ,> 'B2'> ,> 'B3'> ]})> display(> 'df:'> , df1)> # creating the Series> series> => pd.Series([> 1> ,> 2> ,> 3> ,> 4> ])> display(> 'series:'> , series)> # concatenating> display(> 'After concatenating:'> )> display(pd.concat([df, series],> > axis> => 1> ))> |
Izvade