Hvordan sortere Pandas DataFrame?
Vi kan utføre sortering i Pandas Dataframe. Denne artikkelen vil diskutere hvordan du sorterer Pandas DataFrame ved hjelp av ulike metoder i Python .
Sortering av datarammer i pandaer
Opprette en Pandas dataramme for demonstrasjon, Her har vi laget en dataramme der vi skal utføre ulike sorteringsfunksjoner.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list> => [[> 'Afghanistan'> ,> 1952> ,> 8425333> ,> 'Asia'> ],> > [> 'Australia'> ,> 1957> ,> 9712569> ,> 'Oceania'> ],> > [> 'Brazil'> ,> 1962> ,> 76039390> ,> 'Americas'> ],> > [> 'China'> ,> 1957> ,> 637408000> ,> 'Asia'> ],> > [> 'France'> ,> 1957> ,> 44310863> ,> 'Europe'> ],> > [> 'India'> ,> 1952> ,> 3.72e> +> 08> ,> 'Asia'> ],> > [> 'United States'> ,> 1957> ,> 171984000> ,> 'Americas'> ]]> # creating a pandas dataframe> df> => pd.DataFrame(age_list, columns> => [> 'Country'> ,> 'Year'> ,> > 'Population'> ,> 'Continent'> ])> df> |
Produksjon
Sorter Pandas DataFrame
Sortering av Pandas dataramme
For å sortere datarammen i pandaer, funksjonen sort_verdier() benyttes. Pandaer sort_values() kan sortere datarammen i stigende eller synkende rekkefølge.
Pandas DataFrame-sortering i stigende rekkefølge
Kodebiten sorterer DataFrame df i stigende rekkefølge basert på 'Country'-kolonnen. Den lagrer eller viser imidlertid ikke den sorterte datarammen.
Python3
# Sorting by column 'Country'> df.sort_values(by> => [> 'Country'> ])> |
Produksjon:
Sorter Pandas DataFrame
Sortering av Pandas DataFrame i synkende rekkefølge
DataFrame df vil bli sortert i synkende rekkefølge basert på Populasjon-kolonnen, med landet som har den høyeste befolkningen vises øverst i DataFrame.
Python3
# Sorting by column 'Population'> df.sort_values(by> => [> 'Population'> ], ascending> => False> )> |
Produksjon:
Sorter Pandas DataFrame
Sorter Pandas DataFrame Basert på Sampling
Her sorterer vi en DataFrame ( df> ) basert på «Population»-kolonnen, og ordne rader med manglende verdier i «Population» for å vises først. De sort_values()> metode med na_position='first'> argument oppnår dette, og prioriterer rader med manglende verdier i begynnelsen av den sorterte DataFrame.
Python3
# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by> => [> 'Population'> ], na_position> => 'first'> )> |
Produksjon:
Sorter Pandas DataFrame
Sortering av datarammer etter flere kolonner
I dette eksemplet sorterer vi en DataFrame ( df> ) primært etter «Land»-kolonnen i stigende rekkefølge og, innenfor hver landgruppe, etter «Kontinent»-kolonnen. Den resulterende DataFrame sorteres basert på den angitte kolonnerekkefølgen, og skaper et sortert datasett.
Python3
# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ])> |
Produksjon:
Sorter Pandas DataFrame
Sortering av datarammer etter kolonner, men i en annen rekkefølge
I dette eksemplet sorterer vi en DataFrame ( df> ) først ved «Land»-kolonnen i synkende rekkefølge og, innenfor hver landgruppe, etter «Kontinent»-kolonnen i stigende rekkefølge. Den resulterende DataFrame er organisert basert på de angitte kolonnesorteringskriteriene.
Python3
# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ],> > ascending> => [> False> ,> True> ])> |
Produksjon:
Sorter Pandas DataFrame