Hvordan sortere Pandas DataFrame?

Hvordan sortere Pandas DataFrame?

Vi kan utføre sortering i Pandas Dataframe. Denne artikkelen vil diskutere hvordan du sorterer Pandas DataFrame ved hjelp av ulike metoder i Python .

Sortering av datarammer i pandaer

Opprette en Pandas dataramme for demonstrasjon, Her har vi laget en dataramme der vi skal utføre ulike sorteringsfunksjoner.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list> => [[> 'Afghanistan'> ,> 1952> ,> 8425333> ,> 'Asia'> ],> > [> 'Australia'> ,> 1957> ,> 9712569> ,> 'Oceania'> ],> > [> 'Brazil'> ,> 1962> ,> 76039390> ,> 'Americas'> ],> > [> 'China'> ,> 1957> ,> 637408000> ,> 'Asia'> ],> > [> 'France'> ,> 1957> ,> 44310863> ,> 'Europe'> ],> > [> 'India'> ,> 1952> ,> 3.72e> +> 08> ,> 'Asia'> ],> > [> 'United States'> ,> 1957> ,> 171984000> ,> 'Americas'> ]]> # creating a pandas dataframe> df> => pd.DataFrame(age_list, columns> => [> 'Country'> ,> 'Year'> ,> > 'Population'> ,> 'Continent'> ])> df>

Produksjon

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering av Pandas dataramme

For å sortere datarammen i pandaer, funksjonen sort_verdier() benyttes. Pandaer sort_values() kan sortere datarammen i stigende eller synkende rekkefølge.

Pandas DataFrame-sortering i stigende rekkefølge

Kodebiten sorterer DataFrame df i stigende rekkefølge basert på 'Country'-kolonnen. Den lagrer eller viser imidlertid ikke den sorterte datarammen.

Python3




# Sorting by column 'Country'> df.sort_values(by> => [> 'Country'> ])>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering av Pandas DataFrame i synkende rekkefølge

DataFrame df vil bli sortert i synkende rekkefølge basert på Populasjon-kolonnen, med landet som har den høyeste befolkningen vises øverst i DataFrame.

Python3




# Sorting by column 'Population'> df.sort_values(by> => [> 'Population'> ], ascending> => False> )>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sorter Pandas DataFrame Basert på Sampling

Her sorterer vi en DataFrame ( df> ) basert på «Population»-kolonnen, og ordne rader med manglende verdier i «Population» for å vises først. De sort_values()> metode med na_position='first'> argument oppnår dette, og prioriterer rader med manglende verdier i begynnelsen av den sorterte DataFrame.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by> => [> 'Population'> ], na_position> => 'first'> )>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering av datarammer etter flere kolonner

I dette eksemplet sorterer vi en DataFrame ( df> ) primært etter «Land»-kolonnen i stigende rekkefølge og, innenfor hver landgruppe, etter «Kontinent»-kolonnen. Den resulterende DataFrame sorteres basert på den angitte kolonnerekkefølgen, og skaper et sortert datasett.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ])>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering av datarammer etter kolonner, men i en annen rekkefølge

I dette eksemplet sorterer vi en DataFrame ( df> ) først ved «Land»-kolonnen i synkende rekkefølge og, innenfor hver landgruppe, etter «Kontinent»-kolonnen i stigende rekkefølge. Den resulterende DataFrame er organisert basert på de angitte kolonnesorteringskriteriene.

Python3




# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ],> > ascending> => [> False> ,> True> ])>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame