Hvordan sorterer man Pandas DataFrame?

Hvordan sorterer man Pandas DataFrame?

Vi kan udføre sortering i Pandas Dataframe. Denne artikel vil diskutere, hvordan man sorterer Pandas DataFrame ved hjælp af forskellige metoder i Python .

Sortering af datarammer i pandaer

Oprettelse af en Pandas dataramme til demonstration, Her har vi lavet en dataramme, hvori vi vil udføre forskellige sorteringsfunktioner.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list> => [[> 'Afghanistan'> ,> 1952> ,> 8425333> ,> 'Asia'> ],> > [> 'Australia'> ,> 1957> ,> 9712569> ,> 'Oceania'> ],> > [> 'Brazil'> ,> 1962> ,> 76039390> ,> 'Americas'> ],> > [> 'China'> ,> 1957> ,> 637408000> ,> 'Asia'> ],> > [> 'France'> ,> 1957> ,> 44310863> ,> 'Europe'> ],> > [> 'India'> ,> 1952> ,> 3.72e> +> 08> ,> 'Asia'> ],> > [> 'United States'> ,> 1957> ,> 171984000> ,> 'Americas'> ]]> # creating a pandas dataframe> df> => pd.DataFrame(age_list, columns> => [> 'Country'> ,> 'Year'> ,> > 'Population'> ,> 'Continent'> ])> df>

Produktion

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering af Pandas dataramme

For at sortere datarammen i pandaer skal funktionen sort_værdier() anvendes. Pandaer sort_values() kan sortere datarammen i stigende eller faldende rækkefølge.

Pandas DataFrame-sortering i stigende rækkefølge

Kodestykket sorterer DataFrame df i stigende rækkefølge baseret på kolonnen 'Land'. Den gemmer eller viser dog ikke den sorterede dataramme.

Python3




# Sorting by column 'Country'> df.sort_values(by> => [> 'Country'> ])>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering af Pandas DataFrame i faldende rækkefølge

DataFrame df vil blive sorteret i faldende rækkefølge baseret på kolonnen Population, hvor det land, der har den højeste befolkning, vises øverst i DataFrame.

Python3




# Sorting by column 'Population'> df.sort_values(by> => [> 'Population'> ], ascending> => False> )>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sorter Pandas DataFrame Baseret på Sampling

Her sorterer vi en DataFrame ( df> ) baseret på 'Population'-kolonnen, og arrangere rækker med manglende værdier i 'Population' for at blive vist først. Det sort_values()> metode med na_position='first'> argument opnår dette ved at prioritere rækker med manglende værdier i begyndelsen af ​​den sorterede DataFrame.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by> => [> 'Population'> ], na_position> => 'first'> )>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering af datarammer efter flere kolonner

I dette eksempel sorterer vi en DataFrame ( df> ) primært efter kolonnen 'Land' i stigende rækkefølge og inden for hver landegruppe efter kolonnen 'Kontinent'. Den resulterende DataFrame sorteres baseret på den angivne kolonnerækkefølge, hvilket skaber et sorteret datasæt.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ])>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering af datarammer efter kolonner, men i en anden rækkefølge

I dette eksempel sorterer vi en DataFrame ( df> ) først efter kolonnen 'Land' i faldende rækkefølge og inden for hver landegruppe efter kolonnen 'Kontinent' i stigende rækkefølge. Den resulterende DataFrame er organiseret baseret på de angivne kolonnesorteringskriterier.

Python3




# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ],> > ascending> => [> False> ,> True> ])>

Produktion:

Sorter Pandas DataFrame

Sorter Pandas DataFrame