Hoe Panda's DataFrame sorteren?

Hoe Panda's DataFrame sorteren?

We kunnen sorteren in Pandas Dataframe. In dit artikel wordt besproken hoe u Pandas DataFrame op verschillende manieren kunt sorteren Python .

Gegevensframes in panda's sorteren

Het creëren van een Panda's-dataframe ter demonstratie hebben we hier een dataframe gemaakt waarin we verschillende sorteerfuncties zullen uitvoeren.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list> => [[> 'Afghanistan'> ,> 1952> ,> 8425333> ,> 'Asia'> ],> > [> 'Australia'> ,> 1957> ,> 9712569> ,> 'Oceania'> ],> > [> 'Brazil'> ,> 1962> ,> 76039390> ,> 'Americas'> ],> > [> 'China'> ,> 1957> ,> 637408000> ,> 'Asia'> ],> > [> 'France'> ,> 1957> ,> 44310863> ,> 'Europe'> ],> > [> 'India'> ,> 1952> ,> 3.72e> +> 08> ,> 'Asia'> ],> > [> 'United States'> ,> 1957> ,> 171984000> ,> 'Americas'> ]]> # creating a pandas dataframe> df> => pd.DataFrame(age_list, columns> => [> 'Country'> ,> 'Year'> ,> > 'Population'> ,> 'Continent'> ])> df>

Uitvoer

Sorteer Panda

Sorteer Panda's DataFrame

Gegevensframe voor panda's sorteren

Om het dataframe in panda's te sorteren, moet de function sort_values() is gebruikt. Panda's sort_values() kan het dataframe in oplopende of aflopende volgorde sorteren.

Panda's DataFrame sorteren in oplopende volgorde

Het codefragment sorteert de DataFrame df in oplopende volgorde op basis van de kolom ‘Land’. Het gesorteerde gegevensframe wordt echter niet opgeslagen of weergegeven.

Python3




# Sorting by column 'Country'> df.sort_values(by> => [> 'Country'> ])>

Uitgang:

Sorteer Panda

Sorteer Panda's DataFrame

Het Pandas DataFrame in aflopende volgorde sorteren

Het DataFrame df wordt in aflopende volgorde gesorteerd op basis van de kolom Bevolking, waarbij het land met de hoogste bevolking bovenaan het DataFrame verschijnt.

Python3




# Sorting by column 'Population'> df.sort_values(by> => [> 'Population'> ], ascending> => False> )>

Uitgang:

Sorteer Panda

Sorteer Panda's DataFrame

Sorteer Panda's DataFrame op basis van bemonstering

Hier sorteren we een DataFrame ( df> ) op basis van de kolom ‘Populatie’, waarbij rijen met ontbrekende waarden in ‘Populatie’ als eerste worden weergegeven. De sort_values()> methode met de na_position='first'> argument bereikt dit, waarbij prioriteit wordt gegeven aan rijen met ontbrekende waarden aan het begin van het gesorteerde DataFrame.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by> => [> 'Population'> ], na_position> => 'first'> )>

Uitgang:

Sorteer Panda

Sorteer Panda's DataFrame

Gegevensframes sorteren op meerdere kolommen

In dit voorbeeld sorteren we een DataFrame ( df> ) voornamelijk in de kolom ‘Land’ in oplopende volgorde en, binnen elke landengroep, in de kolom ‘Continent’. Het resulterende DataFrame wordt gesorteerd op basis van de opgegeven kolomvolgorde, waardoor een gesorteerde gegevensset ontstaat.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ])>

Uitgang:

Sorteer Panda

Sorteer Panda's DataFrame

Gegevensframes sorteren op kolommen, maar in een andere volgorde

In dit voorbeeld sorteren we een DataFrame ( df> ) eerst door de kolom ‘Land’ in aflopende volgorde en, binnen elke landengroep, door de kolom ‘Continent’ in oplopende volgorde. Het resulterende DataFrame wordt georganiseerd op basis van de opgegeven kolomsorteringscriteria.

Python3




# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ],> > ascending> => [> False> ,> True> ])>

Uitgang:

Sorteer Panda

Sorteer Panda's DataFrame