Jak sortować ramkę danych Pand?

Jak sortować ramkę danych Pand?

Sortowanie możemy wykonać w Pandas Dataframe. W tym artykule omówiono sposób sortowania ramki danych Pandas przy użyciu różnych metod Pyton .

Sortowanie ramek danych w Pandach

Tworząc Ramka danych Pandy na potrzeby demonstracji, tutaj stworzyliśmy ramkę danych, w której będziemy wykonywać różne funkcje sortowania.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list> => [[> 'Afghanistan'> ,> 1952> ,> 8425333> ,> 'Asia'> ],> > [> 'Australia'> ,> 1957> ,> 9712569> ,> 'Oceania'> ],> > [> 'Brazil'> ,> 1962> ,> 76039390> ,> 'Americas'> ],> > [> 'China'> ,> 1957> ,> 637408000> ,> 'Asia'> ],> > [> 'France'> ,> 1957> ,> 44310863> ,> 'Europe'> ],> > [> 'India'> ,> 1952> ,> 3.72e> +> 08> ,> 'Asia'> ],> > [> 'United States'> ,> 1957> ,> 171984000> ,> 'Americas'> ]]> # creating a pandas dataframe> df> => pd.DataFrame(age_list, columns> => [> 'Country'> ,> 'Year'> ,> > 'Population'> ,> 'Continent'> ])> df>

Wyjście

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramki danych Pandy

Aby posortować ramkę danych w pandach, należy użyć funkcji sort_values() Jest używane. Pandy sort_values() może posortować ramkę danych w kolejności rosnącej lub malejącej.

Sortowanie ramek danych Pandy w kolejności rosnącej

Fragment kodu sortuje ramkę DataFrame df w kolejności rosnącej na podstawie kolumny „Kraj”. Jednak nie przechowuje ani nie wyświetla posortowanej ramki danych.

Python3




# Sorting by column 'Country'> df.sort_values(by> => [> 'Country'> ])>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramki danych Pandas w kolejności malejącej

DataFrame df zostanie posortowana w kolejności malejącej na podstawie kolumny Populacja, przy czym kraj o największej populacji pojawi się na górze ramki DataFrame.

Python3




# Sorting by column 'Population'> df.sort_values(by> => [> 'Population'> ], ascending> => False> )>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortuj ramki danych Pandy na podstawie próbkowania

Tutaj sortujemy ramkę danych ( df> ) na podstawie kolumny „Populacja”, układając wiersze z brakującymi wartościami w „Populacja”, tak aby pojawiały się jako pierwsze. The sort_values()> metoda z na_position='first'> argument pozwala to osiągnąć, nadając priorytet wierszom z brakującymi wartościami na początku posortowanej ramki danych.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by> => [> 'Population'> ], na_position> => 'first'> )>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramek danych według wielu kolumn

W tym przykładzie sortujemy ramkę danych ( df> ) przede wszystkim w kolumnie „Kraj” w porządku rosnącym oraz, w ramach każdej grupy krajów, w kolumnie „Kontynent”. Wynikowa ramka DataFrame jest sortowana w oparciu o określoną kolejność kolumn, tworząc posortowany zestaw danych.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ])>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand

Sortowanie ramek danych według kolumn, ale w innej kolejności

W tym przykładzie sortujemy ramkę danych ( df> ) najpierw w kolumnie „Kraj” w porządku malejącym, a w ramach każdej grupy krajów w kolumnie „Kontynent” w porządku rosnącym. Wynikowa ramka DataFrame jest zorganizowana w oparciu o określone kryteria sortowania kolumn.

Python3




# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by> => [> 'Country'> ,> 'Continent'> ],> > ascending> => [> False> ,> True> ])>

Wyjście:

Sortuj ramkę danych Pand

Sortuj ramkę danych Pand