TAPOJA SUODATTAA PANDAS DATAFRAME SARAKEARVOJEN MUKAAN

Pandas DataFrame -kehyksen suodattaminen sarakearvojen avulla on tavallinen toimenpide, kun tietoja käytetään Pythonissa. Voit käyttää erilaisia menetelmiä ja tekniikoita saavuttaaksesi tämän. Tässä on useita tapoja suodattaa Pandas DataFrame sarakearvojen avulla.

Tässä viestissä näemme erilaisia tapoja suodattaa Pandas Dataframe sarakearvojen mukaan. Luodaan ensin tietokehys:

Python 3

# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (>

'Given Dataframe :
'>

, dataframe)>

Lähtö:

Datakehys

Pandas Dataframen rivien valitseminen tietyn sarakkeen arvon perusteella käyttämällä operaattoria '>', '=', '=', ' <=', '!='.

Esimerkki 1: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'prosentti' on suurempi kuin 75 käyttämällä [ ] .

Python 3

# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>>> , rslt_df)>

Lähtö:

lähtötietokehys

Esimerkki 2: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa prosenttiosuus on suurempi kuin 70 paikka [ ] .

Python 3

# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>>> ,> > rslt_df)>

Lähtö:

lähtö datakehys-1

Valitsemalla ne Pandas Dataframe -kehyksen rivit, joiden sarakkeen arvo on luettelossa, käyttämällä sinä() tietokehyksen menetelmä.

Esimerkki 1: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'Stream' on asetusluettelossa, käyttämällä [ ] .

Python 3

options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (>

'
Result dataframe :
'>

,> > rslt_df)>

Lähtö:

lähtö datakehys-2

Esimerkki 2: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'Stream' on asetusluettelossa, käyttämällä paikka [ ] .

Python

options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (>

'
Result dataframe :
'>

,> > rslt_df)>

Lähtö:

lähtö datakehys-3

Pandas Dataframen rivien valinta useiden sarakeehtojen perusteella käyttämällä &-operaattoria.

Esimerkki1: Valitse annetusta tietokehyksestä kaikki rivit, joissa 'Ikä' on yhtä suuri kuin 22 ja 'Stream' on vaihtoehtoluettelossa käyttämällä [ ] .

Python 3

options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (>

'
Result dataframe :
'>

,> > rslt_df)>

Lähtö:

lähtö datakehys-4

Esimerkki 2: Valitse annetusta tietokehyksestä kaikki rivit, joissa 'Ikä' on yhtä suuri kuin 22 ja 'Stream' on vaihtoehtoluettelossa käyttämällä paikka [ ] .

Python 3

options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (>