Tapoja suodattaa Pandas DataFrame sarakearvojen mukaan

Tapoja suodattaa Pandas DataFrame sarakearvojen mukaan

Pandas DataFrame -kehyksen suodattaminen sarakearvojen avulla on tavallinen toimenpide, kun tietoja käytetään Pythonissa. Voit käyttää erilaisia ​​menetelmiä ja tekniikoita saavuttaaksesi tämän. Tässä on useita tapoja suodattaa Pandas DataFrame sarakearvojen avulla.

Tässä viestissä näemme erilaisia ​​tapoja suodattaa Pandas Dataframe sarakearvojen mukaan. Luodaan ensin tietokehys:

Python 3




# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (> 'Given Dataframe : '> , dataframe)>

Lähtö:

Datakehys

Pandas Dataframen rivien valitseminen tietyn sarakkeen arvon perusteella käyttämällä operaattoria '>', '=', '=', ' <=', '!='.

Esimerkki 1: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'prosentti' on suurempi kuin 75 käyttämällä [ ] .

Python 3




# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>>> , rslt_df)>

Lähtö:

lähtötietokehys

Esimerkki 2: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa prosenttiosuus on suurempi kuin 70 paikka [ ] .

Python 3




# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>>> ,> > rslt_df)>

Lähtö:

lähtö datakehys-1

Valitsemalla ne Pandas Dataframe -kehyksen rivit, joiden sarakkeen arvo on luettelossa, käyttämällä sinä() tietokehyksen menetelmä.

Esimerkki 1: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'Stream' on asetusluettelossa, käyttämällä [ ] .

Python 3




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Lähtö:

lähtö datakehys-2

Esimerkki 2: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'Stream' on asetusluettelossa, käyttämällä paikka [ ] .

Python




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Lähtö:

lähtö datakehys-3

Pandas Dataframen rivien valinta useiden sarakeehtojen perusteella käyttämällä &-operaattoria.

Esimerkki1: Valitse annetusta tietokehyksestä kaikki rivit, joissa 'Ikä' on yhtä suuri kuin 22 ja 'Stream' on vaihtoehtoluettelossa käyttämällä [ ] .

Python 3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Lähtö:

lähtö datakehys-4

Esimerkki 2: Valitse annetusta tietokehyksestä kaikki rivit, joissa 'Ikä' on yhtä suuri kuin 22 ja 'Stream' on vaihtoehtoluettelossa käyttämällä paikka [ ] .

Python 3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Lähtö:

lähtö datakehys-5