Måder at filtrere Pandas DataFrame efter kolonneværdier

Måder at filtrere Pandas DataFrame efter kolonneværdier

Filtrering af en Pandas DataFrame ved hjælp af kolonneværdier er en almindelig operation, mens du kører med information i Python. Du kan bruge forskellige metoder og teknikker til at opnå dette. Her er adskillige måder at filtrere en Pandas DataFrame fra gennem kolonneværdier.

I dette indlæg vil vi se forskellige måder at filtrere Pandas Dataframe efter kolonneværdier. Lad os først oprette en dataramme:

Python3




# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (> 'Given Dataframe : '> , dataframe)>

Produktion:

Dataramme

Valg af rækker af Pandas Dataframe baseret på en bestemt kolonneværdi ved hjælp af '>', '=', '=', ' <=', '!=' operator.

Eksempel 1: Valg af alle rækker fra den givne dataramme, hvor 'Procentdel' er større end 75 vha. [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> , rslt_df)>

Produktion:

output dataramme

Eksempel 2: Valg af alle rækker fra den givne dataramme, hvor 'Procentdel' er større end 70 vha. sted [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

output dataramme-1

Valg af de rækker af Pandas Dataframe, hvis kolonneværdi er til stede på listen ved hjælp af du() metoden for datarammen.

Eksempel 1: Valg af alle rækkerne fra den givne dataramme, hvori 'Stream' er til stede i valglisten vha [ ] .

Python3




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

output dataramme-2

Eksempel 2: Valg af alle rækkerne fra den givne dataramme, hvori 'Stream' er til stede i valglisten vha sted [ ] .

Python




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

output dataramme-3

Valg af rækker af Pandas Dataframe baseret på flere kolonnebetingelser ved hjælp af '&'-operatoren.

Eksempel 1: Valg af alle rækkerne fra den givne dataramme, hvor 'Alder' er lig med 22, og 'Strøm' er til stede i valglisten vha. [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

output dataramme-4

Eksempel 2: Valg af alle rækkerne fra den givne dataramme, hvor 'Alder' er lig med 22, og 'Strøm' er til stede i valglisten vha. sted [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

output dataramme-5