Måder at filtrere Pandas DataFrame efter kolonneværdier
Filtrering af en Pandas DataFrame ved hjælp af kolonneværdier er en almindelig operation, mens du kører med information i Python. Du kan bruge forskellige metoder og teknikker til at opnå dette. Her er adskillige måder at filtrere en Pandas DataFrame fra gennem kolonneværdier.
I dette indlæg vil vi se forskellige måder at filtrere Pandas Dataframe efter kolonneværdier. Lad os først oprette en dataramme:
Python3
# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (> 'Given Dataframe :
'> , dataframe)> |
Produktion:
Valg af rækker af Pandas Dataframe baseret på en bestemt kolonneværdi ved hjælp af '>', '=', '=', ' <=', '!=' operator.
Eksempel 1: Valg af alle rækker fra den givne dataramme, hvor 'Procentdel' er større end 75 vha. [ ] .
Python3
# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> '
Result dataframe :
'> , rslt_df)> |
Produktion:
Eksempel 2: Valg af alle rækker fra den givne dataramme, hvor 'Procentdel' er større end 70 vha. sted [ ] .
Python3
# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Produktion:
Valg af de rækker af Pandas Dataframe, hvis kolonneværdi er til stede på listen ved hjælp af du() metoden for datarammen.
Eksempel 1: Valg af alle rækkerne fra den givne dataramme, hvori 'Stream' er til stede i valglisten vha [ ] .
Python3
options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Produktion:
Eksempel 2: Valg af alle rækkerne fra den givne dataramme, hvori 'Stream' er til stede i valglisten vha sted [ ] .
Python
options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Produktion:
Valg af rækker af Pandas Dataframe baseret på flere kolonnebetingelser ved hjælp af '&'-operatoren.
Eksempel 1: Valg af alle rækkerne fra den givne dataramme, hvor 'Alder' er lig med 22, og 'Strøm' er til stede i valglisten vha. [ ] .
Python3
options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Produktion:
Eksempel 2: Valg af alle rækkerne fra den givne dataramme, hvor 'Alder' er lig med 22, og 'Strøm' er til stede i valglisten vha. sted [ ] .
Python3
options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Produktion: