Måter å filtrere Pandas DataFrame etter kolonneverdier

Måter å filtrere Pandas DataFrame etter kolonneverdier

Filtrering av en Pandas DataFrame ved hjelp av kolonneverdier er en vanlig operasjon mens du kjører med informasjon i Python. Du kan bruke ulike metoder og teknikker for å oppnå dette. Her er mange måter å filtrere ut en Pandas DataFrame gjennom kolonneverdier.

I dette innlegget vil vi se forskjellige måter å filtrere Pandas Dataframe etter kolonneverdier. Først, la oss lage en dataramme:

Python3




# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (> 'Given Dataframe : '> , dataframe)>

Produksjon:

Dataramme

Velge rader med Pandas Dataframe basert på en bestemt kolonneverdi ved å bruke '>', '=', '=', ' <=', '!=' operator.

Eksempel 1: Velge alle radene fra den gitte datarammen der 'Prosentandel' er større enn 75 ved å bruke [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> , rslt_df)>

Produksjon:

utdataramme

Eksempel 2: Velge alle radene fra den gitte datarammen der 'Prosentandel' er større enn 70 ved å bruke plass [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produksjon:

utdataramme-1

Velge de radene med Pandas Dataframe hvis kolonneverdi er til stede i listen ved hjelp av du() metoden for datarammen.

Eksempel 1: Velge alle radene fra den gitte datarammen der 'Stream' er til stede i alternativlisten ved å bruke [ ] .

Python3




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produksjon:

utdataramme-2

Eksempel 2: Velge alle radene fra den gitte datarammen der 'Stream' er til stede i alternativlisten ved å bruke plass [ ] .

Python




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produksjon:

utdataramme-3

Velge rader med Pandas Dataframe basert på flere kolonneforhold ved å bruke '&'-operatoren.

Eksempel 1: Å velge alle radene fra den gitte datarammen der 'Alder' er lik 22 og 'Strøm' er til stede i alternativlisten ved å bruke [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produksjon:

utdataramme-4

Eksempel 2: Å velge alle radene fra den gitte datarammen der 'Alder' er lik 22 og 'Strøm' er til stede i alternativlisten ved å bruke plass [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produksjon:

utdataramme-5