Sätt att filtrera Pandas DataFrame efter kolumnvärden

Sätt att filtrera Pandas DataFrame efter kolumnvärden

Att filtrera en Pandas DataFrame med hjälp av kolumnvärden är en vanlig operation när man kör med information i Python. Du kan använda olika metoder och tekniker för att uppnå detta. Här är många sätt att filtrera bort en Pandas DataFrame genom kolumnvärden.

I det här inlägget kommer vi att se olika sätt att filtrera Pandas Dataframe efter kolumnvärden. Låt oss först skapa en dataram:

Python3




# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (> 'Given Dataframe : '> , dataframe)>

Produktion:

Dataram

Välja rader av Pandas Dataframe baserat på ett visst kolumnvärde med operatorn '>', '=', '=', ' <=', '!='.

Exempel 1: Att välja alla rader från den givna dataramen där 'Procentandel' är större än 75 med [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> , rslt_df)>

Produktion:

utdataram

Exempel 2: Att välja alla rader från den givna dataramen där 'Procentandel' är större än 70 med plats [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

utdataram-1

Att välja de rader av Pandas Dataframe vars kolumnvärde finns i listan med hjälp av du() metod för dataramen.

Exempel 1: Att välja alla rader från den givna dataramen där 'Stream' finns i alternativlistan med hjälp av [ ] .

Python3




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

utdataram-2

Exempel 2: Att välja alla rader från den givna dataramen där 'Stream' finns i alternativlistan med hjälp av plats [ ] .

Pytonorm




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

utdataram-3

Välja rader av Pandas Dataframe baserat på flera kolumnvillkor med hjälp av '&'-operatorn.

Exempel 1: Att välja alla rader från den givna dataramen där 'Age' är lika med 22 och 'Stream' finns i alternativlistan med [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

utdataram-4

Exempel 2: Att välja alla rader från den givna dataramen där 'Age' är lika med 22 och 'Stream' finns i alternativlistan med plats [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Produktion:

utdataram-5