Modalități de a filtra Pandas DataFrame după valorile coloanei
Filtrarea unui Pandas DataFrame prin valorile coloanelor este o operație obișnuită în timpul rulării cu informații în Python. Puteți utiliza diverse metode și tehnici pentru a realiza acest lucru. Iată numeroase moduri de a filtra un Pandas DataFrame prin valorile coloanei.
În această postare, vom vedea diferite moduri de a filtra Pandas Dataframe după valorile coloanei. Mai întâi, să creăm un cadru de date:
Python3
# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (> 'Given Dataframe :
'> , dataframe)> |
Ieșire:
Selectarea rândurilor de Pandas Dataframe pe baza unei anumite valori a coloanei folosind operatorul „>”, „=”, „=”, „ <=”, „!=”.
Exemplul 1: Selectând toate rândurile din cadrul de date dat în care „Procentul” este mai mare de 75 folosind [ ] .
Python3
# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>>>> , rslt_df)> |
Ieșire:
Exemplul 2: Selectând toate rândurile din cadrul de date dat în care „Procentul” este mai mare de 70 folosind loc[ ] .
Python3
# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>>>> ,> > rslt_df)> |
Ieșire:
Selectarea acelor rânduri de Pandas Dataframe a căror valoare de coloană este prezentă în listă folosind tu() metoda cadrului de date.
Exemplul 1: Selectând toate rândurile din cadrul de date dat în care „Stream” este prezent în lista de opțiuni folosind [ ] .
Python3
options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Ieșire:
Exemplul 2: Selectând toate rândurile din cadrul de date dat în care „Stream” este prezent în lista de opțiuni folosind loc[ ] .
Piton
options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Ieșire:
Selectarea rândurilor de Pandas Dataframe pe baza mai multor condiții de coloane folosind operatorul „&”.
Exemplul 1: Selectând toate rândurile din cadrul de date dat în care „Vârsta” este egală cu 22 și „Stream” este prezent în lista de opțiuni folosind [ ] .
Python3
options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Ieșire:
Exemplul 2: Selectând toate rândurile din cadrul de date dat în care „Vârsta” este egală cu 22 și „Stream” este prezent în lista de opțiuni folosind loc[ ] .
Python3
options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> '
Result dataframe :
'> ,> > rslt_df)> |
Ieșire: