Spôsoby filtrovania Pandas DataFrame podľa hodnôt stĺpcov

Spôsoby filtrovania Pandas DataFrame podľa hodnôt stĺpcov

Filtrovanie Pandas DataFrame prostredníctvom hodnôt stĺpcov je bežná operácia pri spustení s informáciami v Pythone. Na dosiahnutie tohto cieľa môžete použiť rôzne metódy a techniky. Tu je mnoho spôsobov, ako odfiltrovať Pandas DataFrame prostredníctvom hodnôt stĺpcov.

V tomto príspevku uvidíme rôzne spôsoby filtrovania dátového rámca Pandas podľa hodnôt stĺpcov. Najprv si vytvoríme dátový rámec:

Python3




# importing pandas> import> pandas as pd> > # declare a dictionary> record> => {> > 'Name'> : [> 'Ankit'> ,> 'Swapnil'> ,> 'Aishwarya'> ,> > 'Priyanka'> ,> 'Shivangi'> ,> 'Shaurya'> ],> > > 'Age'> : [> 22> ,> 20> ,> 21> ,> 19> ,> 18> ,> 22> ],> > > 'Stream'> : [> 'Math'> ,> 'Commerce'> ,> 'Science'> ,> > 'Math'> ,> 'Math'> ,> 'Science'> ],> > > 'Percentage'> : [> 90> ,> 90> ,> 96> ,> 75> ,> 70> ,> 80> ] }> > # create a dataframe> dataframe> => pd.DataFrame(record,> > columns> => [> 'Name'> ,> 'Age'> ,> > 'Stream'> ,> 'Percentage'> ])> # show the Dataframe> print> (> 'Given Dataframe : '> , dataframe)>

Výkon:

Dataframe

Výber riadkov dátového rámca Pandas na základe konkrétnej hodnoty stĺpca pomocou operátorov „>“, „=“, „=“, „ <=“, „!=“.

Príklad 1: Výber všetkých riadkov z daného dátového rámca, v ktorých je „percento“ väčšie ako 75 pomocou [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> , rslt_df)>

Výkon:

výstupný dátový rámec

Príklad 2: Výber všetkých riadkov z daného dátového rámca, v ktorých je „percento“ väčšie ako 70 pomocou miesto [ ] .

Python3




# selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Percentage'> ]>> 70> ]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Výkon:

výstupný dátový rámec-1

Výber tých riadkov dátového rámca Pandas, ktorých hodnota stĺpca je prítomná v zozname pomocou ty() metóda dátového rámca.

Príklad 1: Výber všetkých riadkov z daného dátového rámca, v ktorom sa nachádza „Stream“ v zozname možností pomocou [ ] .

Python3




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Výkon:

výstupný dátový rámec-2

Príklad 2: Výber všetkých riadkov z daného dátového rámca, v ktorom sa nachádza „Stream“ v zozname možností pomocou miesto [ ] .

Python




options> => [> 'Science'> ,> 'Commerce'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Výkon:

výstupný dátový rámec-3

Výber riadkov dátového rámca Pandas na základe podmienok viacerých stĺpcov pomocou operátora „&“.

Príklad1: Výber všetkých riadkov z daného dátového rámca, v ktorom sa „Vek“ rovná 22 a „Stream“ je prítomný v zozname možností pomocou [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Výkon:

výstupný dátový rámec-4

Príklad 2: Výber všetkých riadkov z daného dátového rámca, v ktorom sa „Vek“ rovná 22 a „Stream“ je prítomný v zozname možností pomocou miesto [ ] .

Python3




options> => [> 'Commerce'> ,> 'Science'> ]> > # selecting rows based on condition> rslt_df> => dataframe.loc[(dataframe[> 'Age'> ]> => => 22> ) &> > dataframe[> 'Stream'> ].isin(options)]> > print> (> ' Result dataframe : '> ,> > rslt_df)>

Výkon:

výstupný dátový rámec-5