Python | Pandas.apply()

Python | Pandas.apply()

Mit Pandas.apply können Benutzer eine Funktion übergeben und auf jeden einzelnen Wert der Pandas-Reihe anwenden. Dies stellt eine enorme Verbesserung für die Pandas-Bibliothek dar, da diese Funktion dabei hilft, Daten entsprechend den erforderlichen Bedingungen zu trennen, wodurch sie effizient in der Datenwissenschaft und beim maschinellen Lernen eingesetzt werden können.

Installation:

Importieren Sie das Pandas-Modul mit den folgenden Befehlen auf dem Terminal in die Python-Datei:

pip install pandas 

Um die CSV-Datei zu lesen und in eine Pandas-Reihe zu komprimieren, werden die folgenden Befehle verwendet:

import pandas as pd s = pd.read_csv('stock.csv', squeeze=True) 

Syntax:

s.apply(func, convert_dtype=True, args=()) 

Parameter:

Funktion: .apply übernimmt eine Funktion und wendet sie auf alle Werte der Pandas-Reihe an. konvertieren_dtype: Konvertieren Sie dtype gemäß der Operation der Funktion. args=(): Zusätzliche Argumente, die anstelle von Serien an die Funktion übergeben werden. Rückgabetyp: Pandas-Serie nach angewendeter Funktion/Bedienung.

Beispiel 1:

Das folgende Beispiel übergibt eine Funktion und prüft den Wert jedes Elements in Reihe und gibt entsprechend „Low“, „Normal“ oder „High“ zurück.

PYTHON3




import> pandas as pd> # reading csv> s> => pd.read_csv('stock.csv', squeeze> => True> )> # defining function to check price> def> fun(num):> > if> num <> 200> :> > return> 'Low'> > elif> num>> => 200> and> num <> 400> :> > return> 'Normal'> > else> :> > return> 'High'> # passing function to apply and storing returned series in new> new> => s.> apply> (fun)> # printing first 3 element> print> (new.head(> 3> ))> # printing elements somewhere near the middle of series> print> (new[> 1400> ], new[> 1500> ], new[> 1600> ])> # printing last 3 elements> print> (new.tail(> 3> ))>

Ausgabe:

Beispiel #2:

Im folgenden Beispiel wird mithilfe von Lambda eine temporäre anonyme Funktion in .apply selbst erstellt. Es addiert 5 zu jedem Wert in der Reihe und gibt eine neue Reihe zurück.

PYTHON3




import> pandas as pd> s> => pd.read_csv('stock.csv', squeeze> => True> )> # adding 5 to each value> new> => s.> apply> (> lambda> num : num> +> 5> )> # printing first 5 elements of old and new series> print> (s.head(),> ' '> , new.head())> # printing last 5 elements of old and new series> print> (> ' '> , s.tail(),> ' '> , new.tail())>

Ausgabe:

0 50.12 1 54.10 2 54.65 3 52.38 4 52.95 Name: Stock Price, dtype: float64   0 55.12 1 59.10 2 59.65 3 57.38 4 57.95 Name: Stock Price, dtype: float64  3007 772.88 3008 771.07 3009 773.18 3010 771.61 3011 782.22 Name: Stock Price, dtype: float64   3007 777.88 3008 776.07 3009 778.18 3010 776.61 3011 787.22 Name: Stock Price, dtype: float64 

Wie beobachtet: Neue Werte = alte Werte + 5