METODA PANDAS DATAFRAME CORR() - TECHCODEVIEW.COM

Pande dataframe.corr() se uporablja za iskanje parne korelacije vseh stolpcev v Pandas Dataframe v Pythonu. Kaj NaN vrednosti so samodejno izključene. Če želite prezreti vse neštevilske vrednosti, uporabite parameter numeric_only = True. V tem članku bomo spoznali metodo DataFrame.corr(). Python .

Sintaksa metode Pandas DataFrame corr().

Sintaksa: DataFrame.corr(self, method='pearson', min_periods=1, numeric_only = False)

Parametri:

metoda:

pearson: standardni korelacijski koeficient

kendall: korelacijski koeficient Kendall Tau

spearman: korelacija ranga spearman

min_obdobja: Najmanjše število opazovanj, potrebnih na par stolpcev za veljaven rezultat. Trenutno na voljo samo za korelacijo Pearson in spearman

numeric_only : ali naj se upravlja samo s številskimi vrednostmi ali ne. Privzeto je nastavljen na False.

Vrne: count :y : DataFrame

Metoda korelacije podatkov Pandas corr().

Dobra korelacija je odvisna od uporabe, vendar lahko z gotovostjo rečemo, da imate vsaj 0,6 (ali -0,6), da jo imenujemo dobra korelacija. Preprost primer, ki prikazuje, kako deluje korelacija Python .

Python3

import> pandas as pd> df> => {> > 'Array_1'> : [> 30> ,> 70> ,> 100> ],> > 'Array_2'> : [> 65.1> ,> 49.50> ,> 30.7> ]> }> data> => pd.DataFrame(df)> print> (data.corr())>

Izhod

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000

Ustvarjanje vzorčnega podatkovnega okvira

Tiskanje prvih 10 vrstic Dataframe.

Opomba: Korelacija spremenljivke s samo seboj je 1. Za povezavo do datoteke CSV, uporabljene v kodi, kliknite tukaj

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df> => pd.read_csv(> 'nba.csv'> )> # Printing the first 10 rows of the data frame for visualization> df[:> 10> ]>

Izhod

Korelacije podatkov Pandas

Primeri metode Python Pandas DataFrame corr().

Poiščite korelacijo med stolpci z uporabo pearsonove metode

Tu uporabljamo funkcijo corr(), da poiščemo korelacijo med stolpci v Dataframeu z uporabo metode Pearson. V Dataframeu imamo samo štiri številske stolpce. Izhodni podatkovni okvir je mogoče razlagati kot za katero koli celico, korelacija spremenljivke vrstice s spremenljivko stolpca je vrednost celice. Kot smo že omenili, je korelacija spremenljivke s samo seboj 1. Zato so vse diagonalne vrednosti 1,00.

Python3

# To find the correlation among> # the columns using pearson method> df.corr(method> => 'pearson'> )>

Izhod

Korelacije podatkov Pandas

Poiščite korelacijo med stolpci z uporabo Kendallove metode

Uporabite funkcijo Pandas df.corr(), da poiščete korelacijo med stolpci v Dataframeu z metodo 'kendall'. Izhodni podatkovni okvir je mogoče razlagati kot za katero koli celico, korelacija spremenljivke vrstice s spremenljivko stolpca je vrednost celice. Kot smo že omenili, je korelacija spremenljivke s samo seboj 1. Zato so vse diagonalne vrednosti 1,00.

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df> => pd.read_csv(> 'nba.csv'> )> # To find the correlation among> # the columns using kendall method> df.corr(method> => 'kendall'> )>

Izhod

dataframe.corr