Erstat NaN-værdier med nuller i Pandas DataFrame
NaN står for Not A Number og er en af de almindelige måder at repræsentere den manglende værdi i dataene. Det er en speciel floating-point-værdi og kan ikke konverteres til nogen anden type end float. NaN-værdi er et af de største problemer i
Metoder til at erstatte NaN-værdier med nuller i Pandas DataFrame
I Python, der er to metoder, hvormed vi kan erstatte NaN-værdier med nuller i Pandas dataramme. De er som følger:
Erstat NaN-værdier med nuller ved hjælp af Pandas fillna()
Funktionen fillna() bruges til at udfylde NA/NaN-værdier ved hjælp af den angivne metode. Lad os se et par eksempler for en bedre forståelse.
Erstat NaN-værdier med nuller for en kolonne ved hjælp af Pandas fillna()
Syntaks til at erstatte NaN-værdier med nuller i en enkelt kolonne i Pandas dataramme ved hjælp af fillna()-funktionen er som følger:
Syntax: df['DataFrame Column'] = df['DataFrame Column'].fillna(0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Set_of_Numbers'> : [> 2> ,> 3> ,> 5> ,> 7> ,> 11> ,> 13> ,> > np.nan,> 19> ,> 23> , np.nan]}> # Create the dataframe> df> => pd.DataFrame(nums, columns> => [> 'Set_of_Numbers'> ])> # Apply the function> df[> 'Set_of_Numbers'> ]> => df[> 'Set_of_Numbers'> ].fillna(> 0> )> # print the DataFrame> df> |
Produktion:
fillna() for at erstatte NaN for en enkelt kolonne
Erstat NaN-værdier med nuller for en hel kolonne ved hjælp af Pandas fillna()
Syntaksen til at erstatte NaN-værdier med nuller for hele Pandas-datarammen ved hjælp af fillna()-funktionen er som følger:
Syntax: df.fillna(0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Number_set_1'> : [> 0> ,> 1> ,> 1> ,> 2> ,> 3> ,> 5> , np.nan,> > 13> ,> 21> , np.nan],> > 'Number_set_2'> : [> 3> ,> 7> , np.nan,> 23> ,> 31> ,> 41> ,> > np.nan,> 59> ,> 67> , np.nan],> > 'Number_set_3'> : [> 2> ,> 3> ,> 5> , np.nan,> 11> ,> 13> ,> 17> ,> > 19> ,> 23> , np.nan]}> # Create the dataframe> df> => pd.DataFrame(nums)> # Apply the function> df> => df.fillna(> 0> )> # print the DataFrame> df> |
Produktion:
fillna() funktion til at erstatte NaN for hele datarammen
Erstat NaN-værdier med nuller ved hjælp af NumPy replace()
Det dataframe.replace() funktion i Pandas kan defineres som en simpel metode, der bruges til at erstatte en snor , regex , liste , ordbog osv. i en DataFrame.
Erstat NaN-værdier med nuller for en kolonne ved hjælp af NumPy replace()
Syntaks til at erstatte NaN-værdier med nuller i en enkelt kolonne i Pandas dataramme ved hjælp af replace()-funktionen er som følger:
Syntax: df['DataFrame Column'] = df['DataFrame Column'].replace(np.nan, 0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Car Model Number'> : [> 223> , np.nan,> 237> ,> 195> , np.nan,> > 575> ,> 110> ,> 313> , np.nan,> 190> ,> 143> ,> > np.nan],> > 'Engine Number'> : [> 4511> , np.nan,> 7570> ,> 1565> ,> 1450> ,> 3786> ,> > 2995> ,> 5345> ,> 7777> ,> 2323> ,> 2785> ,> 1120> ]}> # Create the dataframe> df> => pd.DataFrame(nums, columns> => [> 'Car Model Number'> ])> # Apply the function> df[> 'Car Model Number'> ]> => df[> 'Car Model Number'> ].replace(np.nan,> 0> )> # print the DataFrame> df> |
Produktion:
replace() for at erstatte NaN for en enkelt kolonne
Erstat NaN-værdier med nuller for en hel dataramme ved hjælp af NumPy replace()
Syntaks til at erstatte NaN-værdier med nuller for hele Pandas-datarammen ved hjælp af replace() funktion er som følgende:
Syntax: df.replace(np.nan, 0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Student Name'> : [> 'Shrek'> ,> 'Shivansh'> ,> 'Ishdeep'> ,> > 'Siddharth'> ,> 'Nakul'> ,> 'Prakhar'> ,> > 'Yash'> ,> 'Srikar'> ,> 'Kaustubh'> ,> > 'Aditya'> ,> 'Manav'> ,> 'Dubey'> ],> > 'Roll No.'> : [> 18229> ,> 18232> , np.nan,> 18247> ,> 18136> ,> > np.nan,> 18283> ,> 18310> ,> 18102> ,> 18012> ,> > 18121> ,> 18168> ],> > 'Subject ID'> : [> 204> , np.nan,> 201> ,> 105> , np.nan,> 204> ,> > 101> ,> 101> , np.nan,> 165> ,> 715> , np.nan],> > 'Grade Point'> : [> 9> , np.nan,> 7> , np.nan,> 8> ,> 7> ,> 9> ,> 10> ,> > np.nan,> 9> ,> 6> ,> 8> ]}> # Create the dataframe> df> => pd.DataFrame(nums)> # Apply the function> df> => df.replace(np.nan,> 0> )> # print the DataFrame> df> |
Produktion:
replace() funktion til at erstatte NaN for hele datarammen