Vervang NaN-waarden door nullen in Pandas DataFrame

Vervang NaN-waarden door nullen in Pandas DataFrame

NaN staat voor Not A Number en is een van de gebruikelijke manieren om de ontbrekende waarde in de gegevens weer te geven. Het is een speciale drijvende-kommawaarde en kan niet worden geconverteerd naar een ander type dan float. De NaN-waarde is een van de grootste problemen bij

Methoden om NaN-waarden te vervangen door nullen in Pandas DataFrame

In Python zijn er twee methoden waarmee we NaN-waarden kunnen vervangen door nullen in het Pandas-dataframe. Ze zijn als volgt:

Vervang NaN-waarden door nullen met Pandas fillna()

De functie fillna() wordt gebruikt om NA/NaN-waarden te vullen met behulp van de opgegeven methode. Laten we een paar voorbeelden bekijken voor een beter begrip.

Vervang NaN-waarden door nullen voor een kolom met Pandas fillna()

De syntaxis voor het vervangen van NaN-waarden door nullen van een enkele kolom in het Pandas-dataframe met behulp van de functie fillna() is als volgt:

 Syntax: df['DataFrame Column'] = df['DataFrame Column'].fillna(0) 

Python3




# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Set_of_Numbers'> : [> 2> ,> 3> ,> 5> ,> 7> ,> 11> ,> 13> ,> > np.nan,> 19> ,> 23> , np.nan]}> # Create the dataframe> df> => pd.DataFrame(nums, columns> => [> 'Set_of_Numbers'> ])> # Apply the function> df[> 'Set_of_Numbers'> ]> => df[> 'Set_of_Numbers'> ].fillna(> 0> )> # print the DataFrame> df>

Uitgang:

Vervang NaN-waarden door nul voor een enkele kolom met Panda fillna()

fillna() om NaN voor een enkele kolom te vervangen

Vervang NaN-waarden door nullen voor een hele kolom met Pandas fillna()

De syntaxis voor het vervangen van NaN-waarden door nullen van het hele Pandas-dataframe met behulp van de functie fillna() is als volgt:

 Syntax: df.fillna(0) 

Python3




# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Number_set_1'> : [> 0> ,> 1> ,> 1> ,> 2> ,> 3> ,> 5> , np.nan,> > 13> ,> 21> , np.nan],> > 'Number_set_2'> : [> 3> ,> 7> , np.nan,> 23> ,> 31> ,> 41> ,> > np.nan,> 59> ,> 67> , np.nan],> > 'Number_set_3'> : [> 2> ,> 3> ,> 5> , np.nan,> 11> ,> 13> ,> 17> ,> > 19> ,> 23> , np.nan]}> # Create the dataframe> df> => pd.DataFrame(nums)> # Apply the function> df> => df.fillna(> 0> )> # print the DataFrame> df>

Uitgang:

Vervang NaN-waarden door nul voor het hele dataframe met Panda fillna()

fillna() functie om NaN voor het hele dataframe te vervangen

Vervang NaN-waarden door nullen met behulp van NumPy Replace()

De dataframe.replace() functie in Pandas kan worden gedefinieerd als een eenvoudige methode die wordt gebruikt om a snaar , regex , lijst , woordenboek , enz. in een DataFrame.

Vervang NaN-waarden door nullen voor een kolom met behulp van NumPy Replace()

De syntaxis voor het vervangen van NaN-waarden door nullen van een enkele kolom in het Pandas-dataframe met behulp van de functie Replace() is als volgt:

 Syntax: df['DataFrame Column'] = df['DataFrame Column'].replace(np.nan, 0) 

Python3




# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Car Model Number'> : [> 223> , np.nan,> 237> ,> 195> , np.nan,> > 575> ,> 110> ,> 313> , np.nan,> 190> ,> 143> ,> > np.nan],> > 'Engine Number'> : [> 4511> , np.nan,> 7570> ,> 1565> ,> 1450> ,> 3786> ,> > 2995> ,> 5345> ,> 7777> ,> 2323> ,> 2785> ,> 1120> ]}> # Create the dataframe> df> => pd.DataFrame(nums, columns> => [> 'Car Model Number'> ])> # Apply the function> df[> 'Car Model Number'> ]> => df[> 'Car Model Number'> ].replace(np.nan,> 0> )> # print the DataFrame> df>

Uitgang:

Vervang NaN-waarden door nul voor een enkele kolom met behulp van NumPy Replace()

Replace() om NaN voor een enkele kolom te vervangen

Vervang NaN-waarden door nullen voor een volledig dataframe met behulp van NumPy Replace()

Syntaxis om NaN-waarden te vervangen door nullen van het hele Pandas-dataframe vervangen() functie is als volgt:

 Syntax: df.replace(np.nan, 0) 

Python3




# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Student Name'> : [> 'Shrek'> ,> 'Shivansh'> ,> 'Ishdeep'> ,> > 'Siddharth'> ,> 'Nakul'> ,> 'Prakhar'> ,> > 'Yash'> ,> 'Srikar'> ,> 'Kaustubh'> ,> > 'Aditya'> ,> 'Manav'> ,> 'Dubey'> ],> > 'Roll No.'> : [> 18229> ,> 18232> , np.nan,> 18247> ,> 18136> ,> > np.nan,> 18283> ,> 18310> ,> 18102> ,> 18012> ,> > 18121> ,> 18168> ],> > 'Subject ID'> : [> 204> , np.nan,> 201> ,> 105> , np.nan,> 204> ,> > 101> ,> 101> , np.nan,> 165> ,> 715> , np.nan],> > 'Grade Point'> : [> 9> , np.nan,> 7> , np.nan,> 8> ,> 7> ,> 9> ,> 10> ,> > np.nan,> 9> ,> 6> ,> 8> ]}> # Create the dataframe> df> => pd.DataFrame(nums)> # Apply the function> df> => df.replace(np.nan,> 0> )> # print the DataFrame> df>

Uitgang:

Vervang NaN-waarden door nul voor het hele dataframe met behulp van NumPy Replace()

Replace() functie om NaN voor het hele dataframe te vervangen