Nahraďte hodnoty NaN nulami v Pandas DataFrame
NaN je skratka pre Not A Number a je jedným z bežných spôsobov vyjadrenia chýbajúcej hodnoty v údajoch. Je to špeciálna hodnota s pohyblivou rádovou čiarkou a nemožno ju previesť na iný typ ako float. Hodnota NaN je jedným z hlavných problémov
Metódy nahradenia hodnôt NaN nulami v Pandas DataFrame
In Python , existujú dva spôsoby, ktorými môžeme nahradiť hodnoty NaN nulami v dátovom rámci Pandas. Sú nasledovné:
Nahraďte hodnoty NaN nulami pomocou Pandas fillna()
Funkcia fillna() sa používa na vyplnenie hodnôt NA/NaN pomocou špecifikovanej metódy. Pozrime sa na niekoľko príkladov pre lepšie pochopenie.
Nahraďte hodnoty NaN nulami pre stĺpec pomocou Pandas fillna()
Syntax na nahradenie hodnôt NaN nulami jedného stĺpca v dátovom rámci Pandas pomocou funkcie fillna() je nasledovná:
Syntax: df['DataFrame Column'] = df['DataFrame Column'].fillna(0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Set_of_Numbers'> : [> 2> ,> 3> ,> 5> ,> 7> ,> 11> ,> 13> ,> > np.nan,> 19> ,> 23> , np.nan]}> # Create the dataframe> df> => pd.DataFrame(nums, columns> => [> 'Set_of_Numbers'> ])> # Apply the function> df[> 'Set_of_Numbers'> ]> => df[> 'Set_of_Numbers'> ].fillna(> 0> )> # print the DataFrame> df> |
Výkon:
fillna() na nahradenie NaN pre jeden stĺpec
Nahraďte hodnoty NaN nulami pre celý stĺpec pomocou Pandas fillna()
Syntax na nahradenie hodnôt NaN nulami celého dátového rámca Pandas pomocou funkcie fillna() je nasledovná:
Syntax: df.fillna(0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Number_set_1'> : [> 0> ,> 1> ,> 1> ,> 2> ,> 3> ,> 5> , np.nan,> > 13> ,> 21> , np.nan],> > 'Number_set_2'> : [> 3> ,> 7> , np.nan,> 23> ,> 31> ,> 41> ,> > np.nan,> 59> ,> 67> , np.nan],> > 'Number_set_3'> : [> 2> ,> 3> ,> 5> , np.nan,> 11> ,> 13> ,> 17> ,> > 19> ,> 23> , np.nan]}> # Create the dataframe> df> => pd.DataFrame(nums)> # Apply the function> df> => df.fillna(> 0> )> # print the DataFrame> df> |
Výkon:
fillna() funkcia na nahradenie NaN pre celý dátový rámec
Nahradiť hodnoty NaN nulami pomocou NumPy replace()
The dataframe.replace() funkciu v Pandas možno definovať ako jednoduchú metódu používanú na nahradenie a reťazec , regulárny výraz , zoznam , slovník atď. v DataFrame.
Nahraďte hodnoty NaN nulami pre stĺpec pomocou NumPy replace()
Syntax na nahradenie hodnôt NaN nulami jedného stĺpca v dátovom rámci Pandas pomocou funkcie replace() je nasledovná:
Syntax: df['DataFrame Column'] = df['DataFrame Column'].replace(np.nan, 0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Car Model Number'> : [> 223> , np.nan,> 237> ,> 195> , np.nan,> > 575> ,> 110> ,> 313> , np.nan,> 190> ,> 143> ,> > np.nan],> > 'Engine Number'> : [> 4511> , np.nan,> 7570> ,> 1565> ,> 1450> ,> 3786> ,> > 2995> ,> 5345> ,> 7777> ,> 2323> ,> 2785> ,> 1120> ]}> # Create the dataframe> df> => pd.DataFrame(nums, columns> => [> 'Car Model Number'> ])> # Apply the function> df[> 'Car Model Number'> ]> => df[> 'Car Model Number'> ].replace(np.nan,> 0> )> # print the DataFrame> df> |
Výkon:
replace() na nahradenie NaN pre jeden stĺpec
Nahraďte hodnoty NaN nulami pre celý dátový rámec pomocou NumPy replace()
Syntax na nahradenie hodnôt NaN nulami z celého dátového rámca Pandas funkcia nahradiť (). je nasledujúca:
Syntax: df.replace(np.nan, 0)
Python3
# importing libraries> import> pandas as pd> import> numpy as np> nums> => {> 'Student Name'> : [> 'Shrek'> ,> 'Shivansh'> ,> 'Ishdeep'> ,> > 'Siddharth'> ,> 'Nakul'> ,> 'Prakhar'> ,> > 'Yash'> ,> 'Srikar'> ,> 'Kaustubh'> ,> > 'Aditya'> ,> 'Manav'> ,> 'Dubey'> ],> > 'Roll No.'> : [> 18229> ,> 18232> , np.nan,> 18247> ,> 18136> ,> > np.nan,> 18283> ,> 18310> ,> 18102> ,> 18012> ,> > 18121> ,> 18168> ],> > 'Subject ID'> : [> 204> , np.nan,> 201> ,> 105> , np.nan,> 204> ,> > 101> ,> 101> , np.nan,> 165> ,> 715> , np.nan],> > 'Grade Point'> : [> 9> , np.nan,> 7> , np.nan,> 8> ,> 7> ,> 9> ,> 10> ,> > np.nan,> 9> ,> 6> ,> 8> ]}> # Create the dataframe> df> => pd.DataFrame(nums)> # Apply the function> df> => df.replace(np.nan,> 0> )> # print the DataFrame> df> |
Výkon:
Funkcia replace() na nahradenie NaN pre celý dátový rámec