Cum se utilizează na.omit în R?
Care sunt valorile lipsă?
În analiza datelor, valorile lipsă se referă la absența datelor pentru o anumită variabilă sau observație. Aceste valori lipsă sunt de obicei reprezentate printr-un simbol sau cod special, adesea notat ca NA (Nedisponibil) în R și în multe alte limbaje de programare.
Funcția na.omit() în R
The na.omit()> functioneaza in R limbaj de programare este utilizat pentru a elimina valorile lipsă (NA) dintr-un cadru de date, matrice sau vector. Numele na.omit înseamnă omit NAs. Această funcție este utilă în special atunci când lucrați cu seturi de date care conțin valori lipsă și doriți să excludeți din analiză observațiile cu date lipsă.
Sintaxă:
na.omit(date)
Parametru:
date: Set de valori specificate ale unui cadru de date, matrice sau vector.
Se intoarce: Interval de valori după omisiunea NA.
Eliminarea valorilor lipsă din Vector
R
# Create a vector with missing values> vector <-> c> (1, 2,> NA> , 4, 5)> vector> # Use na.omit() to remove missing values> cleaned_vector <-> na.omit> (vector)> # Display the cleaned vector> cleaned_vector> |
Ieșire:
[1] 1 2 NA 4 5 [1] 1 2 4 5
Eliminarea valorilor lipsă din matrice
R
# Create a matrix with missing values> mat <-> c> (> NA> ,1,2,> NA> ,3,4,> NA> ,5,6,> NA> ,7,8)> var <-> matrix> (mat,3,4)> var> # Use na.omit() to remove missing values> na.omit> (var)> |
Ieșire:
[,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 1 3 5 7 [3,] 2 4 6 8 [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8
Eliminarea valorilor lipsă din Cadre de date
R
# Create a data frame with missing values> data <-> data.frame> (> > ID => c> (1, 2, 3, 4),> > Value => c> (5,> NA> , 7, 8)> )> data> # Use na.omit() to remove rows with missing values> cleaned_data <-> na.omit> (data)> # Display the cleaned data> print> (cleaned_data)> |
Ieșire:
ID Value 1 1 5 2 2 NA 3 3 7 4 4 8 ID Value 1 1 5 3 3 7 4 4 8