R에서 na.omit를 사용하는 방법은 무엇입니까?

결측값이란 무엇입니까?

데이터 분석에서 결측값은 특정 변수나 관측값에 대한 데이터가 없음을 나타냅니다. 이러한 누락된 값은 일반적으로 R 및 기타 여러 프로그래밍 언어에서 NA(사용할 수 없음)로 표시되는 특수 기호나 코드로 표시됩니다.

R의 na.omit() 함수

그만큼 na.omit()> 기능하다 R 프로그래밍 언어 데이터 프레임, 행렬 또는 벡터에서 누락된 값(NA)을 제거하는 데 사용됩니다. na.omit이라는 이름은 생략 NA를 의미합니다. 이 함수는 결측값이 포함된 데이터 세트로 작업할 때 특히 유용하며 분석에서 결측 데이터가 있는 관측치를 제외하려고 합니다.

통사론:

na.생략(데이터)

매개변수:

데이터: 데이터 프레임, 행렬 또는 벡터의 지정된 값 집합입니다.

보고: NA 생략 후 값의 범위.

벡터에서 누락된 값 제거

아르 자형




# Create a vector with missing values> vector <-> c> (1, 2,> NA> , 4, 5)> vector> # Use na.omit() to remove missing values> cleaned_vector <-> na.omit> (vector)> # Display the cleaned vector> cleaned_vector>

산출:

[1] 1 2 NA 4 5  [1] 1 2 4 5 

누락된 값 제거 행렬

아르 자형




# Create a matrix with missing values> mat <-> c> (> NA> ,1,2,> NA> ,3,4,> NA> ,5,6,> NA> ,7,8)> var <-> matrix> (mat,3,4)> var> # Use na.omit() to remove missing values> na.omit> (var)>

산출:

 [,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 1 3 5 7 [3,] 2 4 6 8   [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8 

누락된 값 제거 데이터 프레임

아르 자형




# Create a data frame with missing values> data <-> data.frame> (> > ID => c> (1, 2, 3, 4),> > Value => c> (5,> NA> , 7, 8)> )> data> # Use na.omit() to remove rows with missing values> cleaned_data <-> na.omit> (data)> # Display the cleaned data> print> (cleaned_data)>

산출:

 ID Value 1 1 5 2 2 NA 3 3 7 4 4 8  ID Value 1 1 5 3 3 7 4 4 8