R에서 na.omit를 사용하는 방법은 무엇입니까?
결측값이란 무엇입니까?
데이터 분석에서 결측값은 특정 변수나 관측값에 대한 데이터가 없음을 나타냅니다. 이러한 누락된 값은 일반적으로 R 및 기타 여러 프로그래밍 언어에서 NA(사용할 수 없음)로 표시되는 특수 기호나 코드로 표시됩니다.
R의 na.omit() 함수
그만큼 na.omit()> 기능하다 R 프로그래밍 언어 데이터 프레임, 행렬 또는 벡터에서 누락된 값(NA)을 제거하는 데 사용됩니다. na.omit이라는 이름은 생략 NA를 의미합니다. 이 함수는 결측값이 포함된 데이터 세트로 작업할 때 특히 유용하며 분석에서 결측 데이터가 있는 관측치를 제외하려고 합니다.
통사론:
na.생략(데이터)
매개변수:
데이터: 데이터 프레임, 행렬 또는 벡터의 지정된 값 집합입니다.
보고: NA 생략 후 값의 범위.
벡터에서 누락된 값 제거
아르 자형
# Create a vector with missing values> vector <-> c> (1, 2,> NA> , 4, 5)> vector> # Use na.omit() to remove missing values> cleaned_vector <-> na.omit> (vector)> # Display the cleaned vector> cleaned_vector> |
산출:
[1] 1 2 NA 4 5 [1] 1 2 4 5
누락된 값 제거 행렬
아르 자형
# Create a matrix with missing values> mat <-> c> (> NA> ,1,2,> NA> ,3,4,> NA> ,5,6,> NA> ,7,8)> var <-> matrix> (mat,3,4)> var> # Use na.omit() to remove missing values> na.omit> (var)> |
산출:
[,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 1 3 5 7 [3,] 2 4 6 8 [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8
누락된 값 제거 데이터 프레임
아르 자형
# Create a data frame with missing values> data <-> data.frame> (> > ID => c> (1, 2, 3, 4),> > Value => c> (5,> NA> , 7, 8)> )> data> # Use na.omit() to remove rows with missing values> cleaned_data <-> na.omit> (data)> # Display the cleaned data> print> (cleaned_data)> |
산출:
ID Value 1 1 5 2 2 NA 3 3 7 4 4 8 ID Value 1 1 5 3 3 7 4 4 8