Rでna.omitを使用するには?

欠損値とは何ですか?

データ分析では、欠損値とは、特定の変数または観測値のデータが存在しないことを指します。これらの欠損値は通常、特殊なシンボルまたはコードで表され、R やその他の多くのプログラミング言語では NA (使用不可) と表されることがよくあります。

Rのna.omit()関数

na.omit()> で機能する R プログラミング言語 データ フレーム、行列、またはベクトルから欠損値 (NA) を削除するために使用されます。 na.omit という名前は、省略された NA を表します。この関数は、欠損値を含むデータセットを操作し、欠損データのある観測値を分析から除外したい場合に特に便利です。

構文:

na.省略(データ)

パラメータ:

データ: データ フレーム、行列、またはベクトルの指定された値のセット。

戻り値: NA省略後の値の範囲。

ベクトルから欠損値を削除する

R




# Create a vector with missing values> vector <-> c> (1, 2,> NA> , 4, 5)> vector> # Use na.omit() to remove missing values> cleaned_vector <-> na.omit> (vector)> # Display the cleaned vector> cleaned_vector>

出力:

[1] 1 2 NA 4 5  [1] 1 2 4 5 

からの欠損値の削除 マトリックス

R




# Create a matrix with missing values> mat <-> c> (> NA> ,1,2,> NA> ,3,4,> NA> ,5,6,> NA> ,7,8)> var <-> matrix> (mat,3,4)> var> # Use na.omit() to remove missing values> na.omit> (var)>

出力:

 [,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 1 3 5 7 [3,] 2 4 6 8   [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8 

からの欠損値の削除 データフレーム

R




# Create a data frame with missing values> data <-> data.frame> (> > ID => c> (1, 2, 3, 4),> > Value => c> (5,> NA> , 7, 8)> )> data> # Use na.omit() to remove rows with missing values> cleaned_data <-> na.omit> (data)> # Display the cleaned data> print> (cleaned_data)>

出力:

 ID Value 1 1 5 2 2 NA 3 3 7 4 4 8  ID Value 1 1 5 3 3 7 4 4 8