Rでna.omitを使用するには?
欠損値とは何ですか?
データ分析では、欠損値とは、特定の変数または観測値のデータが存在しないことを指します。これらの欠損値は通常、特殊なシンボルまたはコードで表され、R やその他の多くのプログラミング言語では NA (使用不可) と表されることがよくあります。
Rのna.omit()関数
の na.omit()> で機能する R プログラミング言語 データ フレーム、行列、またはベクトルから欠損値 (NA) を削除するために使用されます。 na.omit という名前は、省略された NA を表します。この関数は、欠損値を含むデータセットを操作し、欠損データのある観測値を分析から除外したい場合に特に便利です。
構文:
na.省略(データ)
パラメータ:
データ: データ フレーム、行列、またはベクトルの指定された値のセット。
戻り値: NA省略後の値の範囲。
ベクトルから欠損値を削除する
R
# Create a vector with missing values> vector <-> c> (1, 2,> NA> , 4, 5)> vector> # Use na.omit() to remove missing values> cleaned_vector <-> na.omit> (vector)> # Display the cleaned vector> cleaned_vector> |
出力:
[1] 1 2 NA 4 5 [1] 1 2 4 5
からの欠損値の削除 マトリックス
R
# Create a matrix with missing values> mat <-> c> (> NA> ,1,2,> NA> ,3,4,> NA> ,5,6,> NA> ,7,8)> var <-> matrix> (mat,3,4)> var> # Use na.omit() to remove missing values> na.omit> (var)> |
出力:
[,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 1 3 5 7 [3,] 2 4 6 8 [,1] [,2] [,3] [,4] [1,] 1 3 5 7 [2,] 2 4 6 8
からの欠損値の削除 データフレーム
R
# Create a data frame with missing values> data <-> data.frame> (> > ID => c> (1, 2, 3, 4),> > Value => c> (5,> NA> , 7, 8)> )> data> # Use na.omit() to remove rows with missing values> cleaned_data <-> na.omit> (data)> # Display the cleaned data> print> (cleaned_data)> |
出力:
ID Value 1 1 5 2 2 NA 3 3 7 4 4 8 ID Value 1 1 5 3 3 7 4 4 8