R で標準偏差を求めるにはどうすればよいですか?

R で標準偏差を求めるにはどうすればよいですか?

この記事では、標準偏差を見つける方法について説明します。 R プログラミング言語 。標準偏差 R は、値の分散の尺度です。分散の平方根としても定義できます。

標本標準偏差の計算式:

s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

どこ、

  • s = サンプル標準偏差
  • N = エンティティの数
  • overline{x}= エンティティの平均

基本的に、R プログラミング言語で標準偏差を計算するには 2 つの異なる方法があり、両方について以下で説明します。

方法 1: 素朴なアプローチ

この標準偏差の計算方法では、R 言語で上記のサンプル標準偏差の標準公式を使用します。

例 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

出力:

[1]   25.53886 

例 2:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

出力:

[1] 2.676004 

方法 2: sd() を使用する

sd() 関数は標準偏差を返すために使用されます。

構文: sd(x, na.rm = FALSE)

パラメーター:

    x: 数値ベクトル、行列、またはデータ フレーム。na.rm: 欠損値は削除されますか?

戻る: x のサンプル標準偏差。

例 1:

R

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)>

出力:

[1] 25.53886 

例 2:

R

v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

出力:

[1] 23.52175 

例 3:

R

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

出力:

[1] 2.676004 

データ フレームの標準偏差を計算します。

両方の方法を使用してデータ フレームの標準偏差を計算できます。アヤメのデータセットを取得し、列ごとに標準偏差を計算します。

例 1:

R

data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)>

出力:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377 

適用関数を使用して、データ フレーム全体の標準偏差を計算することもできます。

R

# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)>

出力:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377 

iris データセットの列 1 ~ 4 (変数の測定値を含む数値列) は、上記のコードの式 iris[, 1:4] を使用して選択されます。

sd 関数は、apply 関数を使用して、iris データセットの選択したサブセットの各列 (2 でマーク) に適用されます。結果の標準偏差値は、各列の std_deviation ベクトルに保存されます。