Як знайти стандартне відхилення в R?

Як знайти стандартне відхилення в R?

У цій статті ми обговоримо, як знайти стандартне відхилення в Мова програмування R . Стандартне відхилення R є мірою дисперсії значень. Його також можна визначити як квадратний корінь з дисперсії.

Формула стандартного відхилення вибірки:

s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

де,

  • s = вибіркове стандартне відхилення
  • N = кількість об'єктів
  • overline{x}= Середнє значення сутностей

По суті, існує два різні способи обчислення стандартного відхилення мовою програмування R, обидва вони обговорюються нижче.

Спосіб 1: Наївний підхід

У цьому методі обчислення стандартного відхилення ми будемо використовувати наведену вище стандартну формулу стандартного відхилення вибірки мовою R.

Приклад 1:

Р

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Вихід:

[1]   25.53886 

приклад 2:

Р

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s)>

Вихід:

[1] 2.676004 

Спосіб 2: Використання sd()

Функція sd() використовується для повернення стандартного відхилення.

Синтаксис: sd(x, na.rm = FALSE)

Параметри:

    x: числовий вектор, матриця або кадр даних.na.rm: видалити відсутні значення?

Повернення: Вибіркове стандартне відхилення x.

Приклад 1:

Р

v <-> c> (12,24,74,32,14,29,84,56,67,41)> s <-> sd> (v)> print> (s)>

Вихід:

[1] 25.53886 

приклад 2:

Р

v <-> c> (71,48,98,65,45,27,39,61,50,24,17)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Вихід:

[1] 23.52175 

приклад 3:

Р

v <-> c> (1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1 <-> sqrt> (> sum> ((v-> mean> (v))^2/(> length> (v)-1)))> print> (s1)> s2 <-> sd> (v)> print> (s2)>

Вихід:

[1] 2.676004 

Обчисліть стандартне відхилення кадру даних:

Ми можемо обчислити стандартне відхилення кадру даних, використовуючи обидва методи. ми можемо взяти набір даних райдужної оболонки і для кожного стовпця ми обчислимо стандартне відхилення.

Приклад 1:

Р

data> (iris)> sd> (iris$Sepal.Length)> sd> (iris$Sepal.Width)> sd> (iris$Petal.Length)> sd> (iris$Petal.Width)>

Вихід:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377 

Ми також можемо обчислити стандартне відхилення для всього кадру даних разом за допомогою функції застосування.

Р

# Load the iris dataset> data> (iris)> # Calculate the standard deviation for each column> std_deviation <-> apply> (iris[, 1:4], 2, sd)> # Display the standard deviation values> print> (std_deviation)>

Вихід:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377 

Стовпці з 1 по 4 набору даних райдужки, які є числовими стовпцями, що містять змінні вимірювання, вибираються за допомогою виразу iris[, 1:4] у коді вище.

Функція sd застосовується до кожного стовпця (позначеного 2) вибраного підмножини набору даних райдужної оболонки за допомогою функції застосування. Отримані значення стандартного відхилення зберігаються у векторі std_deviation для кожного стовпця.