Як розрахувати відхилення в статистиці

Зміст:

Anonim

Однією з найважливіших понять у статистиці є середня, або середнє арифметичне, набору чисел. Середнє значення означає центральне значення для набору даних. The дисперсія набору даних визначає, наскільки далеко поширюються елементи цього набору даних із середнього. Набори даних, в яких всі числа близькі до середнього, будуть мати низьку дисперсію. Ті множини, в яких числа набагато вищі або нижчі, ніж середнє, матимуть високу дисперсію.

Обчислити середнє значення набору даних

Розрахувати квадратичні відмінності

Наступний крок передбачає обчислення різниці між кожним елементом у наборі даних та середнім значенням. Оскільки деякі елементи будуть вищими, ніж середні, а деякі будуть нижчими, розрахунок відхилень використовує квадрат відмінностей.

День 1 Продаж - Середній обсяг продажів: $ 62,000 - $ 65414.29 = (- $ 3,414.29); (-3,414.29)2 = 11,657,346.94

День 2 Продаж - Середній обсяг продажів: $ 64 800 - $ 65414,29 = (- $ 614,29); (-614,29)2 = 377,346.94

День 3 Збут - Середні Збут: $ 62.600 - $ 65414.29 = (- $ 2.814.29); (-2,814.29)2 = 7,920,204.08

День 4 Продаж - Середній обсяг продажів: $ 69,200 - $ 65414,29 = (+ $ 3,785.71); (+3,785.71)2 = 14,331,632.65

День 5 Продаж - Середній обсяг продажів: $ 66 000 - $ 65414,29 = (+ $ 585,71); (+585,71)2 = 343,061.22

День 6 Збут - Середні Збут: $ 63.900 - $ 65414.29 = (- $ 1.514.29); (-1,514.29)2 = 2,293,061.22

День 7 Продаж - Середній обсяг продажів: $ 69,400 - $ 65414,29 = (+ $ 3,985.71); (+3 985,71)2 = 15,885,918.37

ПРИМІТКА: Квадратні відмінності не вимірюються в доларах. Ці числа використовуються на наступному етапі для розрахунку дисперсії.

Дисперсія і стандартне відхилення

Дисперсія визначається як середнє значення квадратичних відмінностей.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Оскільки дисперсія використовує квадрат різниці, квадратний корінь з дисперсії дасть більш чітку індикацію фактичного поширення. У статистиці квадратний корінь дисперсії називається стандартне відхилення.

SQRT (7,544,081.63) = $ 2,746.65

Використовується для відхилення та стандартного відхилення

Дисперсія і стандартне відхилення є дуже корисними для статистичного аналізу. Дисперсія вимірює загальний розкид набору даних із середнього. Стандартне відхилення допомагає у виявленні викидиабо елементи набору даних, які надто далеко від середнього.

У наборі даних вище відхилення досить високе, і лише два щоденні обсяги продажів сягають $ 1000 середнього. Набір даних також показує, що два з семи щоденних обсягів продажів є більш ніж одним стандартним відхиленням вище середнього, тоді як два інших - більше одного стандартного відхилення нижче середнього.