Як розрахувати залишкову дисперсію

Зміст:

Anonim

Інвестори використовують моделі руху цін на активи, щоб передбачити, де ціна інвестиції буде в будь-який момент часу. Методи, які використовуються для створення цих прогнозів, є частиною поля статистики, відомої як регресійний аналіз. Розрахунок залишкова дисперсія набору значень - це інструмент регресійного аналізу, який вимірює, наскільки точно передбачення моделі збігається з фактичними значеннями.

Лінія регресії

The лінія регресії показує, як змінилося значення активу через зміни в різних змінних. Також відомий як a трендова лінія, лінія регресії відображає "тенденцію" ціни активу. Лінія регресії представлена ​​лінійним рівнянням:

Y = a + bX

де "Y" є значенням активу, "a" є константою, "b" - множником, а "X" є змінною, що відноситься до вартості активу.

Наприклад, якщо модель передбачає, що будинок з однією спальнею продається за $ 300,000, то будинок з двома спальнями продається за $ 400,000, а будинок з трьома спальнями продається за $ 500,000, лінія регресії буде виглядати так:

Y = 200,000 + 100,000X

де "Y" є ціною продажу будинку, а "X" - кількістю спалень.

Y = 200,000 + 100,000 (1) = 300,000

Y = 200,000 + 100,000 (2) = 400,000

Y = 200,000 + 100,000 (3) = 500,000

Діаграма розкиду

A Діаграма розкиду показує точки, які представляють фактичні кореляції між вартістю активу та змінною. Термін "діаграма розсіювання" виходить з того факту, що, коли ці точки нанесені на графік, вони, здається, "розкидані" навколо, а не лежать ідеально на лінії регресії. Використовуючи наведений вище приклад, ми можемо мати графік розсіювання з цими точками даних:

Пункт 1: 1BR продали за $ 288,000

Пункт 2: 1BR проданий за $ 315,000

Пункт 3: 2BR продали за $ 395,000

Пункт 4: 2BR продали за $ 410,000

Пункт 5: 3BR продали за $ 492,000

Пункт 6: 3BR продали за $ 507,000

Обчислення залишкових відхилень

Розрахунок залишкової дисперсії починається з сума квадратів відмінностей між вартістю активу на лінії регресії та кожної відповідної вартості активу на графіку розсіювання.

Тут показані квадрати відмінностей:

Пункт 1: $ 288,000 - $ 300,000 = (- $ 12,000); (-12,000)2 = 144,000,000

Пункт 2: $ 315 000 - $ 300 000 = (+ 15 000 доларів США); (+15,000)2 = 225,000,000

Пункт 3: $ 395,000 - $ 400,000 = (- $ 5000); (-5,000)2 = 25,000,000

Пункт 4: $ 410,000 - $ 400,000 = (+ $ 10,000); (+10,000)2 = 100,000,000

Пункт 5: $ 492,000 - $ 500,000 = (- $ 8,000); (-8,000)2 = 64,000,000

Пункт 6: $ 507,000 - $ 500,000 = (+ $ 7,000); (+7 000)2 = 49,000,000

Сума квадратів = 607,000,000

Залишкову дисперсію виявляють, приймаючи суму квадратів і ділячи на (n-2), де "n" - кількість точок даних на графіку розсіювання.

RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.

Використовується для залишкової дисперсії

Хоча кожна точка на діаграмі розсіювання не буде ідеально підходити до лінії регресії, стабільна модель буде мати точки розсіювання в регулярному розподілі навколо лінії регресії. Залишкова дисперсія також відома як "дисперсія помилки". Висока залишкова дисперсія показує, що лінія регресії у вихідній моделі може бути помилковою. Деякі функції електронних таблиць можуть показувати процес створення лінії регресії, що наближається до даних діаграми розсіювання.