Коли ви зібрали дані про вашу систему або процес, наступним кроком є визначення того, який тип розподілу ймовірностей маєте. Типи розподілів ймовірностей: дискретні однорідні, Бернуллі, біноміальний, негативний біноміальний, пуассонівський, геометричний, безперервний рівномірний, нормальний (крива дзвоника), експоненціальний, гамма і бета розподіл. Звуження навіть декількох з переліку можливостей робить визначення, яке є найбільш близьким R квадратом, набагато швидше.
Елементи, які вам знадобляться
-
Графічне програмне забезпечення
-
Засоби обчислення величини R squared (аналіз найкращої відповідності)
Складіть дані для візуального представлення типу даних.
Одним з перших кроків для визначення того, який розподіл даних має один - і, отже, тип рівняння для моделювання даних - є виключення того, чого він не може бути. • Якщо є будь-які піки в наборі даних, це не може бути дискретним рівномірним розподілом. • Якщо дані мають більше одного піку, це не Пуассон або біном. • Якщо вона має єдину криву, немає вторинних піків, і має повільний нахил з кожної сторони, це може бути Пуассон або гамма-розподіл. Але це не може бути дискретним рівномірним розподілом. • Якщо дані рівномірно розподілені, і це без косою в бік однієї сторони, безпечно виключити гамма або розподіл Вейбулла. • Якщо функція має рівномірний розподіл або пік в середині результатів графіки, то це не є геометричним розподілом або експоненціальним розподілом. • Якщо фактор змінюється в залежності від змінної навколишнього середовища, він, ймовірно, не є розподілом Пуассона.
Після того як тип розподілу ймовірностей був звужений, виконайте R-квадратичний аналіз кожного можливого типу розподілу ймовірностей. Найбільш вірогідним є той, який має найвище значення R у квадраті.
Усуньте одну точку даних викидів. Потім перераховують R в квадраті. Якщо ж тип розподілу ймовірностей з'являється як найближче збіг, то існує висока впевненість, що це правильний розподіл ймовірностей для набору даних.
Поради
-
Якщо дані показують кілька піків широкого розкиду, то можливо, що відбуваються два окремі процеси або змішаний продукт, що відбирається. Згадайте дані, а потім повторно проаналізуйте.
Увага
Перевіряйте рівняння, створені для більш пізніх наборів даних, щоб підтвердити, що вони все ще є точними для набору даних. Можливо, що чинники навколишнього середовища та дрейф процесу зробили невірними поточні рівняння та моделі.