Точність даних є одним з найважливіших міркувань при проведенні наукового або статистичного аналізу. Звичайно плутані з не менш важливою концепцією точності, аналогія з дартс-радою, сформульована Гавайським університетом, демонструє взаємозв'язок: точні дані в середньому дорівнюють рівним очікуваним результатам, в той час як точні точки даних зближуються, навіть якщо вони не близькі до очікуваних результатів. На думку Дартмутського коледжу, точність є вимірюванням відтворюваності набору результатів. Точність в наборах даних є важливою концепцією навіть у технологічних проектах, як показали Кеннет Е. Фут і Дональд Дж. Хюбнер з Університету Техасу-Остін в аналізі географічних інформаційних систем. Розрахунок точності є досить простим, хоча і дещо суб'єктивним.
Елементи, які вам знадобляться
-
Графічне представлення набору даних
-
Інформація про відповідні одиниці виражена в даних
-
Мінімально допустима межа помилки в експерименті
Розробити візуальне представлення точок даних, таких як діаграма розсіювання. Дуже просте візуальне представлення передбачає побудову відповідних залежних і незалежних значень змінної для кожної точки даних на декартовій системі координат.
Оцініть групування точок даних і шукайте шаблони. Точні дані відображаються в кластерах точок даних, що вказує, що подібні вхідні змінні корелюють з аналогічними вихідними змінними.
Застосовують інформацію про одиниці вимірювання, що використовуються для збору даних, для визначення середнього інтервалу між точками даних. Просте вимірювання лінійки можна використовувати для визначення відстані між точками на графіку, а потім перетворювати з використанням довільного, зручного масштабу, що відповідає одиницям вимірювань, що використовуються для генерації точок даних. Це дозволить розрахувати точність даних по відношенню один до одного, взявши середнє значення відстаней.
Порівняйте мінімальну похибку, дозволену в експерименті, і середню точність точок даних, щоб визначити відносну загальну точність експерименту. Різні типи експериментів матимуть більшу або меншу толерантність до помилок: інженерний проект, ймовірно, вимагатиме точності до дуже малих одиниць, тоді як соціальний експеримент, ймовірно, переносить більше відхилень.
Поради
-
Постарайтеся оцінити ймовірну шкалу одиниць, перш ніж створювати графічне зображення точок даних. Це полегшить візуальну оцінку точності, щоб визначити будь-які зони особливо помітної точності або неточності.
Чіткі схеми даних, що відбуваються на візуальному зображенні, дуже вказують на точність і повторюваність експерименту. Продовження експериментів має додати додаткові дані в точних кластерах, близьких до вже існуючих.
Увага
Не плутайте точність з точністю. Якщо метою експерименту є досягнення середньої вихідної величини віддачі для всіх входів, і це досягається за допомогою усереднених значень від -12 до 14, це навряд чи буде точним вимірюванням, хоча це може бути точним. Точне вимірювання може призвести до того, що всі точки даних кластеризуються близько 17, що буде неточним, але точним і тому передбачуваним.