Розмах (статистика)
Розмах (англ. range) — в статистиці різниця між найбільшим та найменшим із сукупності числових значень[1][2].
Розмах є однією з найпростіших мір розсіяння (розкиду) набору числових значень. Дає інформацію про ширину інтервалу, в якому зосереджений весь набір числових даних, геометрично — ширина відрізка, в якому розташовуються всі значення.
Простота розрахунку, наочність та інтуїтивна зрозумілість цієї характеристики розсіяння значень є очевидною перевагою перед такими мірами розсіяння як дисперсія та середнє квадратичне відхилення (стандартне відхилення). Істотним недоліком розмаху є те, що він не містить інформацію про характер розподілу результатів в інтервалі розсіяння та не стійкий до викидів, що певною мірою обмежує його використання.
Математичний опис
Математично розмах вибірки
,
де - відповідно максимальне та мінімальне значення із вибірки.
Розподіл ймовірностей
Оскільки розмах розраховується через крайні значення вибірки, які є випадковими величинами, він, як і будь-яка інша статистична характеристика, є випадковою величиною. Нехай — ряд значень вибірки з функцією розподілу та щільністю ймовірностей . В цьому випадку розмах описується функцією розподілу[3]:
- .
Розмах та середнє квадратичне відхилення
Якщо значення вибірки розподілені за нормальним законом, то математичне сподівання розмаху[2]
,
де — середнє квадратичне відхилення,
— деяка функція обсягу вибірки , яка табульована.
Таблиця. Граничні значення коефіцієнту в залежності від обсягу вибірки для ймовірності 0,95[2].
2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
---|---|---|---|---|---|---|---|---|---|
2,77 | 3,31 | 3,63 | 3,86 | 4,03 | 4,17 | 4,29 | 4,39 | 4,47 |
Отже, , що демонструє незміщеність оцінки . За невеликих значень () ця оцінка параметра має значну ефективність, однак за великих вона мало ефективна в порівнянні зі статистичною оцінкою середнього квадратичного відхилення ().
Практичне значення
Залежність використовується для отримання незміщеної оцінки середнього квадратичного відхилення у випадку малих вибірок в метрології, під час статистичного контролю якості на виробництві, статистичного керування процесами тощо.
Під час контролю технологічних процесів та контролю стабільності процесів вимірювання в лабораторіях широко використовуються як один із найекономічніших типів контрольних карт Шухарта контрольні карти розмахів.
Завдяки простоті розрахунку, наочності та зрозумілості розмах як міра розсіяння також широко використовується в описовій статистиці.
Див. також
Джерела
- О. І. Кушлик-Дивульська, Н. В. Поліщук, Б. П. Орел, П. І. Штабалюк. Теорія ймовірностей та математична статистика: навч. посіб. — К. : НТУУ "КПІ", 2014. — 212 с. — ISBN 978-966-622-654-2.
- Н. В. Смирнов, И. В. Дунин-Барковский. Курс теории вероятностей и математической статистики для технических приложений. — М. : "Наука", 1969. — 512 с.(рос.)
- Gumbel, E. J. (1947). The Distribution of the Range. The Annals of Mathematical Statistics 18 (3): 5142: 384–412. doi:10.1214/aoms/1177730387.(англ.)