Довірча та прогнозна смуги
Дові́рчу сму́гу[1] (англ. confidence band) використовують у статистичнім аналізі, щоби подавати невизначеність в оцінці кривої або функції, яка ґрунтується на обмежених або зашумлених даних. Подібним чином, прогно́зну сму́гу (англ. prediction band) використовують, щоби подавати невизначеність стосовно нової точки даних на кривій з урахуванням шуму. Довірчі та передбачувані смуги часто використовують як частину графічного подання результатів регресійного аналізу.
Довірчі смуги є тісно пов'язаними з довірчими інтервалами, які представляють невизначеність в оцінці єдиного чисельного значення. «Оскільки довірчі інтервали, за своєю побудовою, стосуються лише єдиної точки, вони є вужчими (в цій точці), аніж довірча смуга, яка повинна витримуватися одночасно в багатьох точках.»[2]
Поточкові та одночасні довірчі смуги
Припустімо, що ми маємо на меті оцінити функцію f(x). Наприклад, f(x) може бути часткою людей певного віку x, які підтримують заданого кандидата на виборах. Якщо x вимірюють із точністю до одного року, ми можемо побудувати окремий 95 %-вий довірчий інтервал для кожного віку. Кожен із цих довірчих інтервалів покриває відповідне істинне значення f(x) із рівнем довіри 0,95. Узяті разом, ці довірчі інтервали складають поточково 95 %-ву довірчу смугу (англ. 95% pointwise confidence band) для f(x).
Мовою математики, поточкова довірча смуга з імовірністю покриття 1 − α задовольняє наступну умову окремо для кожного значення x:
де є точковою оцінкою f(x).
Імовірністю одночасного покриття (англ. simultaneous coverage probability) набору довірчих інтервалів є ймовірність того, що вони всі покривають свої відповідні істинні значення одночасно. В наведенім вище прикладі ймовірність одночасного покриття є ймовірністю того, що всі інтервали для x = 18, 19, … покривають свої істинні значення (виходячи з того, що 18 є наймолодшим віком, з якого особа може голосувати). Якщо кожен з інтервалів окремо має ймовірність покриття 0,95, то ймовірність одночасного покриття є загалом меншою за 0,95. Одночасно 95 %-ва довірча смуга (англ. 95% simultaneous confidence band) є набором довірчих інтервалів для всіх значень x в області визначення f(x), побудованим таким чином, щоби мати ймовірність одночасного покриття 0,95.
Мовою математики, одночасна довірча смуга з імовірністю покриття 1 − α задовольняє наступну умову:
Майже в усіх випадках одночасна довірча смуга буде ширшою за поточкову довірчу смугу з такою ж імовірністю покриття. У визначенні поточкової довірчої смуги цей квантор загальності пересувається назовні функції ймовірності.
Довірчі смуги в регресійнім аналізі
Довірчі смуги зазвичай виникають в регресійнім аналізі.[3] У випадку простої регресії, що включає єдину незалежну змінну, результати може бути подано у вигляді графіку, що показує оцінену лінію регресії разом із або поточковою, або одночасною довірчою смугою. Широко вживаними методами побудови одночасних довірчих смуг у регресії є методи Бонферроні та Шеффе, докладніше див. процедури контролю групової ймовірності помилки першого роду.
Довірчі смуги для розподілів імовірності
Детальніші відомості з цієї теми ви можете знайти в статті Непараметричний довірчий інтервал на основі ФРІ.
Довірчі смуги можливо будувати навколо оцінок емпіричної функції розподілу. Проста теорія дозволяє будувати поточкові довірчі інтервали, але можливо також будувати й одночасну довірчу смугу для функції розподілу ймовірності як цілого, обертаючи критерій Колмогорова — Смирнова, або використовуючи непараметричні правдоподібнісні методи.[4]
Інші застосування довірчих смуг
Довірчі смуги виникають, коли статистичний аналіз зосереджується на оцінюванні функції.
Було також розроблено довірчі смуги для оцінок функцій густини, функцій спектральної густини,[5] функцій квантилів, згладжувань розсіювань, функцій виживаності та характеристичних функцій.[джерело?]
Прогнозні смуги
Прогнозні смуги пов'язано з прогнозними інтервалами[6] так само, як довірчі смуги пов'язано з довірчими інтервалами. Прогнозні смуги зазвичай виникають у регресійнім аналізі. Метою прогнозної смуги є покрити з приписаною ймовірністю значення одного або більше майбутніх спостережень з тієї ж генеральної сукупності, з якої було вибрано задані дані. Як і прогнозні інтервали є ширшими за довірчі інтервали, так і прогнозні смуги будуть ширшими за довірчі смуги.
Мовою математики, прогнозна смуга з імовірністю покриття 1 − α задовольняє наступну умову для кожного значення x:
де y* є спостереженням, узятим із процесу породжування даних у заданій точці x, що не залежить від даних, використаних для побудови точкової оцінки та довірчого[прояснити: ком.] інтервалу w(x). Це — поточковий прогнозний інтервал.[прояснити: ком.] Можливо було би побудувати й одночасний інтервал[прояснити: ком.] для скінченного числа незалежних спостережень, застосовуючи, наприклад, метод Бонферроні для розширювання інтервалу[прояснити: ком.] на відповідну величину.
Примітки
- Загородна, Н.; Фриз, М. (2011). Оцінка точності методу короткотермінового прогнозу добового газоспоживання в опалювальний період. Тернопільський національний технічний університет імені Івана Пулюя.
- p.65 in W. Härdle, M. Müller, S. Sperlich, A. Werwatz (2004), Nonparametric and Semiparametric Models, Springer, ISBN 3540207228 Archived copy. Архів оригіналу за 12 квітня 2013. Процитовано 6 лютого 2013., (англ.)
- Liu, W; Lin S.; Piegorsch W.W. (2008). Construction of Exact Simultaneous Confidence Bands for a Simple Linear Regression Model. International Statistical Review 1: 39–57. doi:10.1111/j.1751-5823.2007.00027.x. Проігноровано невідомий параметр
|doi-access=
(довідка) (англ.) - Owen, A. B. (1995). Nonparametric likelihood confidence bands for a distribution function. Journal of the American Statistical Association (American Statistical Association) 90 (430): 516–521. JSTOR 2291062. doi:10.2307/2291062. (англ.)
- Neumann, M.H.; Paparoditis, E. (2008). Simultaneous confidence bands in spectral density estimation. Biometrika 95 (2): 381. doi:10.1093/biomet/asn005. Проігноровано невідомий параметр
|citeseerx=
(довідка) (англ.) - Михайлов, В. С.; Полтавець, Л. Л. (2014). Підходи до статистичного прогнозування споживання енергетичних ресурсів. Статистика України (НДІ статистичних досліджень) (1).