Критерій узгодженості Пірсона

Критерій узгодженості Пірсона — один з найвідоміших критеріїв , тому його часто і називають просто «критерій хі-квадрат». Використовується для перевірки гіпотези про закон розподілу.

Ґрунтується на групованих даних. Область значень передбачуваного розподілу ділять на деяке число інтервалів.
Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей потрапляння в інтервали групування й емпіричних частот.

Нехай X=(X1,…, Xn) — вибірка з розподілу . Перевіряється проста гіпотеза проти складної альтернативи .
Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом .
Позначимо для j=1,…,k через число елементів вибірки, що потрапили в інтервал :
,

і через  — теоретичну ймовірність попадання в інтервал випадкової величини з розподілом .
З необхідністю, .
Як правило, довжини інтервалів вибирають так, щоб .
Нехай (1).

Зауваження

Якщо розподіл вибірки має такі ж, як в , імовірності попадання в кожний з інтервалів , то по даній функції ці розподіли розрізнити неможливо.
Тому насправді критерій, який ми побудуємо по функції з (1), вирішує зовсім інше завдання. А саме, нехай заданий набір імовірностей такий, що . Критерій призначений для перевірки складної гіпотези H2'={розподіл Х1 має властивість: Р(Х1 ∈ Аj)=pj для всіх j=1,…,k} проти складної альтернативи H2'={H1' невірна}, тобто H2'={хоча б для одного з інтервалів ймовірність P(X1 ∈ Аj) відізняється від pj}

Правило критерію

Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область.

Правило.
Якщо отримана статистика перевищує квантиль розподілу заданого рівня значимості з або з ступенями вільності, де k — число спостережень або число інтервалів (для випадку інтервального варіаційного ряду), а p — число оцінюваних параметрів закону розподілу, то гіпотеза відкидається. А якщо ні, то гіпотеза приймається на заданому рівні значимості .


Теорема Пірсона

Якщо вірна гіпотеза H1', то при фіксованому k й при :

де, нагадаємо, є -розподіл зі ступенем вільності.

Зауваження

Насправді критерій застосовують і для розв'язку первісного завдання про перевірку гіпотези . Необхідно тільки пам'ятати, що цей критерій не заможний для альтернатив з тими ж імовірностями попадання в інтервали розбиття, що й в . Тому беруть велику кількість інтервалів розбиття — чим більше, тим краще, щоб «зменшити» число альтернатив, нерозрізнених з передбачуваним розподілом.

Критерій Пірсона для перевірки параметричної гіпотези

Критерій часто застосовують для перевірки гіпотези про вид розподілу, тобто про приналежність розподілу вибірки деякому параметричному сімейству. Є вибірка з невідомого розподілу .
Перевіряється складна гіпотеза: ,

де  — невідомий параметр (скалярний або векторний), l- його розмірність.
Нехай розбите на k>lінтервалів , і  — число елементів вибірки, що потрапили в. Але ймовірність тепер залежить від невідомого параметра .
Функція відхилення (1) також залежить від невідомого параметра, і використовувати її в критерії Пірсона не можна — ми не можемо обчислити її значення: (2.)
Нехай - значення параметра , що доставляє мінімум функції при даній вибірці X .
Підставивши замість дійсних імовірностей pjїх оцінки , одержимо функцію відхилення:.

Див. також

Література

  • Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.


This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.