Тест Тьюкі адитивності
У статистиці, тест Тьюкі аддитивності[1], названий на честь Джона Тьюкі, є підходом, що використовується у двосторонній ANOVA (регресійний аналіз за участю двох якісних факторів), щоб оцінити, чи є змінні фактора адитивно пов'язаними з очікуваним значенням змінної відгуку. Він може застосовуватися, коли немає реплікації значень в наборі даних, ситуація, при якій неможливо безпосередньо оцінити повністю загальну неаддитивну структуру регресії і все ще мати інформацію для оцінки дисперсії помилки. Тестова статистика запропонована Тьюкі має одну ступінь свободи при нульовій гіпотезі, отже, його часто називають «тест Тьюкі з одним ступенем свободи».
Введення
Найбільш поширеним урегулюванням для теста Тьюкі адитивності є двосторонній факторний аналіз дисперсії (ANOVA) з одним спостереженням на клітинку. Змінна результату Yij спостерігалася в таблиці з рядками проіндексованими i = 1,…, m , а стовпці проіндексовані j = 1,…, n . Рядки та стовпці зазвичай відповідають різним типам і рівням обробки, які застосовуються в комбінації.
Адитивна модель стверджує, що очікуваний результат може бути виражений так: EYij = μ + αi + βj, де αi та βj невідомі константи. Невідомі параметри моделі, як правило, оцінюється як:
де Yi• — середнє i-того рядка таблиці даних, Y•j — середнє j-того стовпчика таблиці даних, Y•• є спільним середнім всієї таблиці.
Адитивну модель може бути узагальнено, щоб врахувати довільні ефекти взаємодії, встановивши EYij = μ + αi + βj + γij . Однак після установки природної оцінки γij :
Так, щоб він відповідав наступній величині:
Таким чином не залишилося степенів свободи для оцінки дисперсії σ2 і ніякої перевірки гіпотез про γij не може виконуватись.
Тому Тьюкі пропонує обмеженішу модель взаємодії у вигляді:
З перевіркою нульової гіпотези, що λ = 0 , ми можемо виявити деякі відхилення від адитивності на основі лише одного параметру λ .
Метод
Для проведення тесту Тьюкі, встановіть:
Потім використовуйте наступну статистику тестів[2]:
- .
При нульовій гіпотезі, статистика тестів має розподіл F =1, q степенів свободи, де q = mn − (m + n) є ступенями свободи для оцінки дисперсії помилки.
Див. також
Пимітки
- Tukey, John (1949). One degree of freedom for non-additivity. Biometrics 5 (3): 232–242. JSTOR 3001938. doi:10.2307/3001938.
- Alin, A. and Kurt, S. (2006). «Testing non-additivity (interaction) in two-way ANOVA tables with no replication». Statistical Methods in Medical Research 15, 63—85.
Джерела
- Критерий Тьюки-Крамера на www.machinelearning.ru (рос.)
- Харченко М. А. Теория статистического вывода: Учебное пособие для вузов. — Воронеж : Издательско-полиграфический центр Воронежского государственного университета, 2008. — 80 с. (PDF) (рос.)