Парадокс Ліндлі

Парадокс Ліндлі — це парадоксальна ситуація в статистиці, в якій Баєсові та частотні підходи до перевірки статистичних гіпотез дають різні результати для певного вибору апріорної ймовірності. Проблема розбіжностей між двома підходами була обговорена в підручнику Гарольда Джеффріса 1939 року;[1] він став відомий як парадокс Ліндлі після того, як Денніс Ліндлі назвав це неузгодження парадоксом у роботі 1957 року.[2]

Хоч це й іменується парадоксом, різні результати від Баєсових та частотних підходів пояснюються як використання їх для відповіді на принципово різні питання, а не фактичні розбіжності між двома методами.

Тим не менше, для великого класу приорітетів відмінності між частотним і Баєсовсим підходом обумовлені підтриманням рівня значущості: як навіть Ліндлі визнав, «теорія не виправдовує практику збереження фіксованого рівня значущості», і навіть «деякі Розрахунки професора Пірсона в обговоренні цього документа підкреслювали, яким чином рівень значущості повинен змінюватися з розміром вибірки, якщо б втрати та попередні імовірності були фіксовані.»[2] Фактично, якщо критичне значення разом з розміром вибірки зростає досить швидко, то розбіжність між частотним і Байєсовим підходами стає незначною, оскільки розмір вибірки збільшується.[3]

Опис парадоксу

Розглянемо результат деякого експерименту, з двома можливими поясненнями, гіпотез і , і деякий попередній розподіл , що вказує на невизначеність щодо того, яка гіпотеза є більш точною до врахування . Парадокс Ліндлі відбувається тоді, коли

  1. Результат є «значним» шляхом частого тесту , що надає достатньо доказів для відхилення , скажімо, на рівні 5 %, і
  2. Апостеріорна ймовірність даного є високою, що надає суттєві докази того, що в краще узгоджується з ніж .

Ці результати можуть виникати одночасно, коли дуже специфічний, а більш дифузний, і попередній розподіл не сильно сприяє тому чи іншому, як показано нижче.

Числовий приклад

Ми можемо проілюструвати парадокс Ліндлі з числовим прикладом. Уявіть собі певне місто, де за певний період народилося 49 581 хлопчик та 48 870 дівчат. Спостережувана пропорція від народження хлопчиків: 49,581 / 98,451 ≈ 0,5036. Ми припускаємо, що кількість чоловічих народжень є біноміальною змінною з параметром . Ми зацікавлені в тестуванні чи це 0,5 або якесь інше значення. Тобто наша нульова гіпотеза цє , а альтернативна цє .

Частотний підхід

Частотний підхід до тестування  — це обчислити p-значення, ймовірність спостереження за часткою хлопчиків принаймні такою ж великою як припускаючи, що є істинним. Оскільки кількість народжених дуже велика, ми можемо використовувати нормальне наближення для частки чоловічих народжень , з і , щоб обчислити

Ми б однаково здивувались б, якщо б ми бачили 49 581 жіночий пологів, тобто , тому частотна, як правило, виконує двосторонній тест, для якого буде р-значення . В обох випадках значення p нижче, ніж рівень значущості α, 5 %, тому частотний підхід відхиляє оскільки воно не погоджується зі спостереженими даними.

Баєсовий підхід

Припускаючи, що немає підстав висловлювати одну гіпотезу на користь іншої, байєсівський підхід буде встановлювати зв'язок між ймовірностями і рівномірний розподіл до під , а потім для обчислення Апостеріорної ймовірності використовуючи теорему Байєса,

Після спостереження хлопчиків з народжених, ми можемо обчислити апостеріорну ймовірність кожної гіпотези, використовуючи функцію ймовірностей для біноміальної змінної,

де , це бета-функція.

З цих значень ми знаходимо апостеріорну ймовірність , що сильно сприяє над . Обидва підходи — баєсові та частотні — виявляються конфліктними, і це є «парадокс».

Узгодження Баєсового і частотного підходів

Однак принаймні в прикладі Ліндлі, якщо взяти послідовність рівнів значимості αn, такими, що αn = n-k з k> ½, то задня ймовірність нуля збігається до 0, що відповідає відмові від null.[3] У цьому числовому прикладі, беручи k = ½, призводить до рівня значущості 0,00318, отже, частотна не відкидає нульову гіпотезу, яка приблизно узгоджується з байєсовим підходом.

Distribution of p under the null hypothesis, and the posterior distribution of p.

Якщо хтось використовує неінформативну апріорну і тестує гіпотезу, більш схожу з тим, що в частотному підході, парадокс зникає.

Наприклад, якщо ми обчислимо апостеріорний розподіл , використовуючи рівномірний попередній розподіл на (тобто ), ми знайшли

Якщо ми використовуємо це, щоб перевірити вірогідність того, що новонароджений, швидше буде хлопчиком ніж дівчинкою, тобто , ми знайшли

Іншими словами, це дуже ймовірно, що частка новонароджених хлопчиків вище 0,5. Жоден аналіз не дає оцінку розміру ефекту безпосередньо, але обидва можуть використовуватися для визначення, наприклад, якщо частка народжених хлопчиків, імовірно, перевищує певний поріг.

Відсутність фактичного парадоксу

Шаблон:No footnotes

Очевидна розбіжність між двома підходами обумовлена комбінацією факторів. По-перше, часто застосовується підхід над тестами без посилання на . Байєсівський підхід оцінюється як альтернатива , і вважає що спочатку він краще погоджується з спостереженнями. Це тому, що остання гіпотеза набагато більш дифузна, ніж може бути в будь-якому місці , що призводить до дуже низької апостеріорної вірогідності. Щоб зрозуміти, чому корисно розглянути дві гіпотези як генератори спостережень:

  • Під , ми обираємо , і запитайте, наскільки вірогідно, щоб побачити 49 581 хлопчик у 98 451 народженні.
  • Під , ми обираємо випадково з будь-якого місця в межах від 0 до 1, і поставити те саме питання.

Більшість можливих значень для під дуже погано підтримуються спостереженнями. По суті, очевидна розбіжність між методами не є розбіжністю зовсім, а лише двома різними твердженнями про те, як гіпотези відносяться до даних: Частотна знаходить що це погане пояснення спостереження. Баєсіан знаходить що це набагато краще пояснення спостереження, ніж . Співвідношення статі новонароджених становить неможливі 50/50 чоловіки/жінки, відповідно до частого тесту. Проте 50/50 краща апроксимація за більшість, але не за всі інші співвідношення. Гіпотеза буде набагато краще, ніж майже всі інші співвідношення, в тому числі

Шаблон:Disputed section

Наприклад, цей вибір гіпотез та попередніх імовірностей передбачає вислів: "якщо > 0.49 і < 0.51, то попередня ймовірність рівно 0,5 є 0,50 / 0,51 98 % ". Враховуючи таку сильну перевагу , легко зрозуміти, чому Баєсовий підхід сприяє перед лицем , навіть якщо спостерігається значення брехня далеко від 0,5. Відхилення понад 2 сигми від вважається значним у частому підході, але його значення виключається попереднім в Баєсовому підході.

Дивлячись на це іншим способом, ми можемо бачити, що попередній розподіл є по суті плоским з дельта-функцією в . Очевидно, це сумнівно. Фактично, якщо ви мали б малювати дійсні числа як безперервні, то було б більш логічним припустити, що було б неможливим, щоб будь-яке задане число було точно значення параметра, тобто ми повинні вважати P (theta = 0.5) = 0.

Більш реалістичний розподіл для в альтернативній гіпотезі виробляється менш несподіваний результат для позаду . Наприклад, якщо ми замінимо з , тобто максимальна оцінка правдоподібності для , апостеріорна вірогідність буде всього 0,07 в порівнянні з 0,93 за (Звичайно, реально не можна використовувати MLE як частину попереднього розповсюдження).

Недавні обговорення

Парадокс і досі є джерелом активних обговорень.[3][4][5][6]

Дивитися також

Примітки

  1. Джеффріс, Гарольд (1939). Теорія ймовірностей. Oxford University Press. MR 924.
  2. Ліндлі, Д.В. (1957). Статистичний парадокс. Biometrika 44 (1–2): 187–192. JSTOR 2333251. doi:10.1093/biomet/44.1-2.187.
  3. Нааман, Майкл (1 січня 2016). Майже певна перевірка гіпотез та вирішення парадоксу Джефріса-Ліндлі. Electronic Journal of Statistics (EN) 10 (1): 1526–1550. ISSN 1935-7524. doi:10.1214/16-EJS1146.
  4. Spanos, Aris (2013). Who should be afraid of the Jeffreys-Lindley paradox?. Philosophy of Science 80.1: 73–93. doi:10.1086/668875.
  5. Sprenger, Jan (2013). Testing a Precise Null Hypothesis: The Case of Lindley's Paradox. Philosophy of Science 80: 733–744. doi:10.1086/673730.
  6. Robert, Christian P (2014). On the Jeffreys-Lindley Paradox. Philosophy of Science 81.2: 216–232. doi:10.1086/675729.

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.