Функція внеску

У статистиці вне́сок, фу́нкція вне́ску, або ефекти́вний вне́сок (англ. score, score function, efficient score,[1] informant[2]) показує, наскільки чутливо функція правдоподібності залежить від свого параметру . В явному вигляді внесок є градієнтом логарифмічної правдоподібності по відношенню до .

Внесок відіграє важливу роль у деяких аспектах висновування. Наприклад:

Функція внеску також відіграє важливу роль в обчислювальній статистиці, оскільки вона може грати певну роль в обчисленні оцінок максимальної правдоподібності.

Визначення

Функція внеску, або ефективний внесок,[1] — це градієнт (вектор часткових похідних) по відношенню до деякого параметру логарифму (зазвичай, натурального логарифму) функції правдоподібності (логарифмічної правдоподібності). Якщо спостереженням є , а його правдоподібністю є , то внесок може бути знайдено за допомогою ланцюгового правила:

Таким чином, внесок показує чутливість (її похідну, нормалізовану за її значенням). Зауважте, що є функцією від та спостереження , отже, взагалі кажучи, він не є статистикою. Проте в деяких застосуваннях, таких як перевірка внеску, внесок оцінюється на певному значення (такому як значення нульової гіпотези, або оцінка максимальної правдоподібності ), і в такому випадку результатом є статистика.

У старій літературі для позначення внеску по відношенню до нескінченно малого перенесення заданої густини може застосовуватися термін «лінійний внесок» (англ. linear score). Цей звичай походить з того часу, коли основним параметром, що становив інтерес, було середнє значення або медіана розподілу. В цьому випадку правдоподібність спостереження задається густиною вигляду . Тоді «лінійний внесок» визначається як

Властивості

Середнє значення

За деяких умов закономірності, математичне сподівання по відношенню до спостереження за умови істинності параметру , що записується як , є нульовим. Щоби побачити це, перепишімо функцію правдоподібності L як функцію густини ймовірності . Тоді

Якщо дотримуються певні умови диференційовності (див. Формула Лейбніца), то цей інтеграл може бути переписано як

Варто перевикласти отриманий вище результат словами: математичне сподівання внеску є нульовим. Таким чином, якщо потрібно було повторювано брати проби з деякого розподілу, і повторювано обчислювати внесок, то при наближенні числа повторюваних проб до нескінченності середнє значення цих внесків прямуватиме до нуля.

Дисперсія

Дисперсія внеску відома як інформація за Фішером, і записується як . Оскільки математичне сподівання внеску є нульовим, її може бути записано як

Зауважте, що визначена таким чином інформація за Фішером не є функцією будь-якого конкретного спостереження, оскільки випадкову змінну було усереднено. Це поняття інформації є корисним при порівнянні двох методів спостереження деякого випадкового процесу.

Приклади

Процес Бернуллі

Розгляньмо процес Бернуллі з A успіхами та B невдачами; ймовірністю успіху є θ.

Тоді правдоподібністю L є

таким чином, внеском V є

Тепер ми можемо перевірити, що математичне сподівання внеску є нульовим. Зауважуючи, що математичним сподіванням A є nθ, а математичним сподіванням B є n(1  θ) [пригадаймо, що A та B є випадковими змінними], ми можемо побачити, що математичним сподіванням V є

Ми можемо також перевірити й дисперсію . Нам відомо, що A + B = n (таким чином, B = n  A), і що дисперсією A є nθ(1  θ), таким чином, дисперсією V є

Модель із двійковим виходом

Для моделей з двійковими виходами (Y = 1 або 0) внесок моделі може оцінюватися за допомогою логарифму передбачень

де p є ймовірністю в оцінюваній моделі, а S є внеском.[7]

Застосування

Внесковий алгоритм

Детальніші відомості з цієї теми ви можете знайти в статті Внесковий алгоритм.

Внесковий алгоритм (англ. scoring algorithm) — це ітеративний метод чисельного визначення статистичної оцінки максимальної правдоподібності.

Перевірка внеску

Детальніші відомості з цієї теми ви можете знайти в статті Перевірка внеску.

Див. також

Примітки

Література

  • Cox, D. R.; Hinkley, D. V. (1974). Theoretical Statistics. Chapman & Hall. ISBN 0-412-12420-3. (англ.)
  • Schervish, Mark J. (1995). Theory of Statistics. New York: Springer. Section 2.3.1. ISBN 0-387-94546-6. (англ.)
  • Chentsov, N.N. (2001). Informant. У Hazewinkel, Michiel. Encyclopedia of Mathematics. Springer. ISBN 978-1-55608-010-4. (англ.)
  • Steyerberg, E. W.; Vickers, A. J.; Cook, N. R.; Gerds, T.; Gonen, M.; Obuchowski, N.; Pencina, M. J.; Kattan, M. W. (2010). Assessing the performance of prediction models. A framework for traditional and novel measures. Epidemiology 21 (1): 128–138. doi:10.1097/EDE.0b013e3181c30fb2. (англ.)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.