Статистичний бутстреп
Статистичний бутстреп (бутстреп, бутстреппінг, англ. bootstrap, bootstrapping) — практичний комп'ютерний метод визначення статистик імовірнісних розподілів, заснований на багаторазовій генерації виборок методом Монте-Карло на базі наявної вибірки[1]. Дозволяє просто і швидко оцінювати найрізноманітніші статистики (довірчі інтервали, дисперсію, кореляцію і так далі) для складних моделей.
Запропоновано в 1977 році Бредлі Ефроном (перша публікація належить до 1979 р.). Суть методу полягає в тому, щоб з наявної вибірки сформувати досить велику кількість (5-10 тис.) псевдовибірок, розмір кожної з яких збігається з вихідною, що складаються з випадкових комбінацій вихідного набору елементів (в результаті в одній псевдовиборці деякі вихідні елементи можуть зустрітися кілька разів, тоді як інші — відсутні), і для кожної отриманої псевдовибірки визначити значення аналізованих статистичних характеристик з метою вивчити їх розкид, стійкість, розподіл.
Поряд з методами «складаного ножа», перехресного затверджування та перестановочного тестування становить клас методів генерації повторної вибірки.
Примітки
- Архівована копія. Архів оригіналу за 12 липня 2012. Процитовано 4 січня 2015.
Література
- Bradley Efron. Bootstrap Methods: Another Look at the Jackknife // Annals of Statistics. — 1979. — Vol. 7, No 1. — P. 1-26.
Посилання
- Bootstrap tutorial from ICASSP 99 Tutorial from a signal processing perspective
- Bootstrap sampling tutorial using MS Excel
- Animations for bootstrapping i.i.d data by Yihui Xie using the R
- Bootstrapping tutorial