Статистичне висновування
Статисти́чне висно́вування (англ. statistical inference) — це процес застосування аналізу даних для встановлення властивостей розподілу ймовірностей, який лежить в їх основі.[1] Висновувальний статистичний аналіз робить висновки про властивості генеральної сукупності, наприклад, шляхом перевіряння гіпотез та отримування оцінок. Він виходить з припущення, що спостережувані дані є вибіркою з більшої сукупності.
Індуктивну статистику[2] (англ. inferential statistics) можливо протиставляти описовій статистиці. Описова статистика цікавиться виключно властивостями спостережуваних даних, і не спирається на припущення, що ці дані походять із більшої сукупності.
Передмова
Статистичне висновування створює висловлення про генеральну сукупність, використовуючи дані, вибрані з цієї сукупності за допомогою якогось виду відбору. Для заданої гіпотези про генеральну сукупність, про яку ми хочемо робити висновки, статистичне висновування складається з (по-перше) обирання статистичної моделі процесу, що породжує ці дані, та з (по-друге) виведення висловлень з цієї моделі.[джерело?]
Конісі та Кітагава стверджують, що «більшість задач статистичного висновування можливо розглядати як задачі, пов'язані зі статистичним моделюванням».[3] Стосовно цього Девід Кокс сказав, що «як саме здійснюється [цей] переклад із предметної задачі до статистичної моделі, є часто найкритичнішою частиною аналізу.»[4]
Висновком статистичного висновування є статистичне висловлення.[5] Деякими з поширених видів статистичних висловлень є наступні:
- точкова оцінка, тобто певне значення, що найкраще наближує деякий досліджуваний параметр;
- проміжкова оцінка, наприклад, довірчий проміжок (або множинна оцінка), тобто проміжок, побудований з використанням набору даних, вибраного з генеральної сукупності, так, що при повторюваному відборі таких наборів даних такі проміжки міститимуть істинне значення параметру з імовірністю на заданому довірчому рівні;
- імовірний проміжок, тобто множина значень, що містить, наприклад, 95% апостеріорного переконання;
- відхилення гіпотез;[lower-alpha 1]
- кластерування або класифікація точок даних на групи.
Моделі та припущення
Детальніші відомості з цієї теми ви можете знайти в статті Статистична модель та Статистичні припущення.
Статистичне висновування вимагає деяких припущень. Статисти́чна моде́ль є набором припущень стосовно породження спостережуваних даних, та схожих на них. Описи статистичних моделей зазвичай підкреслюють роль досліджуваних величин генеральних сукупностей, стосовно яких ми хочемо робити висновки.[6] Як підготовчий крок перед отриманням формальніших висновків, як правило, використовують описову статистику.[7]
Рівні моделей/припущень
Статистики розрізняють три рівні моделювальних припущень:
- Повністю параметричний: Розподіли ймовірностей, що описують процес породження даних, вважають повністю описаними сімейством розподілів імовірності, що включають лише обмежену кількість невідомих параметрів.[8] Наприклад, можна припустити, що розподіл значень генеральної сукупності є істинно нормальним, з невідомими середнім значенням та дисперсією, і що набори даних породжуються «простим» випадковим вибиранням. Широко застосовуваним та гнучким класом параметричних моделей є узагальнені лінійні моделі.
- Непараметричний: Припущення стосовно процесу, що породжує дані, є значно меншими, ніж у параметричній статистиці, й можуть бути мінімальними.[9] Наприклад, кожен безперервний розподіл імовірності має медіану, яку може бути оцінено з використанням медіани вибірки, або оцінки Ходжеса — Лемана — Сена, що має гарні властивості, коли дані походять з простого випадкового відбору.
- Напівпараметричний: Під цим терміном зазвичай мають на увазі припущення «посередині» між повністю параметричним та непараметричним підходами. Наприклад, можна припустити, що розподіл генеральної сукупності має скінченне середнє значення. Крім того, можна припустити, що рівень чутливості середнього значення в генеральній вибірці залежить істинно лінійним чином від деякої коваріати (параметричне припущення), але не робити жодного параметричного припущення, що описувало би дисперсію навколо цього середнього значення (тобто, про наявність або можливий вигляд будь-якої гетероскедастичності). Загальніше, напівпараметричні моделі часто можливо розділити на «структурну» складову, та складову «випадкової дисперсії». Одну складову обробляють параметрично, а іншу — непараметрично. Добре відома модель Кокса є набором напівпараметричних припущень.
Важливість чинності моделей/припущень
Якого б рівня припущення не робилися, правильно відкаліброване висновування в цілому вимагає, щоби ці припущення були правильними, тобто, щоби механізми породжування даних дійсно було вказано правильно.
Неправильні припущення про «просте» випадкове вибирання можуть зробити статистичне висновування нечинним. Наприклад, неправильне припущення про модель Кокса може в деяких випадках призвести до хибних висновків.[10] Неправильні припущення про нормальність в генеральній сукупності також позбавляють чинності деякі види висновування на основі регресії.[11] Використання будь-якої параметричної моделі розглядається скептично більшістю експертів у відборі вибірок з людських сукупностей: «більшість статистиків, що роблять вибірки, коли мають справу з довірчими проміжками взагалі, то обмежують себе твердженнями [про оцінки] на основі дуже великих вибірок, коли центральна гранична теорема гарантує, що [оцінки] матимуть розподіли, що є майже нормальними».[12] Зокрема, нормальний розподіл «був би абсолютно нереалістичним та катастрофічно нерозумним припущенням, якщо ми маємо справу з будь-яким типом економічної генеральної сукупності».[12] Тут центральна гранична теорема стверджує, що розподіл середнього значення вибірки «для дуже великих вибірок» є розподіленим приблизно нормально, якщо цей розподіл має не повільно спадний хвіст.
Наближені розподіли
Детальніші відомості з цієї теми ви можете знайти в статті Статистична відстань, Асимптотична теорія (статистика) та Теорія наближень.
Враховуючи труднощі визначення точних розподілів статистик вибірки, було розроблено багато методів їхнього наближення.
При скінченних вибірках результати наближення вимірюють, наскільки близько граничний розподіл наближається до розподілу вибірки статистики: наприклад, із 10 000 незалежними зразками нормальний розподіл наближається (з двома цифрами точності) до розподілу вибіркового середнього для багатьох популярних розподілів, згідно теореми Беррі — Ессена.[13] Тим не менше, для багатьох практичних цілей нормальне наближення дає добре наближення за наявності 10 (або більше) незалежних зразків, згідно із симуляційними дослідженнями та досвідом статистиків.[13] Після праці Колмогорова в 1950-х роках передова статистика використовує теорію наближень та функціональний аналіз для кількісного вираження похибки наближення. У цьому підході досліджується метрична геометрія розподілів ймовірностей; цей підхід виражає похибку наближення за допомогою, наприклад, розходження Кульбака — Лейблера, Брегманове розходження та відстані Хеллінгера.[14][15][16]
Для нескінченно великих вибірок граничний розподіл вибіркової статистики, якщо такий існує, описують граничні результати, такі як центральна гранична теорема. Граничні результати не є твердженнями про скінченні вибірки, і дійсно є недоречними для них.[17][18][19] Тим не менш, асимптотичну теорію граничних розподілів часто залучають для роботи зі скінченними вибірками. Наприклад, граничні результати часто залучають для обґрунтування узагальненого методу моментів та для використання узагальнених оцінювальних рівнянь, що є популярними в економетрії та біологічній статистиці. Величину різниці між граничним та істинним розподілами (формально, «похибку» апроксимації) може бути оцінено із застосуванням симуляції.[20] Евристичне застосування граничних результатів до скінченних вибірок є поширеною практикою в багатьох застосуваннях, особливо з моделями невисокої розмірності з логарифмічно угнутими правдоподібностями (такими як однопараметричні експоненційні сімейства).
Моделі на основі рандомізації
Детальніші відомості з цієї теми ви можете знайти в статті Випадкова вибірка та Випадкове призначення.
Для заданого набору даних, що було вироблено за планування з рандомізацією, розподіл рандомізації статистики (за нульової гіпотези) визначає оцінка пробної статистики для всіх планів, що може бути породжено цим плануванням з рандомізацією. У частотницькому висновуванні рандомізація дозволяє висновуванням ґрунтуватися на розподілі рандомізації, а не на суб'єктивній моделі, і це є особливо важливим у вибиранні для обстеження та плануванні експериментів.[21][22] Статистичне висновування із рандомізованих досліджень є також простішим і в багатьох інших ситуаціях.[23][24][25] Рандомізація є важливою і в баєсовім висновуванні: у вибиранні для обстеження застосування вибирання без повертання забезпечує взаємозамінність вибірки з генеральною сукупністю; в рандомізованих експериментах рандомізація гарантує припущення випадкової відсутності для інформації про коваріату.[26]
Об'єктивна рандомізація дозволяє правильні індуктивні процедури.[27][28][29][30][31] Багато статистиків віддають перевагу аналізу на основі рандомізації для даних, що було породжено чітко визначеними рандомізаційними процедурами.[32] (Тим не менше, правдою є й те, що в галузях науки із розвиненими теоретичними знаннями та керуванням експериментами рандомізовані експерименти можуть збільшувати витрати на експериментування без поліпшення якості висновків.[33][34]) Так само, результати рандомізованих експериментів рекомендуються провідними статистичними органами як такі, що можуть уможливлювати висновування з більшою надійністю, ніж спостережні дослідження тих самих явищ.[35] Тим не менше, добре спостережне дослідження може бути кращим за поганий рандомізований експеримент.
Статистичний аналіз рандомізованого експерименту може ґрунтуватися на схемі рандомізації, визначеній у протоколі експерименту, і не потребує суб'єктивної моделі.[36][22]
Проте, як би там не було, деякі гіпотези неможливо перевіряти із застосуванням об'єктивних статистичних моделей, що точно описують рандомізовані експерименти або випадкові вибірки. В деяких випадках такі рандомізовані дослідження є неекономічними або неетичними.
Аналіз рандомізованих експериментів на основі моделей
Стандартною практикою при аналізі даних з рандомізованих експериментів є посилатися на статистичну модель, наприклад, лінійну або логістичну.[37] Проте схема рандомізації направляє обирання статистичної моделі. Неможливо вибрати підхожу модель, не знаючи схеми рандомізації.[22] Ігноруючи протокол експерименту при аналізі даних з рандомізованих експериментів, можна отримати небезпечно оманливі результати; поширені помилки включають забування блокування, що використовується в експерименті, та сплутування повторюваних вимірювань на одній і тій же експериментальній одиниці з незалежними повторами обробки, застосовуваної до різних експериментальних одиниць.[38]
Безмодельне рандомізоване висновування
Безмодельні методики забезпечують доповнення до методів на основі моделей, які застосовують редукціоністські стратегії спрощування дійсності. Перші ж поєднують, розвивають, комбінують та тренують алгоритми динамічно, пристосовуючись до контекстних спорідненостей процесу, та навчаючись характеристик, притаманних спостереженням.[37][39]
Наприклад, безмодельна проста лінійна регресія ґрунтується або на
- випадковім плануванні, в якому пари спостережень є незалежними та однаково розподіленими (н. о. р.), або на
- детермінованім плануванні, в якому пари спостережень є детермінованими, але відповідні змінні відгуку є випадковими та незалежними зі спільним умовним розподілом, тобто, , що є незалежним від індексу .
В кожному з випадків безмодельне рандомізоване висновування для ознак спільного умовного розподілу покладається на певні умови регулярності, наприклад, функційної гладкості. Наприклад, безмодельне рандомізоване висновування для ознаки сукупності умовне середнє, , може бути послідовно оцінено через локальне усереднювання або локальне поліноміальне допасовування, за припущення, що є гладкою. Також, покладаючись на асимптотичну нормальність або перевибірку, ми можемо будувати довірчі проміжки для ознаки сукупності, в цьому випадку, умовного середнього .[40]
Парадигми висновування
Було засновано різні школи статистичного висновування. Ці школи, або «парадигми», не є взаємовиключними, і методи, що добре працюють за однієї парадигми, часто мають привабливі інтерпретації за інших парадигм.
Бандіопадхай та Форстер[41] описують чотири парадигми: «(I) класичні статистики або статистики похибок, (II) баєсові статистики, (III) статистики на основі правдоподібностей, та (IV) статистики на основі інформаційного критерію Акаіке». Огляд класичної (або частотницької) парадигми, баєсової парадигми, правдоподібницької парадигми, та парадигми на основі інформаційного критерію Акаіке наведено нижче.
Частотницьке висновування
Ця парадигма калібрує слушність висловлень шляхом розгляду (релевантного) повторюваного відбору з розподілу сукупності для вироблення наборів даних, подібних до наявного. Шляхом розгляду характеристик цього набору даних на повторюваних вибірках може бути отримано кількісну оцінку частотницьких властивостей статистичного висловлення, хоча на практиці таке кількісне оцінювання може бути складним завданням.
Приклади частотницького висновування
Частотницьке висновування, об'єктивність та теорія рішень
Однією з інтерпретацій частотницького висновування (або класичного висновування) є те, що воно є застосовним лише в термінах частотницької ймовірності, тобто в термінах повторюваних вибірок із генеральної сукупності. Проте підхід Неймана[42] розвиває ці процедури в термінах преекспериментальних імовірностей. Тобто, перш ніж приступати до експерименту, ухвалюють рішення про правило, як приходити до висновку, так що ймовірність бути правильними контролюється зручним чином: такій імовірності не потрібно мати частотницьку інтерпретацію, або інтерпретацію повторного відбору. На противагу, баєсове висновування працює в термінах умовних імовірностей (тобто ймовірностей, обумовлених спостережуваними даними), порівнюваних із відособленими (але обумовленими невідомими параметрами) ймовірностями, що застосовуються в частотницькому підході.
Частотницькі процедури перевірки значущості та довірчих проміжків може бути побудовано без врахування функцій корисності. Проте деякі елементи частотницьких статистик, такі як статистична теорія рішень, таки включають функції корисності.[джерело?] Зокрема, частотницькі розвитки оптимального висновування (такі як мінімально-дисперсійні незміщені оцінки або рівномірно найпотужніші критерії) використовують функції втрат, що відіграють роль (від'ємних) функцій корисності. Статистикам-теоретикам не потрібне явне вказання функцій втрат для доведення того, що статистична процедура володіє властивістю оптимальності.[43] Тим не менше, функції втрат часто є корисними для встановлення властивостей оптимальності: наприклад, медіанні незміщені оцінки є оптимальними за модульних функцій втрат, бо вони мінімізують очікувані втрати, а мінімально-квадратичні оцінки є оптимальними за квадратичних функцій втрат, бо вони мінімізують очікувані втрати.
Хоча статистики, що використовують частотницьке висновування, і повинні обирати для себе параметри, що їх цікавлять, та оцінки/критерії, які застосовувати, відсутність очевидно явних функцій корисності та апріорних розподілів посприяла тому, що частотницькі процедури стали широко розглядатися як «об'єктивні».[44]
Баєсове висновування
Баєсове числення описує міри переконання із застосуванням «мови» ймовірності; переконання є додатними, інтегруються в одиницю, та підкоряються аксіомам імовірності. Баєсове висновування використовує доступні апостеріорні переконання як основу для створення статистичних висловлень. Існує декілька різних обґрунтувань застосування баєсового підходу.
Приклади баєсового висновування
- Імовірний проміжок для проміжкового оцінювання
- Коефіцієнти Баєса для порівнювання моделей
Баєсове висновування, суб'єктивність та теорія рішень
Багато неформальних баєсових висновувань ґрунтуються на «інтуїтивно розумних» зведеннях апостеріорного. Наприклад, як такі може бути обґрунтовано апостеріорне середнє, медіану та моду, проміжки найвищої густини апостеріорного та коефіцієнти Баєса. І хоча в цьому типі висновування й не потрібно вказувати користувацьку функцію корисності, ці зведення всі залежать (певною мірою) від вказаних апріорних переконань, і загалом розглядаються як суб'єктивні висновки. (Було запропоновано методи побудови апріорного, що не вимагають зовнішнього введення, але їх ще не було повністю розроблено.)
Формально баєсове висновування калібрується із посиланням на явно вказану функцію корисності, або втрат; «правило Баєса» є таким, що максимізує очікувану корисність, усереднену над невизначеністю апостеріорного. Формальне баєсове висновування відтак автоматично пропонує оптимальні рішення в розумінні теорії рішень. При заданих припущеннях, даних та корисності баєсове висновування може бути зроблено практично для будь-якої задачі, хоча не кожному статистичному висновуванню потрібно мати баєсову інтерпретацію. Аналізи, що не є формально баєсовими, можуть бути (логічно) незв'язними; особливість баєсових процедур, що використовують коректні апріорні (тобто такі, що інтегруються до одиниці), полягає в тому, що вони гарантовано будуть зв'язними. Деякі прихильники баєсового висновування стверджують, що висновування мусить мати місце в цій теоретичній моделі рішень, і що баєсове висновування не повинне завершуватися оцінкою та узагальненням апостеріорних переконань.
Висновування на основі правдоподібності
Правдоподібництво підходить до статистики з використанням функції правдоподібності. Деякі правдоподібники відкидають висновування, розглядаючи статистику лише як обчислювання підтримки свідченнями. Інші, проте, пропонують висновування на основі функції правдоподібності, найвідомішим з яких є оцінювання максимальною правдоподібністю.
Висновування на основі інформаційного критерію Акаіке
Інформаційний критерій Акаіке (ІКА, англ. Akaike information criterion, AIC) — це оцінювач відносної якості статистичних моделей для заданого набору даних. Для заданого набору моделей для цих даних ІКА оцінює якість кожної з них, по відношенню до кожної іншої з цих моделей. Таким чином, ІКА забезпечує засоби обирання моделі.
ІКА ґрунтується на теорії інформації: він пропонує оцінку відносних втрат інформації при застосуванні заданої моделі для представлення процесу, що породив дані. (Роблячи це, він працює на компромісом між допасованістю моделі та її простотою.)
Мінімальна довжина опису
Принцип мінімальної довжини опису (МДО, англ. minimum description length, MDL) було розроблено з ідей із теорії інформації[45] та теорії колмогоровської складності.[46] Принцип МДО обирає статистичні моделі, що максимально стискають дані; висновування відбувається без розгляду «механізмів породження даних» або моделей ймовірності, що суперечать даним або є неспростовними, як це може робитися в частотницькому або баєсовому підходах.
Тим не менш, якщо «механізм породження даних» існує в реальності, то згідно шеннонівської теореми про кодування джерела він пропонує МДО-опис даних, в середньому та асимптотично.[47] В мінімізації довжини опису (або описової складності) оцінка МДО є подібною до оцінки максимальної правдоподібності та оцінки апостеріорного максимуму (з використанням баєсових апріорних з максимальною ентропією). Хоча МДО й уникає припущення, що ймовірнісна модель, що лежить в основі даних, є відомою, принцип МДО також може застосовуватися й без припущень, наприклад, що дані походять з незалежної вибірки.[47][48]
Принцип МДО застосовувався в комунікаційній теорії кодування в теорії інформації, в лінійній регресії[48] та добуванні даних.[46]
Виконання висновувальних процедур на основі МДО часто використовує методики та критерії з теорії складності обчислень.[49]
Фідуційне висновування
Фідуційне висновування було підходом до статистичного висновування на основі фідуційної ймовірності, відомої також як «фідуційний розподіл». У подальших працях цей підхід було названо недовизначеним, надзвичайно обмеженим у застосовності та навіть помилковим.[50][51] Хоча ця аргументація є такою ж, як і та, що показує,[52] що так званий розподіл довіри не є чинним розподілом імовірності, та, оскільки це не позбавило чинності застосування довірчих проміжків, воно не обов'язково позбавляє чинності висновки, отримувані з фідуційної аргументації. Було вчинено спробу повторно інтерпретувати ранні праці з фідуційної аргументації Фішера як окремий випадок теорії висновування із застосуванням верхніх та нижніх імовірностей.[53]
Структурне висновування
Розвиваючи ідеї Фішера та Пітмана з 1938 по 1939 рік,[54] Джордж Барнард розробив «структурне висновування» (англ. structural inference) або «центральне висновування» (англ. pivotal inference),[55] підхід, що використовує інваріантні ймовірності на групових сімействах (англ. group family). Барнард переформулював аргументацію, що стояла за фідуційним висновуванням, на обмеженому класі моделей, на якому «фідуційні» процедури були би добре визначеними та корисними.
Питання висновування
Наведені нижче питання зазвичай включаються до царини статистичного висновування.
- Статистичні припущення
- Статистична теорія рішень
- Теорія оцінювання
- Перевірка статистичних гіпотез
- Перегляд поглядів у статистиці
- Планування експериментів, дисперсійний аналіз та регресія
- Вибирання для обстеження
- Підсумовування статистичних даних
Історія
Найраніше з відомих застосувань статистичного висновування здійснив Аль-Кінді, арабський математик IX сторіччя, у своєму «Трактаті про дешифрування криптографічних повідомлень», праці про криптоаналіз та частотний аналіз.[56]
Див. також
- Алгоритмічне висновування
- Індукція (логіка)
- Неформальне висновування
- Пропорція генеральної сукупності
- Філософія статистики
- Передбачувальне висновування
- Інформаційна теорія поля
Зауваження
- За Пірсом прийняття означає, що запит на це питання припиняється на деякий час. У науці всі наукові теорії можуть підлягати перегляду
Примітки
- Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4 (англ.)
- Романчиков, В.І. (2007). Основи наукових досліджень. Навчальний посібник.. К.: Центр учбової літератури. с. 132.
- Konishi та Kitagawa, 2008, с. 75.
- Cox, 2006, с. 197.
- Statistical inference - Encyclopedia of Mathematics. www.encyclopediaofmath.org. Процитовано 23 січня 2019. (англ.)
- Cox, 2006, с. 2.
- Evans, Michael (2004). Probability and Statistics: The Science of Uncertainty. Freeman and Company. с. 267. ISBN 9780716747420. (англ.)
- Cox, 2006.
- van der Vaart, A.W. (1998) Asymptotic Statistics Cambridge University Press. ISBN 0-521-78450-6 (page 341) (англ.)
- Freedman, D.A. (2008) "Survival analysis: An Epidemiological hazard?". The American Statistician (2008) 62: 110-119. (Reprinted as Chapter 11 (pages 169–192) of Freedman (2010)). (англ.)
- Berk, R. (2003) Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11) Sage Publications. ISBN 0-7619-2904-5 (англ.)
- Brewer, Ken (2002). Combined Survey Sampling Inference: Weighing of Basu's Elephants. Hodder Arnold. с. 6. ISBN 978-0340692295. (англ.)
- Jörgen Hoffman-Jörgensen's Probability With a View Towards Statistics, Volume I. Page 399 (англ.)
- Le Cam, 1986.
- Erik Torgerson (1991) Comparison of Statistical Experiments, volume 36 of Encyclopedia of Mathematics. Cambridge University Press. (англ.)
- Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer. ISBN 978-0-387-73193-3. (англ.)
- Kolmogorov, 1963, С. 369: «Частотницький підхід, що ґрунтується на понятті граничної частоти при кількості проб, що прямує до нескінченності, не дозволяє обґрунтувати застосовність результатів теорії ймовірностей до практичних задач, в яких ми маємо справу зі скінченним числом проб».
- Le Cam, 1986, С. xiv: «Дійсно, граничні теореми „при n, що прямує до нескінченності“, є логічно позбавленими змісту про те, що відбувається за будь-якого конкретного n. Все, що вони можуть,— це запропонувати певні підходи, чия продуктивність повинна підлягати перевірці для випадків, що є під рукою.».
- Pfanzagl, 1994, «Вирішальний недолік асимптотичної теорії: Що ми очікуємо від асимптотичної теорії, це результати, які мають силу приблизно… Що асимптотична теорія може запропонувати, це граничні теореми.» (С. ix) «Що має значення для застосувань, це наближення, а не границі.» С. 188.
- Pfanzagl, 1994, «Беручи граничну теорему як приблизно істинну для великих розмірів вибірок, ми привносимо похибку, розмір якої є невідомим. […] Реалістичну інформацію про залишкові похибки можна отримувати з симуляцій.» С. ix.
- Neyman, J. (1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", Journal of the Royal Statistical Society, 97 (4), 557–625 JSTOR 2342192 (англ.)
- Hinkelmann та Kempthorne, 2008.
- ASA Guidelines for a first course in statistics for non-statisticians. (available at the ASA website) (англ.)
- David A. Freedman et alia's Statistics. (англ.)
- Moore, McCabe та Craig, 2015.
- Gelman A. et al. (2013). Bayesian Data Analysis (Chapman & Hall). (англ.)
- Peirce, 1877-1878.
- Peirce, 1883.
- Freedman, Pisani та Purves, 1978.
- David A. Freedman Statistical Models (англ.)
- Rao, C.R. (1997) Statistics and Truth: Putting Chance to Work, World Scientific. ISBN 981-02-3111-3 (англ.)
- Peirce; Freedman; Moore et al. (2015).[джерело?]
- Box, G.E.P. and Friends (2006) Improving Almost Anything: Ideas and Essays, Revised Edition, Wiley. ISBN 978-0-471-72755-2 (англ.)
- Cox, 2006, с. 196.
- ASA Guidelines for a first course in statistics for non-statisticians. (available at the ASA website)
- David A. Freedman et alia's Statistics.
- Moore et al. (2015).
- Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed. (англ.)
- Dinov, Ivo; Palanimalai, Selvam; Khare, Ashwini; Christou, Nicolas (2018). Randomization‐based statistical inference: A resampling and simulation infrastructure. Teaching Statistics 40 (2): 64–73. PMC 6155997. doi:10.1111/test.12156. (англ.)
- Hinkelmann та Kempthorne, 2008, Chapter 6.
- Tang, Ming; Gao, Chao; Goutman, Stephen; Kalinin, Alexandr; Mukherjee, Bhramar; Guan, Yuanfang; Dinov, Ivo (2019). Model-Based and Model-Free Techniques for Amyotrophic Lateral Sclerosis Diagnostic Prediction and Patient Clustering. Neuroinformatics 17 (3): 407–421. doi:10.1007/s12021-018-9406-9. (англ.)
- Politis, D.N. (2019). Model-free inference in statistics: how and why. IMS Bulletin 48. (англ.)
- Bandyopadhyay та Forster, 2011, Цитату взято зі вступу до книги (С.3). Див. також «Section III: Four Paradigms of Statistics»..
- Neyman, J. (1937). Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability. Philosophical Transactions of the Royal Society of London A 236 (767): 333–380. JSTOR 91337. doi:10.1098/rsta.1937.0005. (англ.)
- Pfanzagl, 1994, Preface.
- Little, Roderick J. (2006). Calibrated Bayes: A Bayes/Frequentist Roadmap. The American Statistician 60 (3): 213–223. ISSN 0003-1305. JSTOR 27643780. doi:10.1198/000313006X117837. (англ.)
- Soofi, 2000.
- Hansen та Yu, 2001.
- Hansen та Yu, 2001, с. 747.
- Rissanen, 1989, с. 84.
- Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988) (англ.)
- Neyman, 1956.
- Zabell, 1992.
- Cox, 2006, с. 66.
- Hampel, 2003.
- Davison, С. 12. (англ.)
- Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. JSTOR 1403482 (англ.)
- Broemeling, Lyle D. (1 листопада 2011). An Account of Early Statistical Inference in Arab Cryptology. The American Statistician 65 (4): 255–257. doi:10.1198/tas.2011.10191. (англ.)
Джерела
- Bandyopadhyay, P. S.; Forster, M. R., ред. (2011). Philosophy of Statistics. Elsevier. (англ.)
- Bickel, Peter J.; Doksum, Kjell A. (2001). Mathematical statistics: Basic and selected topics 1 (вид. Second (updated printing 2007)). Prentice Hall. ISBN 978-0-13-850363-5. MR 443141. (англ.)
- Cox, D. R. (2006). Principles of Statistical Inference. Cambridge University Press. ISBN 0-521-68567-2. (англ.)
- Fisher, R. A. (1955), "Statistical methods and scientific induction", Journal of the Royal Statistical Society, Series B, 17, 69—78. (criticism of statistical theories of Jerzy Neyman and Abraham Wald) (англ.)
- Freedman, D. A. (2009). Statistical Models: Theory and practice (вид. revised). Cambridge University Press. с. xiv+442 pp. ISBN 978-0-521-74385-3. MR 2489600. (англ.)
- Freedman, D. A. (2010). Statistical Models and Causal Inferences: A Dialogue with the Social Sciences (Edited by David Collier, Jasjeet S. Sekhon, and Philip B. Stark), Cambridge University Press. (англ.)
- Hampel, Frank (Feb 2003). The proper fiducial argument (Research Report No. 114). Процитовано 29 березня 2016. (англ.)
- Hansen, Mark H.; Yu, Bin (June 2001). Model Selection and the Principle of Minimum Description Length: Review paper. Journal of the American Statistical Association 96 (454): 746–774. JSTOR 2670311. MR 1939352. doi:10.1198/016214501753168398. Архів оригіналу за 16 листопада 2004. Проігноровано невідомий параметр
|citeseerx=
(довідка) (англ.) - Hinkelmann, Klaus; Kempthorne, Oscar (2008). Introduction to Experimental Design (вид. Second). Wiley. ISBN 978-0-471-72756-9. (англ.)
- Kolmogorov, Andrei N. (1963). On tables of random numbers. Sankhyā Ser. A. 25: 369–375. MR 178484.
- Колмогоров А.Н. О таблицах случайных чисел. — Москва : ВИНИТИ, 1982. — Вип. 2. — С. 3-13. (рос.)
- Колмогоров А.Н. Теория информации и теория алгоритмов. — Москва : Наука, 1987. — С. 204-213. (рос.)
- Kolmogorov, Andrei N. (1998). On tables of random numbers. Theoretical Computer Science 207 (2): 387–395. MR 1643414. doi:10.1016/S0304-3975(98)00075-9. (англ.)
- Konishi, S.; Kitagawa, G (2008). Information Criteria and Statistical Modeling. Springer. (англ.)
- Kruskal, William (December 1988). Miracles and statistics: the casual assumption of independence (ASA Presidential Address). Journal of the American Statistical Association 83 (404): 929–940. JSTOR 2290117. doi:10.2307/2290117. (англ.)
- Le Cam, Lucian (1986). Asymptotic Methods of Statistical Decision Theory. Springer. ISBN 0-387-96307-3. (англ.)
- Moore, D. S.; McCabe, G. P.; Craig, B. A. (2015). Introduction to the Practice of Statistics (вид. VIII). Macmillan. (англ.)
- Neyman, Jerzy (1956). Note on an article by Sir Ronald Fisher. Journal of the Royal Statistical Society, Series B 18 (2): 288–294. JSTOR 2983716. (англ.) (відповідь на працю Фішера 1955 року)
- Peirce, C.S. (1877-1878). Illustrations of the logic of science (series). 12-13. Popular Science Monthly. (англ.) Відповідні окремі праці:
- (1878 March), "The Doctrine of Chances", Popular Science Monthly, v. 12, March issue, pp. 604–615. Internet Archive Eprint. (англ.)
- (1878 April), "The Probability of Induction", Popular Science Monthly, v. 12, pp. 705–718. Internet Archive Eprint. (англ.)
- (1878 June), "The Order of Nature", Popular Science Monthly, v. 13, pp. 203–217.Internet Archive Eprint. (англ.)
- (1878 August), "Deduction, Induction, and Hypothesis", Popular Science Monthly, v. 13, pp. 470–482. Internet Archive Eprint. (англ.)
- Peirce, C.S. (1883). A Theory of probable inference. Studies in Logic (Little, Brown, and Company): 126–181. (Передруковано 1983 року, John Benjamins Publishing Company, ISBN 90-272-3271-7) (англ.)
- Freedman, D.A; Pisani, R.; Purves, R.A. (1978). Statistics. New York: W.W. Norton, Inc.. (англ.)
- Pfanzagl, Johann; with the assistance of R. Hamböker (1994). Parametric Statistical Theory. Berlin: Walter de Gruyter. ISBN 978-3-11-013863-4. MR 1291393. (англ.)
- Rissanen, Jorma (1989). Stochastic Complexity in Statistical Inquiry. Series in Computer Science 15. Singapore: World Scientific. ISBN 978-9971-5-0859-3. MR 1082556. (англ.)
- Soofi, Ehsan S. (December 2000). Principal information-theoretic approaches (Vignettes for the Year 2000: Theory and Methods, ed. by George Casella). Journal of the American Statistical Association 95 (452): 1349–1353. JSTOR 2669786. MR 1825292. doi:10.1080/01621459.2000.10474346. (англ.)
- Traub, Joseph F.; Wasilkowski, G. W.; Wozniakowski, H. (1988). Information-Based Complexity. Academic Press. ISBN 978-0-12-697545-1. (англ.)
- Zabell, S. L. (Aug 1992). R. A. Fisher and Fiducial Argument. Statistical Science 7 (3): 369–387. JSTOR 2246073. doi:10.1214/ss/1177011233. (англ.)
Література
- Casella, G., Berger, R.L. (2002). Statistical Inference. Duxbury Press. ISBN 0-534-24312-6 (англ.)
- Freedman, D.A. (1991). Statistical models and shoe leather. Sociological Methodology 21: 291–313. JSTOR 270939. doi:10.2307/270939. (англ.)
- Held L., Bové D.S. (2014). Applied Statistical Inference—Likelihood and Bayes (Springer). (англ.)
- Lenhard, Johannes (2006). Models and Statistical Inference: the controversy between Fisher and Neyman–Pearson. British Journal for the Philosophy of Science 57: 69–91. doi:10.1093/bjps/axi152. (англ.)
- Lindley, D (1958). Fiducial distribution and Bayes' theorem. Journal of the Royal Statistical Society, Series B 20: 102–7. (англ.)
- Rahlf, Thomas (2014). "Statistical Inference", in Claude Diebolt, and Michael Haupert (eds.), "Handbook of Cliometrics ( Springer Reference Series)", Berlin/Heidelberg: Springer. http://www.springerreference.com/docs/html/chapterdbid/372458.html (англ.)
- Reid, N.; Cox, D. R. (2014). On Some Principles of Statistical Inference. International Statistical Review 83 (2): 293–308. doi:10.1111/insr.12067. (англ.)
- Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8 (англ.)
Посилання
- MIT OpenCourseWare: Statistical Inference (англ.)
- NPTEL Statistical Inference, посилання на YouTube (англ.)
- Statistical induction and prediction (англ.)