Копула

У статистиці копула або зв'язка використовується як загальний метод формулювання сукупного розподілу випадкових величин таким чином, що можна зобразити різні загальні типи залежності[1].

Основна ідея

Нехай і  — випадкові величини, функції розподілу імовірностей яких визначені на множинах та відповідно. Позначимо і-ту реалізацію j-ї випадкової величини як . Називатимемо функцію зростаючою за кожною зі змінних і , якщо для неї виконується така умова:

, коли ;

Визначимо підкопулу як двовимірну функцію двох змінних і , визначену на такій множині , що і , з областю значень , що задовольняє таким умовам:

  1. Обмеження знизу, тобто , якщо
  2. , якщо
  3. Зростання за кожною зі змінних.

Копула — це підкопула у разі, коли і . Саме на даному етапі можливо застосувати копули до моделювання спільних ймовірнісних розподілів, оскільки імовірність будь-якої випадкової величини також належить відрізку від нуля до одиниці.

Властивості зв'язок

  1. Обмеженість: .
  2. Для будь-якої зв'язки виконується нерівність (границя Фреше-Хефдинга, Frechet-Hoeffding): .
  3. Упорядкованість (домінування): зв'язка домінує над зв'язкою , якщо виконується .

Методи оцінки копул і вимірювання якості копула-моделей

Параметричні (MLE, IFM)

Цей клас методів припускає параметризацію як граничних розподілів, так і зв'язки. Якщо базовий підхід — метод найбільшої правдоподібності (англ. Maximum Likelihood Estimation) передбачає максимізацію функції правдоподібності одночасно за граничними розподілами і за зв'язкою, то метод «від маргіналів» (Inference for Margin — IFM) передбачає два етапи оцінки: спочатку — параметризація граничних розподілів, потім — копули.

Напівпараметричні (SP, CML)

Напівпараметричні методи також припускають двоетапну оцінку копули. Але на першому етапі замість оцінки граничних розподілів використовується емпіричний розподіл. На другому ж етапі відбувається параметрична оцінка копули. У роботі [Kim G., Silvapulle M., Silvapulle P. (2007)] показано, що напівпараметричний метод (SP — semi-parametric) дає більш ефективні і стійкі оцінки ніж параметричні методи у випадках, коли тип оцінюваного розподілу не відомий і, як наслідок, виникає загроза їхньої неправильної специфікації.

Непараметричні

Серед непараметричних методів оцінки копул можна виділити підходи на основі оцінки емпіричної копули і ядерних оцінок. Перший підхід передбачає оцінку функції розподілу емпіричної копули, що відображає кількість випадків, коли реалізації випадкових величин одночасно потрапили в обрану групу розбиття нескінченного ймовірнісного простору (докладніше див. [Nelsen (2006), p. 219]).

Критерії якості оцінки копули

Найпоширенішим критерієм вибору оптимальної копули є критерій на основі значення функції максимальної правдоподібності — критерії Акаіке (AI) і Шварца (BI). Наступними за частотою застосування є тести Колмогорова-Смирнова й Андерсона-Дарлінга. Третім є метод оцінки дистанції до емпіричної копули.

Границі Фреше для копули

Мінімальна копула — це нижня границя для всіх копул, тільки в двовимірному випадку відповідає строго негативній кореляції між випадковими величинами:

Максимальна копула — це верхня границя для всіх копул, відповідає строго позитивній кореляції між випадковими величинами:

Архімедові копули

Одна часткова проста форма копули:

де називають функцією-генератором. Такі копули називаються архімедовими. Кожна функція-генератор, що задовольняє наведеним нижче властивостям є основою для правильної копули:

Копула-добуток, також називана незалежною копулою, — це копула, що не має залежностей між змінними, її функція щільності завжди дорівнює одиниці.

Копула Клейтона (Clayton):

Для у копулі Клейтона випадкові величини статистично незалежні.

Підхід, заснований на функціях-генераторах, може бути розповсюджений для створення багатовимірних копул за допомогою простого додавання змінних.

Емпірична копула

При аналізі даних із невідомим розподілом, можна побудувати «емпіричну копулу» шляхом підбору згортки таким чином, щоб граничні розподіли вийшли рівномірними. Математично це можна записати так:

Число пар таких що

де x(і) і-та порядкова статистика x.

Застосування

Моделювання залежностей за допомогою копул широко використовується для оцінювання фінансових ризиків. Крім того, копули також застосовувалися до задач страхування життя як гнучкий інструмент, що дозволяє моделювати тривалість життя двох і більше осіб чи час до настання певної події.

Копули було успішно використано для формування бази даних для аналізу надійності мостів[2] і для різноманітних багатовимірних симуляцій моделей в цивільному, механічному машинобудуванні, а також будівництва у відкритому морі.

Джерела

  1. Nelsen, Roger B. (1999). An Introduction to Copulas. New York: Springer. ISBN 0387986235..
  2. Onken, A; Grünewälder, S; Munk, MH; Obermayer, K (2009). Analyzing Short-Term Noise Dependencies of Spike-Counts in Macaque Prefrontal Cortex Using Copulas and the Flashlight Transformation. У Aertsen, Ad. PLoS Computational Biology 5 (11): e1000577. PMC 2776173. PMID 19956759. doi:10.1371/journal.pcbi.1000577.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.