Кореляційний аналіз
Кореляційний аналіз — це статистичне дослідження (стохастичної) залежності між випадковими величинами (англ. correlation — взаємозв'язок). У найпростішому випадку досліджують дві вибірки (набори даних), у загальному — їх багатовимірні комплекси (групи).[1]
Мета кореляційного аналізу — виявити чи існує істотна залежність однієї змінної від інших.
Головні завдання кореляційного аналізу:
- оцінка за вибірковими даними коефіцієнтів кореляції
- перевірка значущості вибіркових коефіцієнтів кореляції або кореляційного відношення
- оцінка близькості виявленого зв'язку до лінійного
- побудова довірчого інтервалу для коефіцієнтів кореляції.
Обмеження кореляційного аналізу
Кореляція відображає лише лінійну залежність величин, але не відображає їх функціональної зв'язаності. Наприклад, якщо обчислити коефіцієнт кореляції між величинами A = sin(x) та B = cos(x), він буде наближений до нуля, тобто залежність між величинами відсутня. Між тим, величини А та В очевидно зв'язані між собою за законом sin²(x) + cos²(x) = 1.
Використання можливе у випадку наявності достатньої кількості випадків для вивчення: для конкретного типу коефіцієнту кореляції становить від 25 до 100 пар спостережень.
Кореляція не означає причинність.
Зноски
- Кореляційний аналіз Архівовано 4 січня 2015 у Wayback Machine. — Геостатистика (курс лекцій від Хом'яка М. М.)