Відстань Махаланобіса
Відстань Махаланобіса — відстань у евклідовому просторі, що узагальнює поняття евклідової відстані. Визначається формулою:
де X, Y — вектори, S — матриця, T — позначає операцію транспонування. Відстань Махаланобіса використовується в багатовимірному статистичному аналізі, зокрема при перевірці гіпотез, класифікації спостережень і в кластерному аналізі. У цих застосуваннях S є коваріаційною матрицею деякого багатовимірного розподілу, що дозволяє визначити відстань між випадковими векторами із цього розподілу із врахуваннями кореляцій між компонентами. У випадку коли S — одинична матриця, відстань Махаланобіса збігається з евклідовою відстанню.
Поняття введено у 1936 році індійським статистиком П. Махаланобісом[1] який, при дослідженні подібності черепів, використовував як відстань між двома нормальними розподілами з математичними сподіваннями і і спільною коваріаційною матрицею величину .
Відстань Махаланобіса між двома вибірками (з розподілів з однаковими коваріаційними матрицями) або між вибіркою і розподілом визначається шляхом заміни відповідних теоретичних моментів вибірковими. Як оцінка відстані Махаланобіса між розподілами застосовується відстань Махаланобіса вибірок з них, а у разі використання лінійної дискримінантної функції — статистика , де — частота правильної класифікації в першій сукупності, — в другій, — функція нормального розподілу з математичним очікуванням 0 і дисперсією 1.
Примітки
- Mahalanobis, P C (1936). «On the generalised distance in statistics». Proceedings of the National Institute of Sciences of India 2 (1): 49-55. http://ir.isical.ac.in/dspace/handle/1/1268
Див. також
Література
- Айвазян С. А., Бежаева 3. И., Староверов О. В., Классификация многомерных наблюдений М.1974.
- Андерсон Т.,Введение в многомерный статистический анализ, пер. с англ. М., 1963;
- Махаланобиса расстояние, Математическая энциклопедия. В пяти томах. Том 3./ Под ред. И. М. Виноградова. М.: Советская энциклопедия