Подвійний графік

Подвійний графік (англ. biplot) — тип пошукового графіка, який використовується в статистиці як узагальнення простих двох змінних діаграми розсіювання. Подвійний графік дозволяє інформації на обох зразках і змінних матриці даних відображатися в графічному вигляді. Зразки відображаються у вигляді точок, в той час як змінні відображаються або у вигляді векторів, лінійних осей або нелінійних траєкторій. У разі категоріальних змінних, точки категорії рівня можуть бути використані для подання рівнів категоріальної змінної. Узагальнений подвійний графік відображає інформацію про безперервні, категоріальні змінні.

Історія

Подвійний графік був введений К. Рубеном Гавриїлом (1971). Говер і Хенд (1996) написали монографію про подвійний графік. Ян і Кан (2003) описали різні методи, які можуть бути використані для того, щоб візуалізувати і інтерпретувати подвійний графік. Книга Грінакре (2010) являє собою практичне, орієнтоване на користувача, керівництво по подвійному графіку, а також за допомогою скриптів на мові програмування R, відкритим вихідним кодом для генерування подвійного графіку, пов'язаним з аналізом відповідності(АВ), багатовимірним шкалюванням (БШ), лінійним дискримінантним аналізом (ЛДА) -також відомий як спектральне відображення-аналіз дискримінанту (АД) і різні форми аналізу відповідності: простий аналіз відповідностей, багатовимірного аналізу відповідностей і канонічного аналізу відповідностей. Книга Гауер, Люббе і Ле Рокса (2011) має на меті популяризацію подвійного графіка як корисного і надійного методу для візуалізації багатовимірних даних, коли дослідники хочуть розглянути, наприклад, аналіз головних компонент, канонічних змінних аналіз або різні види аналізу відповідності.

Будування

Подвійний графік будується за допомогою сингулярного розкладу матриці(або СРМ), щоб отримати наближення низького рангу до перетвореної версії матриці даних X, чиї n-рядки це рядки вибірки (випадки, або об'єкти), і чиї р-стовпці є змінними. Перетворені матриці даних Y виходить з вихідної матриці X за допомогою центруючих і, необов'язково, стандартизацію стовпці (змінні). Використовуючи СРМ, ми можемо написати Y = k=1,…pdkukvkT;, де uk є n-мірні вектори-стовпці, vk є р-мірні вектори-стовпці, а dk є не зростаюча послідовність невід'ємних скаляр. Подвійний графік формується з двох діаграм розсіювання, які поділяють загальний набір осей і мають між-набір скалярную інтерпретацію продукту. Перша діаграма розсіювання формується з точок (d1αu1i,  d2αu2i), для i = 1,…,n. Друга ділянка формується з точок (d11−αv1j, d21−αv2j), for j = 1,…,p. Це подвійний графік, який формується домінуючими двома умовами СРМ, який потім може бути представлений ​​в двовимірному дисплеї. Типові варіанти вектора а це 1 (щоб дає відстань для відображення рядка) і 0 (щоб показати відстань для відображення стовпців), а в деяких рідкісних випадках α = 1/2, щоб отримати симетрично масштабуємий подвійний графік (що не дає ніякої відстані рядків або стовпців, але тільки показує скалярний добуток). Безліч точок, що зображують змінні можуть бути відображені у вигляді стрілок, щоб підкреслити думку про те, що вони представляють подвійний графік осі, на якому зразки можуть бути спроектовані для апроксимації вихідних даних.

Примітки


    Посилання

    • Gabriel, K.R. (1971). The biplot graphic display of matrices with application to principal component analysis. Biometrika 58 (3): 453–467. doi:10.1093/biomet/58.3.453.
    • Gower, J.C., Lubbe, S. and le Roux, N. (2010). Understanding Biplots. Wiley. ISBN 978-0-470-01255-0
    • Gower, J.C. and Hand, D.J (1996). Biplots. Chapman & Hall, London, UK. ISBN 0-412-71630-5
    • Yan, W. and Kang, M.S. (2003). GGE Biplot Analysis. CRC Press, Boca Raton, FL. ISBN 0-8493-1338-4
    • Demey, J.R., Vicente-Villardón, J.L., Galindo-Villardón, M.P. and Zambrano, A.Y. (2008). Identifying molecular markers associated with classification of genotypes by External Logistic Biplots. Bioinformatics. 24(24):2832–2838
    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.