Квартет Анскомбе

Квартет Анскомбе складається з чотирьох послідовностей з ідентичними значеннями простих статистичних властивостей, але їхні графіки істотно відрізняються. Кожен набір складається з 11 пар чисел. Квартет було складено в 1973 році математиком Ф. Дж. Анскомбе для ілюстрації важливості застосування графіків для статистичного аналізу, та вплив крайніх значень на властивості набору даних.

Чотири набори даних мають ідентичні статистичні характеристики, але їх графіки істотно різняться.

Всі набори мають такі властивості:

Характеристика Значення
Середнє значення змінної x 9.0
Дисперсія змінної x 10.0
Середнє значення змінної y 7.5
Дисперсія змінної y 3.75
Кореляція між змінними x та y 0.816
Пряма лінійної регресії

Самі послідовності наведено нижче. Значення x однакові для перших трьох послідовностей.

Квартет Анскомбе
I II III IV
x y x y x y x y
10.08.0410.09.1410.07.468.06.58
8.06.958.08.148.06.778.05.76
13.07.5813.08.7413.012.748.07.71
9.08.819.08.779.07.118.08.84
11.08.3311.09.2611.07.818.08.47
14.09.9614.08.1014.08.848.07.04
6.07.246.06.136.06.088.05.25
4.04.264.03.104.05.3919.012.50
12.010.8412.09.1312.08.158.05.56
7.04.827.07.267.06.428.07.91
5.05.685.04.745.05.738.06.89


Див. також


Посилання

  • F.J. Anscombe, "Graphs in Statistical Analysis," American Statistician, 27 (February 1973), 17-21.
  • Tufte, Edward R. (2001). The Visual Display of Quantitative Information, 2nd Edition, Cheshire, CT: Graphics Press. ISBN 0-9613921-4-2
  • Sangit Chatterjee and Aykut Firat (2007). «Generating Data with Identical Statistics but Dissimilar Graphics: A Follow up to the Anscombe Dataset», American Statistician, 61(3), 248—254. doi:10.1198/000313007X220057
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.