MNIST (база даних)

База даних MNIST (скорочення від Mixed National Institute of Standards and Technology) — об'ємна база даних зразків рукописного написання цифр[1]. Є стандартом, запропонованим Національним інститутом стандартів і технологій США з метою калібрування і зіставлення методів розпізнавання зображень за допомогою машинного навчання, в першу чергу на основі штучних нейронних мереж[2][3]. База даних містить 60000 зображень для навчання і 10000 зображень для тестування.

Дані складаються з заздалегідь підготовлених прикладів зображень, отриманих з рукописних документів шляхом обробки чорно-білих зразків символів NIST розміром пікселів. Творці бази даних NIST, в свою чергу, використовували набір зразків з Бюро перепису населення США, до якого були додані ще тестові зразки, написані студентами американських університетів. Зразки з набору з NIST були нормалізовані, пройшли згладжування та приведення до напівтонового зображенню розміром пікселів.

Рекордні результати машинного розпізнавання на базі MNIST були досягнуті на згорткових нейронних мережах, рівень помилки був доведений до 0,23 %.

Результати обробки для різних систем

У таблиці наведені приклади результатів машинного навчання в різних системах класифікації зображень.

ТипСтруктураСпотворенняПопередня обробкаПомилка (%)
Лінійний класифікаторОднорівневий перцептронНіНі12.0
Лінійний класифікаторПопарний лінійний класифікаторНіВирівнювання7.6
Метод найближчих k-сусідівК-ПН з нелінійною деформацією (P2DHMDM)НіShiftable edges0.52
Метод градієнту підвищенняОбробка залишків на базі ознак ХаараНіОзнаки Хаара0.87
Нелінійний класифікатор40 PCA + квадратичний класифікаторНіНі3.3
Метод опорних векторівВіртуальна система опорних векторів, град-9 поли, 2-пікселя jitteredНіВирівнювання0.56
Нейронна мережа2-рівнева мережа 784-800-10НіНі1.6
Нейронна мережа2-рівнева мережа 784-800-10Пружні деформаціїНі0.7
Глибока нейронна мережа6-рівнева мережа 784-2500-2000-1500-1000-500-10Пружні деформаціїНі0.35
Згорткова нейронна мережа6-рівнева мережа 784-40-80-500-1000-2000-10НіРозширення даних для навчання0.31
Згорткова нейронна мережа6-рівнева мережа 784-50-100-500-1000-10-10НіРозширення даних для навчання0.27
Згорткова нейронна мережаАнсамбль з 35 CNN-мереж, 1-20-С-40-С-150-10Пружні деформаціїЗ нормалізацією0.23
Згорткова нейронна мережаАнсамбль з 5 CNN-мереж, 6-784-50-100-500-1000-10-10НіРозширення даних для навчання0.21

Примітки

  1. Слюсар, В.И. (2021). Тензорно-матричная версия LeNet5.. IV Міжнародна науково-практична конференція «Інтеграція інформаційних систем і інтелектуальних технологій в умовах трансформації інформаційного суспільства», що присвячена 50-ій річниці кафедри інформаційних систем та технологій, 21-22 жовтня 2021 р., Полтава: Полтавський державний аграрний університет.: 114–119. doi:10.32782/978-966-289-562-9. Процитовано 30 жовтня 2021.
  2. Support vector machines speed pattern recognition - Vision Systems Design. Vision Systems Design. Процитовано 17 серпня 2013.
  3. Gangaputra, Sachin. Handwritten digit database. Процитовано 17 серпня 2013.

Див. також

Джерела

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.