MNIST (база даних)
База даних MNIST (скорочення від Mixed National Institute of Standards and Technology) — об'ємна база даних зразків рукописного написання цифр[1]. Є стандартом, запропонованим Національним інститутом стандартів і технологій США з метою калібрування і зіставлення методів розпізнавання зображень за допомогою машинного навчання, в першу чергу на основі штучних нейронних мереж[2][3]. База даних містить 60000 зображень для навчання і 10000 зображень для тестування.
Дані складаються з заздалегідь підготовлених прикладів зображень, отриманих з рукописних документів шляхом обробки чорно-білих зразків символів NIST розміром пікселів. Творці бази даних NIST, в свою чергу, використовували набір зразків з Бюро перепису населення США, до якого були додані ще тестові зразки, написані студентами американських університетів. Зразки з набору з NIST були нормалізовані, пройшли згладжування та приведення до напівтонового зображенню розміром пікселів.
Рекордні результати машинного розпізнавання на базі MNIST були досягнуті на згорткових нейронних мережах, рівень помилки був доведений до 0,23 %.
Результати обробки для різних систем
У таблиці наведені приклади результатів машинного навчання в різних системах класифікації зображень.
Тип | Структура | Спотворення | Попередня обробка | Помилка (%) |
---|---|---|---|---|
Лінійний класифікатор | Однорівневий перцептрон | Ні | Ні | 12.0 |
Лінійний класифікатор | Попарний лінійний класифікатор | Ні | Вирівнювання | 7.6 |
Метод найближчих k-сусідів | К-ПН з нелінійною деформацією (P2DHMDM) | Ні | Shiftable edges | 0.52 |
Метод градієнту підвищення | Обробка залишків на базі ознак Хаара | Ні | Ознаки Хаара | 0.87 |
Нелінійний класифікатор | 40 PCA + квадратичний класифікатор | Ні | Ні | 3.3 |
Метод опорних векторів | Віртуальна система опорних векторів, град-9 поли, 2-пікселя jittered | Ні | Вирівнювання | 0.56 |
Нейронна мережа | 2-рівнева мережа 784-800-10 | Ні | Ні | 1.6 |
Нейронна мережа | 2-рівнева мережа 784-800-10 | Пружні деформації | Ні | 0.7 |
Глибока нейронна мережа | 6-рівнева мережа 784-2500-2000-1500-1000-500-10 | Пружні деформації | Ні | 0.35 |
Згорткова нейронна мережа | 6-рівнева мережа 784-40-80-500-1000-2000-10 | Ні | Розширення даних для навчання | 0.31 |
Згорткова нейронна мережа | 6-рівнева мережа 784-50-100-500-1000-10-10 | Ні | Розширення даних для навчання | 0.27 |
Згорткова нейронна мережа | Ансамбль з 35 CNN-мереж, 1-20-С-40-С-150-10 | Пружні деформації | З нормалізацією | 0.23 |
Згорткова нейронна мережа | Ансамбль з 5 CNN-мереж, 6-784-50-100-500-1000-10-10 | Ні | Розширення даних для навчання | 0.21 |
Примітки
- Слюсар, В.И. (2021). Тензорно-матричная версия LeNet5.. IV Міжнародна науково-практична конференція «Інтеграція інформаційних систем і інтелектуальних технологій в умовах трансформації інформаційного суспільства», що присвячена 50-ій річниці кафедри інформаційних систем та технологій, 21-22 жовтня 2021 р., Полтава: Полтавський державний аграрний університет.: 114–119. doi:10.32782/978-966-289-562-9. Процитовано 30 жовтня 2021.
- Support vector machines speed pattern recognition - Vision Systems Design. Vision Systems Design. Процитовано 17 серпня 2013.
- Gangaputra, Sachin. Handwritten digit database. Процитовано 17 серпня 2013.
Джерела
- MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges — Домашня сторінка бази даних
- Neural Net for Handwritten Digit Recognition in JavaScript — Реалізація нейронної мережі на JavaScript для розпізнавання цифр написаних від руки на основі бази MNIST