Порівняння програмного забезпечення для оптичного розпізнавання символів

Це порівняння програмного забезпечення для порівняння оптичного розпізнавання символів включає:

  • Двигун OCR, який безпосередньо виконує ідентифікацію символів
  • Програмний код для аналізу зон, який ділить відсканований документ на зони, придатних для оптичного розпізнавання
  • Графічні інтерфейси до одного або декількох двигунів OCR
  • Комплекти розробки програмного забезпечення, які використовуються для додавання можливості розпізнавання в інше програмне забезпечення (наприклад, додатки для обробки форм, системи керування візуалізацією документів, системи електронного виявлення, записи рішень в галузі керування)
Sortable table
Назва Рік заснування Останній стабільний випуск Рік випуску Тип ліцензії Мережева версія Windows Mac OS X Linux BSD Мови програмування Наявний SDK Мови Шрифти Вихідні формати файлів Примітки
Tesseract19853.04.012016-02-16ApacheНіТакТакТакТакC++, CТак100+[1]?Text, hOCR,[2] PDF, інші, у залежності від різного користувацького мнтерфейсу[3] або APIСтворено компанією Hewlett-Packard; при подальшій розробці компанією Google[4]
Screenworm20131.02014власницькаНіНіТакНіНіObjective-C++Ні57?TXTПродукт компанії Funchip. Використовують OCR-двигун Tesseract.
ExperVision[5] TypeReader & RTK19877.1.170.11252010власницькаТакТакТакТакТакC/C++Так212618Має мобільну і вбудовану версії для системи на iOS/Android і інші.
AliusDoc AD-SCI[6]20052.12015власницькаНіТакНіНіНіVB.NetДля розширеньВсі мови, сумісні з ASCII?XML, PlainText, будь-які інші, завдяки розширеннямМінімальні потреби у післяпродажному Професійному Сервісі. Працює зі структурованими, напівструктурованими, і неструктурованими документами.
ABBYY FineReader1989142017-01-25власницькаТакТакТакТакТакC/C++Так192[7]?DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPUB, FB2[8]Компанія ABBYY також надає комплекти розробки програмного забезпечення для вбудованих та мобільних пристроїв. Професійна, Корпоративна та Ліцензія для Сайту версії випусків для Windows, Express Edition для Mac.[9]
e-Aksharayan 2010 Так Ні Так Ні 14 RTF, TXT, BRL
Asprise OCR SDK1998152015власницькаТакТакТакТакТакJava, C#,VB.NET, C/C++/DelphiТак20+[10]?звичайний txt, PDF з можливістю пошуку, XML[11]Java, C#, VB.NET, C/C++/Delphi SDK-ї для оптичного розпізнавання та зчитування Баркодів для систем на Windows, Linux, Mac OS X та Unix.[12]
Nicomsoft OCR SDK19995.52015власницькаНіТакНіТакНіC#, VB.NET, C++, Delphi, JavaТак25+[13]?PDF з можливістю пошуку, Text, RTFC#, VB.NET, C++, Delphi, Java засоби розпізнавання символів для Windows та Linux.[14]
AnyDoc Software1989??власницькаНіТакНіНіНіVBScript???Працює зі структурованими, напівструктурованими, і неструктурованими документами.
LEADTOOLS[15]1990[16]19.02014власницькаТакТакТакТакНіC/C++, .NET, Objective-C, Java, JavaScriptТак56[17]Будь-які друковані шрифтиPDF, PDF/A, DOC, DOCX, XLS, XPS, RTF, HTML, ANSI Text, Unicode Text, CSV[18]Підтримка Латинських, Азіатських, Арабських наборів символів і набори символів MICR.[15] Для повних сторінок, зональної обробки, та обробка заповнених формулярів. Включає розпізнавання символів, баркодів, Зчитування оптичних позначок та зчитування формулярів.[19] Підтримується розпізнавання рукописного тексту.[20]
CuneiForm19961.12011-04-19BSD варіантНіТакТакТакТакC/C++Так28Будь-які друковані шрифтиHTML, hOCR, native, RTF, TeX, TXT[21]Система корпоративного класу, може зберегти форматування тексту і розпізнає складні таблиці будь-якої структури
(a9t9)FreeOCR20151.0222015GPLТакТакНіНіНіC#Так23Будь-які друковані шрифтиTXTнастільне програмне забезпечення для Windows, додаток Windows Store і мережевий веб-додаток - перетворює відскановані документи в текстові документи придатні для редагування за допомогою OCR.
SimpleOCR20023.52008власницькаНіТакНіНіНі????
Dynamsoft OCR SDK20038.22012власницькаТакТакНіНіНіC/C++Так40+[22]?PDF, TXTDynamsoft є провідним постачальником SDK-їв для захоплення зображень і інструментів контролю версій.
OmniPage1970s19.22015власницькаТакТакТакНіНіC/C++, C#[23]Так125[24]Машинні та ручні друкарські шрифтиDOC/DOCX, XLS/XLSX, PPTX, RTF, PDF, PDF з можливістю пошуку, HTML, TXT, XML, ePUBПродукт компанії Nuance Communications
Microsoft Office OneNote 20072007?2007власницькаНіТакНіНіНі????
FreeOCR?4.2August 2012власницькаНіТакНіНіНі????[25]
GOCR20000.502013GPLТак[26]ТакТакТакТакC???
Ocrad?0.25[27]2015-04-16GPLТакТакТакТакТакC++ТакЛатинський алфавіт?Утиліта командного рядка
SmartScore???власницькаНіТакТакНіНі????Для музичних нот
Microsoft Office Document Imaging?Office 20072007власницькаНіТакНіНіНі????Використовується OmniPage[джерело?]
OCR.net 2016 ? 2016 власницька Так Ні Ні Ні Ні Java, C++, PHP, Objective-c Ні 100+ ? TXT, PDF з можливістю пошуку Мережевий сервіс, для перетворень використовує рушій PDF OCR X.[28]
PDF OCR X 2008 2.0.22 2016 власницька Ні Так Так Ні Ні Java, C++, Objective-C Ні 100+ ? TXT, PDF з можливістю пошуку Користувацький інтерфейс «drag and drop».
Puma.NET???BSDНіТакНіНіНіC#Так28Будь-які друковані шрифти.NET OCR SDK оснований на Когнітивних технологіях розпізнавального рушія CuneiForm. Оболонка Puma COM серверу і надається спрощеній API для .NET-застосунків
ReadSoft???власницькаНіТакНіНіНі????Сканування, захоплення і класифікація ділових-документів, таких як рахунки-фактури, форми і замовлення на поставку інтегрованих з бізнес-процесами.
Scantron???власницькаНіТакНіНіНі????Для роботи з локалізованим інтерфейсом, потрібна відповідна мовна підтримка.
OCRFeeder?0.7.112009GPLНіНіНіТакНіPython???Оснащена повноцінним користувацьким інтерфейсом, і має засоби для роботи із командного рядка для автоматичних операцій. Має власний алгоритм сегментації, але вікористовує поширені рушії розпізнавання, наприклад Tesseract або Ocrad
OCRopus20071.3.32017-12-16ApacheНіНіТакТакТакPython???hOCR, HTML, TXT[29]Підключуване середовище у стадії активної розробки, використовується у Google книги
MathOCR20140.0.32015GPLНіТакТакТакТакJava???HTML, LaTeXОснащений розпізнаванням математичних формул та логічним аналізом розташування, може використовувати такі рушії OCR, як Tesseract або Ocrad у фоні.
MeOCR20121.0.02012власницькаНіТакНіНіНіC/C++/C#Так28Будь-які друковані шрифтиHTML, hOCR, native, RTF, TeX, TXTWindows-застосунок. Перетворює відскановані докуменди в текстові документи, придатні для редагування завдяки розпізнаванню тексту, і може передавати результат до Microsoft Word-у в один клік. Оснащена повноцінним користувацьким інтерфейсом, а також має бібліотеку інтерфейсу .NET [30] для розробників.
Yunmai OCR SDK20021.02013власницькаТакТакТакТакТакJava, C++, C, object pascal, objective-CТак14Будь-яки друковані шрифтиTXT, PDFМає перевагу у розпізнаванні китайських символів.[31]
Anyline SDK 2013[32] 3.5.1[33] 2016[33] власницька Ні No* No* No* No* Java (Android), Objective-C & Swift (iOS), C# (Windows Phone, Xamarin), JavaScript (Cordova)[34] Yes[35] 2 (Німецька, Англійська) Будь-який друкований шрифт, який можна відтренувати для розпізнавання[36] звичайний txt, перевірені зображення *Настроюваний SDK для мобільного оптичного розпізнавання на системах Android, iOS, Windows Phone, Розумних окулярів (Google Glass, Epson Moverio,...)
Назва Рік заснування Останній стабільний випуск Рік випуску Тип ліцензії Мережева версія Windows Mac OS X Linux BSD Мови програмування Наявний SDK Мови Шрифти Вихідні формати файлів Примітки

Див. також

References

  1. Основано на підрахунку мовних тренувальних фалів для версії 3.04. Доступно на the download page.
  2. Використання пояснюється в Readme and FAQ
  3. Наприклад, у OCRFeeder — ODF
  4. GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository). Процитовано 8 березня 2016.
  5. OpenRTK – ExperVision OCR SDK | OCR Software, OCR SDK & Toolkit, OCR Service – ExperVision OCR. Expervision.com. Процитовано 12 вересня 2013.
  6. AliusDoc AD-SCI. AliusDoc.com. Архів оригіналу за 7 березня 2016. Процитовано 16 жовтня 2015.
  7. ABBYY FineReader 14: Technical Specifications. Finereader.abbyy.com. Процитовано 23 лютого 2017.
  8. ABBYY FineReader 11: Technical Specifications. Finereader.abbyy.com. Процитовано 12 вересня 2013.
  9. Top OCR Software. Ocrworld.com. 30 березня 2010. Процитовано 12 вересня 2013.
  10. Asprise OCR SDK Features. asprise.com. Процитовано 21 червня 2014.
  11. Asprise Java OCR Library Features. asprise.com. Процитовано 21 червня 2014.
  12. Asprise Java, C#/VB.NET OCR API. asprise.com. 19 листопада 2015. Процитовано 19 листопада 2015.
  13. Nicomsoft OCR SDK Features. nicomsoft.com. Процитовано 8 січня 2015.
  14. Nicomsoft OCR, C#/VB.NET OCR API. nicomsoft.com. 8 січня 2015. Процитовано 8 січня 2015.
  15. Ocr Sdk. Leadtools. Процитовано 12 вересня 2013.
  16. LEAD Technologies, Inc. Corporate Information. Leadtools.com. Процитовано 12 вересня 2013.
  17. Ocr Sdk. Leadtools. Процитовано 12 вересня 2013.
  18. OCR SDK Output Formats. Leadtools. Процитовано 12 вересня 2013.
  19. LEADTOOLS Recognition Imaging Developer Toolkit. Leadtools.com. Процитовано 12 вересня 2013.
  20. Icr Sdk. Leadtools. Процитовано 12 вересня 2013.
  21. Debian manual page for Cuneiform for Linux version 1.1.0
  22. OCR SDK Language Packages Download. Dynamsoft.com. Процитовано 12 вересня 2013.
  23. OmniPage CSDK - OCR Document Capture Toolkit | Document Imaging & OCR. Nuance. Архів оригіналу за 24 серпня 2010. Процитовано 12 вересня 2013.
  24. OmniPage Standard Document Conversion. Nuance. Архів оригіналу за 13 березня 2014. Процитовано 25 лютого 2014.
  25. Free OCR Software - Optical Character Recognition Software for Windows import from PDF and Twain Scanners. Paperfile.net. Процитовано 12 вересня 2013.
  26. GOCR. Jocr.sourceforge.net. Процитовано 12 вересня 2013.
  27. Diaz, Antonio (16 квітня 2015). GNU Ocrad 0.25 released. mailing list.
  28. PDF OCR X.
  29. OCRopus містить засоби ocropus-hocr, які формують hOCR із розпізнаного результату.
  30. MeOCR .NET Library.
  31. List of Yunmai OCR SDKs. yunmai.com. Процитовано 12 липня 2015.
  32. Company | Anyline. Anyline. 30 червня 2016. Процитовано 30 червня 2016.
  33. Release Notes Archives - ANYLINE. ANYLINE (амер.). Процитовано 30 червня 2016.
  34. API Reference. documentation.anyline.io. Процитовано 30 червня 2016.
  35. Fonts | Anyline. Anyline. 30 червня 2016. Процитовано 30 червня 2016.[недоступне посилання з липня 2019]
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.