Бінарне зображення
Бінарне зображення — це цифрове зображення, що має тільки два можливих значення кожного пікселя. Як правило, два кольори, що використовуються у бінарному зображенні: білий та чорний, хоча будь-які два кольори можуть бути використані. Колір, який використовується для об'єкта(ів) в зображенні є кольором переднього плану, в той час як інша частина зображення є кольором тла.[1] У сфері розпізнавання зображень це часто називають «двотональні зображення».
Глибина кольору |
---|
|
Пов'язані |
|
Бінарні зображення також називають дворівневими. Це означає, що кожен піксель зберігається у вигляді одиничного біту, тобто 0 або 1. Назви чорно-білий, B&W, монохромний або монохроматичний часто використовуються для цієї концепції, але також можуть позначати будь-які зображення, які мають лише один шаблон на кожен піксель, такі як зображення у відтінках сірого. На жаргоні користувачів Photoshop, бінарне зображення називається так само, як і зображення в режимі «Bitmap».[2]
Бінарні зображення часто зустрічаються при обробці цифрових зображень як масок або в результаті деяких операцій, таких як сегментація, корекція з використанням порогу та ефект побудови зображення з точок без їх розмивання (дитеринг). Деякі пристрої вводу/виводу, такі як лазерні принтери, факсимільні апарати, а також монохромні дисплеї, можуть обробляти тільки бінарні зображення.
Бінарне зображення може бути збережене в пам'яті у вигляді бітового масиву. Для зображень формату 640 × 480 потрібно 37.5 KiB пам'яті. Через невеликий розмір файлів зображень для факсів і документів, як правило, використовують цей формат. Більшість бінарних зображень також добре стискаються за допомогою простих схем стиснення по довжині прогону.
Бінарні зображення можна інтерпретувати як підмножини двовимірної цілочисельної ґратки Z2; розвиток морфологічна обробка зображень отримала розвиток завдяки такому підходу.
Операції над бінарними зображеннями
Цілий клас операцій над бінарними зображеннями оперує вікном зображення розміру 3 × 3. Воно містить дев'ять пікселів, отже, число можливих значень буде 512(=29). Беручи до уваги тільки центральний піксель можна визначити, залишається зображення укомплектованим чи ні, ґрунтуючись на сусідніх пікселях. Прикладами таких операцій є стискання, розширення, знаходження точок розгалуження і кінцевих точок, видалення окремих пікселів, зміщення зображення пікселів в будь-якому напрямку, і порушення Н-зв'язку (горизонтального). Гра Конвея Життя також є прикладом операцій над вікном 3×3.
Інший клас операцій заснований на понятті фільтрації за допомогою структурного елементу. Структурований елемент це бінарне зображення, як правило, невелике, яке передається через цільове зображення, аналогічним чином, як фільтр в відтінках сірої обробки зображень. Оскільки пікселі можуть мати тільки два значення, морфологічні операції ерозії (всі невстановлені пікселі в межах структурного елементу викликає те, що піксель може бути відключеним) і розтягування (всі набори пікселів в межах структурного елементу викликає те, що піксель повинен бути встановлений). Важливі операції морфологічного відкриття і закриття, які складаються з ерозії з подальшим розтягуванням і дилатації з подальшою ерозією, відповідно, з використанням того ж структурного елементу. Відкриття має тенденцію збільшення маленьких отворів, видалення дрібних об'єктів і окремих об'єктів. Закриття зберігає невеликі об'єкти, видаляє отвори, і з'єднує об'єкти.
Дуже важливою характеристикою бінарного зображення є відстань перетворення. Це дає відстань кожного набору пікселів від найближчого пікселя до відключеного. Відстань перетворення може бути ефективно обчислена. Це дозволяє ефективно обчислювати діаграми Вороного, де кожен піксель в зображенні призначається найближчому з множини точок. Вона також дозволяє робити скелетизацію, яка відрізняється від проріджування в тому, що скелети дозволяють відновлення вихідного зображення. Відстань перетворення також корисно для визначення центру об'єкта, а також для узгодження в розпізнавання образів.
Інший клас операцій збирає орієнтації вільних метрик. Це часто важливо в розпізнавання образів, де орієнтація камери повинна бути видалена. Орієнтація вільної метрики групи пов'язаних або в оточенні пікселів включають число Ейлера, периметр, площа, компактність, площа отворів, мінімальний та максимальний радіус.
Сегментування зображення
Бінарні зображення виробляються з кольорових зображень за допомогою сегментації. Сегментація є процесом присвоєння кожного пікселя в оригінальному документі для двох або більше класів. Якщо існує більше двох класів, то звичайний результат — кілька бінарних зображень. Найпростіша форма сегментації — метод Оцу, який призначає пікселі фону або переднього плану на основі півтонової інтенсивності. Інший метод це алгоритм вододілу. Виявляння контурів також часто створює бінарне зображення з деякими пікселями, привласнення контурів пікселям, а також є першим кроком у подальшій сегментації.
Скелети
Витончення або скелетування виробляє бінарні зображення, що складаються з ліній шириною у піксель. Кінцеві точки розгалуження потім можуть бути виокремлені, а зображення перетворюється в граф. Це важливий застосунок у розпізнаванні образів, зокрема, для оптичного розпізнавання символів.
Інтерпретація
Інтерпретація двійкового значення пікселя також залежить від пристрою. Деякі системи інтерпретують значення біта 0, як чорний і 1 у вигляді білого, в той час як інші навпаки. У стандартному інтерфейсі ПК TWAIN для сканерів і цифрових камер, для першого прижилась назва ваніль, а для протилежного йому — шоколад.
Змішування часто використовується для відображення напівтонових зображень.
Зображення захоплення датчика бінарних зображень
Передискретизація двійкових датчиків зображення являє собою новий датчик зображення, який нагадує традиційну фотоплівку. Кожен піксель в датчику має двійкову відповідь, даючи лише однобітне квантоване вимірювання інтенсивності локального світла.
Примітки
- Conversion of a Color Image to a Binary Image. CoderSource.net. 18 квітня 2005. Архів оригіналу за 10 червня 2008. Процитовано 11 червня 2008.
- Photoshop Fundamentals: Working With Different Color Modes.