DBCS
Двоба́йтовий набі́р си́мволів або DBCS (англ. double-byte character set) - стандартна таблиця для кодування символів.
Термін має два базових значення:
- В ІТ індустрії Китаю, Японії, Кореї, термін «DBCS» зазвичай означає набір символів, в якому будь-який графічний символ, не представлений в SBCS (наборі однобайтних символів), закодований у двох байтах. Під графічними символами тут розуміються, в основному, ієрогліфи.
- Термін «DBCS» також означає набір символів, в якому всі символи (включаючи керуючі), закодовані в двох байтах.
Приклади DBCS кодування
- Розширення національного стандарту GBK. Це розширення доповнює національний «Промисловий стандарт GB», доповнений стандарт включає 20902 визначених у Unicode символів Хан і додаткові символи DBCS, визначені в коді Big-5 (стандарт де-факто традиційної китайської мови для ПК). Такий стандарт GBK містить всі символи DBCS, застосовувані в КНР і на Тайвані. В даний час GBK визнаний нормативним доповненням стандарту GB13000 (КНР стандарт Unicode) і розглядається як проміжна ланка для переходу до Unicode.
- IBM- eucTW. EUC для традиційного китайського мови - це кодовий набір, що складається з одно- , двох - і чотирьохбайтових символів. Дане кодування EUC заснована на стандарті ISO2022, стандарті CNS, визначеному в Китаї, і визначеннях мультибайтних символів, унікальних для виробника.
Стандарт CNS кодує 13501 символ китайської мови і 684 додаткових знаки. IBM-eucTW містить 15 кодових таблиць по 8836 ( 94x94 ) символів кожна. Кодові значення лежать в інтервалі 0xa1a1 - 0xfefe. В даний час тільки 4 таблиці кодують символи, а решта зарезервовані для використання в майбутньому.
- Двобайтні символи набору IBM-943[1]
Див. також
Примітки
- Кодовые наборы - Обзор(рос.)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.