КОІ-8
КОІ-8 (код обміну інформацією, 8 бітів; рос. КОИ-8) — восьмибітова ASCII-сумісна кодова таблиця, розроблена для кодування букв кириличних алфавітів.
Існує також семибітова версія кодування, не повністю сумісна з ASCII — КОІ-7. КОІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз нечинний).
Ідея
Розробники КОІ-8 помістили символи російського алфавіту у верхній частині кодової таблиці таким чином, що позиції кириличних символів відповідають їхнім фонетичним аналогам в англійському алфавіті, в нижній частині таблиці. Це означає, що якщо в тексті, закодованому КОІ-8, прибрати восьмий біт кожного символу, то вийде прочитний текст, хоча й записаний латинськими символами. Наприклад, слова «Русский Текст» перетворяться на «rUSSKIJ tEKST». Як наслідок, символи кирилиці в таблиці виявилися розташованими не в алфавітному порядку.
Існує декілька варіантів кодування КОІ-8 для різних кириличних алфавітів. Російський алфавіт описується в кодуванні KOI8-R, український — у KOI8-U. KOI8-R став фактично стандартом для російської кирилиці в юнікс-подібних операційних системах і електронній пошті.
Андрій Чернов створив документ RFC 1489 («Registration of а Cyrillic Character Set»), який, проте, не належить до категорії RFC-стандартів. Існує RFC 2319 на KOI8-U.
RFC-2319. Стандарт кодування української мови сформований у RFC. Створено ініціативною групою - Павло Гульчук, Юрко Демченко, Євген Шерстобітов, Борис Мостовий, Ігор Романенко, Олександр Єременко, Андрій Стесін.[1]
За набором символів KOI8-R відповідає одному з варіантів альтернативного кодування. Стандарт RFC 1489 також стверджує наявність графічних символів «рамок» (псевдографіки), проте ця вимога виконується досить рідко.
Нижня частина таблиці кодування (латиниця) повністю відповідає кодуванню ASCII.
Кодування KOI8-R (російське)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− |
─ 2500 |
│ 2502 |
┌ 250C |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258C |
▐ 2590 |
9− |
░ 2591 |
▒ 2592 |
▓ 2593 |
⌠ 2320 |
■ 25A0 |
∙ 2219 |
√ 221A |
≈ 2248 |
≤ 2264 |
≥ 2265 |
A0 |
⌡ 2321 |
° B0 |
² B2 |
· B7 |
÷ F7 |
A− |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
╓ 2553 |
╔ 2554 |
╕ 2555 |
╖ 2556 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
╜ 255C |
╝ 255D |
╞ 255E |
B− |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
╢ 2562 |
╣ 2563 |
╤ 2564 |
╥ 2565 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
╫ 256B |
╬ 256C |
© A9 |
C− |
ю 44E |
а 430 |
б 431 |
ц 446 |
д 434 |
е 435 |
ф 444 |
г 433 |
х 445 |
и 438 |
й 439 |
к 43A |
л 43B |
м 43C |
н 43D |
о 43E |
D− |
п 43F |
я 44F |
р 440 |
с 441 |
т 442 |
у 443 |
ж 436 |
в 432 |
ь 44C |
ы 44B |
з 437 |
ш 448 |
э 44D |
щ 449 |
ч 447 |
ъ 44A |
E− |
Ю 42E |
А 410 |
Б 411 |
Ц 426 |
Д 414 |
Е 415 |
Ф 424 |
Г 413 |
Х 425 |
И 418 |
Й 419 |
К 41A |
Л 41B |
М 41C |
Н 41D |
О 41E |
F− |
П 41F |
Я 42F |
Р 420 |
С 421 |
Т 422 |
У 423 |
Ж 416 |
В 412 |
Ь 42C |
Ы 42B |
З 417 |
Ш 428 |
Э 42D |
Щ 429 |
Ч 427 |
Ъ 42A |
Інші варіанти
показані лише неоднакові рядки таблиць, оскільки решта збігається
Кодування KOI8-U (українське)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
є 454 |
╔ 2554 |
і 456 |
ї 457 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
ґ 491 |
╝ 255D |
╞ 255E |
B− |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
Є 404 |
╣ 2563 |
І 406 |
Ї 407 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
Ґ 490 |
╬ 256C |
© A9 |
Кодування KOI8-RU (російсько-українсько-білоруське)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
є 454 |
╔ 2554 |
і 456 |
ї 457 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
ґ 491 |
ў 45E |
╞ 255E |
B− |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
Є 404 |
╣ 2563 |
І 406 |
Ї 407 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
Ґ 490 |
Ў 40E |
© A9 |
Кодування KOI8-C (кавказьке)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ғ 493 | җ 497 | қ 49B | ҝ 49D | ң 4A3 | ү 4AF | ұ 4B1 | ҳ 4B3 | ҷ 4B7 | ҹ 4B9 | һ 4BB | ▀ 2580 | ҝ 49D | ӣ 4E3 | ө 4E9 | ӯ 4EF |
9. | Ғ 492 | Җ 496 | Қ 49A | Ҝ 49C | Ң 4A2 | Ү 4AE | Ұ 4B0 | Ҳ 4B2 | Ҷ 4B6 | Ҹ 4B8 | Һ 4BA | ⌡ 2321 | Ә 4D8 | Ӣ 4E2 | Ө 4E8 | Ӯ 4EE |
A. | A0 | ђ 452 | ѓ 453 | ё 451 | є 454 | ѕ 455 | і 456 | ї 457 | ј 458 | љ 459 | њ 45A | ћ 45B | ќ 45C | ґ 491 | ў 45E | џ 45F |
B. | № 2116 | Ђ 402 | Ѓ 403 | Ё 401 | Є 404 | Ѕ 405 | І 406 | Ї 407 | Ј 408 | Љ 409 | Њ 40A | Ћ 40B | Ќ 40C | Ґ 490 | Ў 40E | Џ 40F |
Кодування KOI8-T (таджицьке)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | қ 49B | ғ 493 | ‚ 201A | Ғ 492 | „ 201E | … 2026 | † 2020 | ‡ 2021 | ‰ 2030 | ҳ 4B3 | ‹ 2039 | Ҳ 4B2 | ҷ 4B7 | Ҷ 4B6 | ||
9. | Қ 49A | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | ™ 2122 | › 203A | ||||||
A. | ӯ 4EF | Ӯ 4EE | ё 451 | ¤ A4 | ӣ 4E3 | ¦ A6 | § A7 | « AB | ¬ AC | AD | ® AE | |||||
B. | ° B0 | ± B1 | ² B2 | Ё 401 | Ӣ 4E2 | ¶ B6 | · B7 | № 2116 | » BB | © A9 |
Кодування KOI8-O, KOI8-C (старослов'янська орфографія)
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− |
Ђ 0402 |
Ѓ 0403 |
¸ 00B8 |
ѓ 0453 |
„ 201E |
… 2026 |
† 2020 |
§ 00A7 |
€ 20AC |
¨ 00A8 |
Љ 0409 |
‹ 2039 |
Њ 040A |
Ќ 040C |
Ћ 040B |
Џ 040F |
9− |
ђ 0452 |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
£ 00A3 |
· 00B7 |
љ 0459 |
› 203A |
њ 045A |
ќ 045C |
ћ 045B |
џ 045F |
A− |
00A0 |
ѵ 0475 |
ѣ 0463 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
® 00AE |
™ 2122 |
« 00AB |
ѳ 0473 |
ґ 0491 |
ў 045E |
´ 00B4 |
B− |
° 00B0 |
Ѵ 0474 |
Ѣ 0462 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
№ 2116 |
¢ 00A2 |
» 00BB |
Ѳ 0472 |
Ґ 0490 |
Ў 040E |
© 00A9 |
Кодування ISO-IR-111, koi8-e
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− |
00A0 |
ђ 0452 |
ѓ 0453 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
љ 0459 |
њ 045A |
ћ 045B |
ќ 045C |
00AD |
ў 045E |
џ 045F |
B− |
№ 2116 |
Ђ 0402 |
Ѓ 0403 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
Љ 0409 |
Њ 040A |
Ћ 040B |
Ќ 040C |
¤ 00A4 |
Ў 040E |
Џ 040F |
Кодування KOI8-Unified, koi8-f
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− |
─ 2500 |
│ 2502 |
┌ 250C |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258C |
▐ 2590 |
9− |
░ 2591 |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
© 00A9 |
™ 2122 |
00A0 |
» 00BB |
® 00AE |
« 00AB |
· 00B7 |
¤ 00A4 |
A− |
00A0 |
ђ 0452 |
ѓ 0453 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
љ 0459 |
њ 045A |
ћ 045B |
ќ 045C |
ґ 0491 |
ў 045E |
џ 045F |
B− |
№ 2116 |
Ђ 0402 |
Ѓ 0403 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
Љ 0409 |
Њ 040A |
Ћ 040B |
Ќ 040C |
Ґ 0490 |
Ў 040E |
Џ 040F |
Некириличні варіанти KOI-8
В деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама : при «зрізанні» восьмого біта текст мав лишатися більш-менш зрозумілим. Наприклад, в чеському варіанті КОІ-8 букви Čč повинні перетворюватися на cC, Žž — на zZ тощо. В наш час[коли?] ці кодування не використовуються.
Див. також
Примітки
- KOI8-U: Як це було. Архів оригіналу за 23 травня 2017. Процитовано 22 січня 2017.