ASCII
ASCII (МФА: [ˈæski], акронім від назви Американський стандартний код для інформаційного обміну, англ. American Standard Code for Information Interchange) в обчислювальній техніці — система кодів, у якій числа від 0 до 127 включно поставлені у відповідність літерам, цифрам і символам пунктуації. Наприклад, 45 відповідає знаку переносу, а 65 — літері «А» великій. Перші 32 коди використовуються для керівних функцій, на зразок введення і стирання попереднього символу. Власне, ASCII — це семибітний код, а восьмий біт часто використовується для забезпечення відповідності чи додаткових символів. Такий 8-бітний варіант коду називають розширеним ASCII.
Система широко використовується для зберігання тексту і передачі інформації між комп'ютерами.
Символи розширеного ASCII діапазону друку
|
|
|
Варто звернути увагу що великі і маленькі літери англійської абетки відрізняються лише одним третім бітом: літера "A" представлена у вигляді 0100 0001, а літера "a" у вигляді 0110 0001. Щоб змінити літеру "A" на літеру "a" треба лише змінити третій біт з 0 на 1. Це можна легко зробити провівши операцію побітового OR цієї літери із числом 0010 0000 (32). Зворотню операцію перетворення маленької літери в велику можна провести за допомогою операції побітового AND з числом 1101 1111 (223). Також можна легко перетворити символ цифри у число взявши чотири останні біти, наприклад символ "9" представлений у вигляді 0011 1001. Якщо взяти останні чотири біти, то вийде 1001, що дорівнює 9 у десятковій системі. Це можна зробити взявши залишок від ділення символу на 1 0000 (16).
Інші назви
Починаючи з липня 1992 реєстри RFC[1] та Internet Assigned Numbers Authority таблиць кодування[2] визнають такі еквівалентні назви ASCII незалежно від реєстру для використання в Інтернеті:
|
З цього переліку, IANA рекомендує використання «US-ASCII» для позначення ASCII в Інтернеті. Це позначення можна часто зустріти в необов'язковому параметрі «charset» (кодування) в заголовку Content-Type (тип вмісту) деяких MIME-повідомлень, у еквівалентних «meta» елементах HTML документів, та в частині визначення кодування прологу деяких XML документів.
Варіанти
Юнікод
Для забезпечення зворотної сумісності, символи з набору 128 ASCII та 256 ISO-8859-1 (Latin 1) мають такі ж коди Unicode/UCS як і в попередніх стандартах. Таким чином, ASCII можна розглядати як 7-бітну схему кодування дуже малої підмножини Unicode/UCS, і навпаки, UTF-8 сумісний з ASCII для кодів менше 128, із чого випливає, що правильно закодований ASCII файл є водночас і правильним файлом в кодуванні UTF-8.
Примітки
- RFC 1345 (Липень 1992).
- Internet Assigned Numbers Authority (May 14, 2007). «Character Sets». Accessed 2008-04-14.
Див. також
Посилання
- Історія ASCII, коріння, та попередники, Том Дженінгс (29 жовтня 2004) (переглянуто 2005-12-17)
- Підмножина ASCII кодування Unicode
- Eric Fischer (25 березня 2009). The Evolution of Character Codes, 1874-1968 (англ.).