Способи кодування символів

Способи кодування символів виникли з появою ЕОМ, коли постало завдання подання у двійковому коді нечислових величин.

Способи кодування символів виникли з появою ЕОМ

Для кодування символів був запропонований спосіб, який надалі мав широке поширення для звуків та зображень. Сукупність символів, що вводяться і відображаються, називається алфавітом комп'ютерної системи. Це арабські цифри, літери латинського алфавіту, розділові знаки, спеціальні символи та знаки, літери національного алфавіту, символи псевдографіки – растри, прямокутники, одинарні та подвійні рамки, стрілки. Спочатку для кодування одного символу відвели 1 байт (8 бітів), Цей спосіб дозволив кодувати алфавіт з 256 різних символів. Так виникла кодова таблиця - система, в якій кожному символу алфавіту поставлений у відповідність унікальний код. Але різні виробники комп'ютерів для кодування тих самих символів створили свої кодові таблиці. При цьому символи, набрані за допомогою однієї таблиці кодів, неправильно відображалися при використанні іншої таблиці. Тому в 1981 р. Інститут стандартизації США прийняв стандарт кодової таблиці, яка отримала назву АSCII (American Standard Code of Information Interchange). Ця таблиця використовувалася в комп'ютерних програмах під управлінням операційної системи МS-DOS, і незабаром набула статусу міжнародної.

Спосіб кодування символів у вигляді таблиці АSCII містить 256 символів та їх кодів. Таблиця складається з двох частин: основної та розширеної. Основна частина (символи з кодами від 0 до 127 включно) є базовою, вона відповідно до прийнятого стандарту не може бути змінена. До неї увійшли: керуючі символи (їм відповідають коди з 1 по 31), арабські цифри, літери латинського алфавіту, розділові знаки, спеціальні символи.

Розширена частина (символи з кодами від 128 до 255) віддана національним алфавітам, символам псевдографіки та деяким спеціальним символам. Відповідно до затверджених стандартів, ця частина таблиці змінюється залежно від національного алфавіту тієї країни, де вона використовується, та способу кодування символів. Windows підтримує велику кількість розширених таблиць для різних національних алфавітів.

Способи кодування символів, що складаються з 256 кодів, явно не задовольняли деякі країни Азії для кодування їх національних алфавітів. Тому, в 1991 р. з'явився єдиний стандарт, побудований за 16-бітною схемою кодування і отримав назву UNICODE. Він дозволяє закодувати 2¹⁶ = 65536 символів, яких достатньо для кодування всіх національних алфавітів в одній таблиці. Оскільки кожен символ цього способу кодування займає два байти (замість одного, як раніше), всі текстові документи, представлені в UNICODE, стали довшими вдвічі.

Категорії

Календар

Способи кодування символів

Інструменти

Корисне

Релаксація