Windows - статьи

       

В дебрях кодировок


Виталий Грищенко,

Предмет этого обзора - программы, главное назначение которых - преобразование текстовых данных, представленных в различных кодировках

Что такое кодировка? Это таблица, где каждой букве алфавита (а также цифрам и специальным знакам) присвоен уникальный номер - код символа. Первой широко используемой кодировкой, в которую вошли символы кириллицы, была KOI8. Ее возникновение связывают с периодом адаптации ОС Unix к русским символам. До сих пор KOI8 является основной кодировкой Unix.

Шло время, на арену вышла Microsoft со своей операционной системой DOS. Вместо того чтобы воспользоваться готовыми стандартами, она решила пойти своим путем. Так появилась codepage 866. Обладатели Win9x вспомнят строки, появлявшиеся на экране при запуске: mode con codepage prepare=((866) C:\WINDOWS\COMMAND\ega3.cpi) mode con codepage select=866

Это и есть поддержка кодировки DOS. Эта кодировка была удобна тем, что предусматривала символы для создания рамок, так называемую псевдографику.

От семейства компьютеров Macintosh нам досталась кодировка MAC. Семейство ОС Windows 9.x преподнесло нам Win-1251. Наконец, от международной организации по стандартам ISO нам досталась кодировка ISO-8859-5. Жаль, но единого стандарта кодировки для кириллических символов до сих пор не существует. Однако определенные сдвиги есть — сейчас идет активная работа над перспективной кодировкой UNICODE, которая, по идее, должна решить проблемы с распознаванием кириллицы.

Чаще всего проблемы с распознаванием кодировки возникают при чтении электронной почты и просмотре веб-страниц. Пока вы ведете переписку на английском или в транслите, никакие кодировки вам не страшны. Но стоит отправить на компьютер сообщение с поддерживающего кириллицу мобильного телефона (а это стандарт ISO) — и они возникнут. Другой пример: во время работы в Windows вам нужно прочитать текстовый файл, созданный в DOS. Вы, как всегда, открываете текст в «Блокноте» и видите… абракадабру вроде OS-ЙНДХПНБЙЕ+ лНФМН, Й.

Но мир не без добрых людей. Специально для таких ситуаций существуют программы-перекодировщики.



Содержание раздела