Валентин Соломенчук

Как сделать карьеру с помощью Интернета


Скачать книгу

каждом этапе, несмотря на кажущуюся простоту, могут появиться определенные технические проблемы, что необходимо обязательно учитывать. Иначе можно, вместо нужной для вас реакции на письмо, получить град гневных откликов, а то и вовсе судебную повестку от оскорбленного человека. Поэтому ниже рассматриваются основные технические проблемы, возникающие при почтовой переписке.

      Таблица KOI-8

      Наиболее неприятной и нелогичной технической проблемой в Интернете является способ кодировки национальных алфавитов. А для России – это усугубляется множественностью используемых кодировок кириллицы. Поэтому почти все русскоязычные документы в Интернете имеют две-три копии в различных кодировках или перед прочтением перекодируются.

      Проблема заключается в том, что при кодировке одного знака используется один байт – это всего 256 значений. Поскольку вычислительная техника пришла из англоязычных стран, где использовался латинский алфавит, получилось так, что половина всех возможных значений оказалась отведенной под символы латинского алфавита и служебные знаки. Когда все это разрабатывалось, казалось совершенно немыслимым всемирное использование компьютеров в каждом доме, поэтому оставшаяся часть таблицы была отведена для псевдографики, которую вы видите, например, в Norton Commander. Другие страны (не только Россия, но и Франция, Германия и т. д.) были вынуждены как-то приспосабливаться. В результате было принято решение – нижняя часть таблицы (128 символов) остается как есть, а верхняя используется для нужд национальных алфавитов.

      Кроме того, ряд почтовых серверов использует старший бит в байте для служебных целей. Отсюда нередко возникает ситуация, когда письмо, написанное по-русски, приходит к получателю в абсолютно нечитаемом виде. Именно эта проблема вызвала разработку кодовой таблицы KOI-8, которая показана на рис. 2.1 (вы можете увидеть ее с помощью программы Таблица символов).

      Рис. 2.1. Кодовая таблица KOI-8

      В ней русские буквы разместили так, чтобы при потере старшего бита сообщение все-таки можно было прочесть (оно в таком случае оказывается написанным по-русски латинскими буквами). Но т. к. все буквы расположены не по порядку, а весьма затейливым способом, то кодировка KOI-8 используется только в почтовых сообщениях и в телеконференциях, либо когда применяется не русифицированное программное обеспечение на серверах или в пользовательских системах.

      Такую кодировку поддерживают и мировые разработчики программного обеспечения. Локализованная для России почтовая программа, показывая вам текст письма, учитывает, что оно составлено в KOI-8. Поэтому при установке и настройке параметров почтовой программы надо обязательно указывать тип кодировки кириллицы – KOI-8. А операционная система Windows при переносе текста сообщения из электронного письма в текстовый редактор осуществляет автоматическую перекодировку кириллицы из KOI-8 в СР1251, а в обратном направлении – из СР1251 в KOI-8.

      Очень часто проблема кодировки кириллицы не учитывается начинающими пользователями, поэтому в приходящей почте