Кодировка кириллица windows: Как исправить отображение кириллицы в Windows 10
Содержание
Как исправить отображение кириллицы в Windows 10
  windows
Одна из возможных проблем, с которыми можно столкнуться после установки Windows 10 — кракозябры вместо русских букв в интерфейсе программ, а также в документах. Чаще неправильное отображение кириллицы встречается в изначально англоязычных и не совсем лицензионных версиях системы, но бывают и исключения.
В этой инструкции — о том, как исправить «кракозябры» (или иероглифы), а точнее — отображение кириллицы в Windows 10 несколькими способами. Возможно, также будет полезным: Как установить и включить русский язык интерфейса в Windows 10 (для систем на английском и других языках).
Исправление отображения кириллицы с помощью настроек языка и региональных стандартов Windows 10
Самый простой и чаще всего работающий способ убрать кракозябры и вернуть русские буквы в Windows 10 — исправить некоторые неправильные настройки в параметрах системы.
Для этого потребуется выполнить следующие шаги (примечание: привожу также названия нужных пунктов на английском, так как иногда необходимость исправить кириллицу возникает в англоязычных версиях системы без нужды менять язык интерфейса).
- Откройте панель управления (для этого можно начать набирать «Панель управления» или «Control Panel» в поиске на панели задач.
- Убедитесь, что в поле «Просмотр» (View by) установлено «Значки» (Icons) и выберите пункт «Региональные стандарты» (Region).
- На вкладке «Дополнительно» (Administrative) в разделе «Язык программ, не поддерживающих Юникод» (Language for non-Unicode programs) нажмите по кнопке «Изменить язык системы» (Change system locale).
- Выберите русский язык, нажмите «Ок» и подтвердите перезагрузку компьютера.
После перезагрузки проверьте, была ли решена проблема с отображением русских букв в интерфейсе программ и (или) документах — обычно, кракозябры бывают исправлены после этих простых действий.
Как исправить иероглифы Windows 10 путем изменения кодовых страниц
Кодовые страницы представляют собой таблицы, в которых определенным байтам сопоставляются определенные символы, а отображение кириллицы в виде иероглифов в Windows 10 связано обычно с тем, что по умолчанию задана не та кодовая страница и это можно исправить несколькими способами, которые могут быть полезны, когда требуется не изменять язык системы в параметрах.
С помощью редактора реестра
Первый способ — использовать редактор реестра. На мой взгляд, это самый щадящий для системы метод, тем не менее, рекомендую создать точку восстановления прежде чем начинать. Совет про точки восстановления относится и ко всем последующим способам в этом руководстве.
- Нажмите клавиши Win+R на клавиатуре, введите regedit и нажмите Enter, откроется редактор реестра.
- Перейдите к разделу реестра
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage
и в правой части пролистайте значения этого раздела до конца.
- Дважды нажмите по параметру ACP, установите значение 1251 (кодовая страница для кириллицы), нажмите Ок и закройте редактор реестра.
- Перезагрузите компьютер (именно перезагрузка, а не завершение работы и включение, в Windows 10 это может иметь значение).
Обычно, это исправляет проблему с отображением русских букв. Вариация способа с помощью редактора реестра (но менее предпочтительная) — посмотреть на текущее значение параметра ACP (обычно — 1252 для изначально англоязычных систем), затем в том же разделе реестра найти параметр с именем 1252 и изменить его значение с c_1252.nls на c_1251.nls.
Путем подмена файла кодовой страницы на c_1251.nls
Второй, не рекомендуемый мной способ, но иногда выбираемый теми, кто считает, что правка реестра — это слишком сложно или опасно: подмена файла кодовой страницы в C:\ Windows\ System32 (предполагается, что у вас установлена западно-европейская кодовая страница — 1252, обычно это так. Посмотреть текущую кодовую страницу можно в параметре ACP в реестре, как было описано в предыдущем способе).
- Зайдите в папку C:\ Windows\ System32 и найдите файл c_1252.NLS, нажмите по нему правой кнопкой мыши, выберите пункт «Свойства» и откройте вкладку «Безопасность». На ней нажмите кнопку «Дополнительно».
- В поле «Владелец» нажмите «Изменить».
- В поле «Введите имена выбираемых объектов» укажите ваше имя пользователя (с правами администратора). Если в Windows 10 используется учетная запись Майкрософт, вместо имени пользователя укажите адрес электронной почты. Нажмите «Ок» в окне, где указывали пользователя и в следующем (Дополнительные параметры безопасности) окне.
- Вы снова окажетесь на вкладке «Безопасность» в свойствах файла. Нажмите кнопку «Изменить».
- Выберите пункт «Администраторы» (Administrators) и включите полный доступ для них. Нажмите «Ок» и подтвердите изменение разрешений. Нажмите «Ок» в окне свойств файла.
- Переименуйте файл c_1252.NLS (например, измените расширение на .bak, чтобы не потерять этот файл).
- Удерживая клавишу Ctrl, перетащите находящийся там же в C:\Windows\System32 файл c_1251.NLS (кодовая страница для кириллицы) в другое место этого же окна проводника, чтобы создать копию файла.
- Переименуйте копию файла c_1251.NLS в c_1252.NLS.
- Перезагрузите компьютер.
После перезагрузки Windows 10 кириллица должна будет отображаться не в виде иероглифов, а как обычные русские буквы.
А вдруг и это будет интересно:
Решаем проблему с кодировкой приложений Windows
Октябрь6
Проблемы кодировки в Windows — довольно большая головная боль для многих любителей и поклонников этой операционки. Иногда приходится изрядно помучиться и попотеть прежде чем удается решить проблему с кодировкой. Выяснить причину, зачастую. еще сложнее. но тут вообще мало кто заморачивается…главное ведь устранить неполадку, а уж почему возникла — вопрос давно ушедших дней)
Особенно сильно проблема с кодировкой стала актуальна после выхода новой Windows 10. Микрософты опять что-то перемудрили и в итоге, в некоторых приложениях вместо языка одни кракозябры. Но все решаемо
На самом деле причин сброса или изменения кодировки может быть довольно большое множество. Но основные из них, это:
— обновление системы
— установка какого-то системного патча
— действие вируса
— обновление до windows 10
— кривые шаловливые руки и непомерная любознательность ( самая распространенная причина всех бед в windows )
Восстановление кодировки
Тем не менее, раз уж данная проблема возникла, нужно ее решать. Ниже приведены скрины, любезно предоставленные одним человеком с одного популярного форума. На них можно посмотреть без риска и экспериментов на собственной системе, ‘что будет если сменить кодировку’. Все шрифты представлены как совершенно нечитаемые арабские кракозябры.
При всем, казалось бы, диком ужасе ситуации, решается данная проблема весьма несложно:
заходим в Панель управления->Язык и региональные стандарты->Закладка «Дополнительно»->Язык программ не поддерживающих Юникод. Меняем язык с Русского на Английский, перезагружаем компьютер, снова меняем на русский и опять перезагружаем компьютер. Снова наслаждаемся красивыми родными шрифтами!
В windows 10 кодировка привязывается глобально к общему языку системы. Поэтому если у вас проблемы с отображением шрифтов, то нужно пройти: Пуск -> Параметры -> Время и Язык -> Регион и язык -> Дополнительные настройки даты и времени, региональные параметры -> и посмотреть настройки в пунктах: Язык и Региональные стандарты.
Другие статьи
Copyright © 2013-2017. All rights reserved.
Кривая кириллица в Windows 10 | RuCore.NET
Проблемы кодировки в Windows — довольно большая головная боль для многих любителей и поклонников этой операционки. Иногда приходится изрядно помучиться и попотеть прежде чем удается решить проблему с кодировкой. Чаще неправильное отображение кириллицы встречается в изначально англоязычных и не совсем лицензионных версиях системы, но бывают и исключения.
Кракозябры вместо русских букв
Кракозябры – что за слово такое интересное? Этим словом обычно русские пользователи называют неправильное/неверное отображение (кодировку) символов в программах или самой Операционной Системы.
Почему такое случается? Однозначного ответа Вы не найдёте. Это может быть в следствии проделок наших “любимых” вирусов, может из-за сбоя работы ОС Windows (например пропало электричество и выключился компьютер), может программа создала конфликт с другой или ОС и всё “полетело”. В общем причин может быть много, а самая интересная – это “Оно само вот так взяло и сломалось”.
После очередного обновления Windows 10 на одном из рабочих компов кириллический шрифт слетел так, что кракозябры появились не только в некоторых письмах в MS Outlook, а даже в Проводнике! Это выяснилось когда подключить к проблемному компу флешку с меткой тома на русском языке.
Через правку реестра
Самый простой и чаще всего работающий способ убрать кракозябры и вернуть русские буквы в Windows 10 — исправить некоторые неправильные настройки в параметрах системы или с помощью реестра. Что мы с вами и будем делать.
Откройте редактор реестра. Нажмите клавиши Win+R и в появившемся окне впишите слово “regedit” и после того как откроется окно перейдите в эту ветку:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage
Всё, что нужно сделать — выставить на проблемном компе такие значения у определённых параметров:
«ACP»=»1251»
«OEMCP»=»866»
«MACCP»=»10007»
Исправление ошибки чтения кириллицы путем подмены файлов кодировок
- Идем в папку: C:\Windows\System32. И ищем файл с названием c_1252.nls и нам нужно переименовывать его в c_1252.bak или перенести в какой-нибудь другой каталог.Но по-умолчанию это действие запрещено. Для этого можно воспользоваться утилитой Unlocker или стать владельцем файла и разрешить себе полный доступ к нему. Кто хочет качаем Unlocker я покажу как стать владельцем.
- Открываем «Свойства» файла и переходим на вкладку «Безопасность», внизу кнопка «Дополнительно».
- В открывшемся окне вверху, в пункте «Владелец» выбираем «Изменить».
- Жмем внизу «Дополнительно», потом справа «Поиск» и в результатах поиска выбираем «Администраторы».
- Жмем ОК. Еще раз ОК. Теперь вы владелец этого файла.
- Сохраняем изменения, нажав ОК и возвращаемся на вкладку «Безопасность» в свойствах файла. Теперь жмем кнопку «Изменить».
- Выставляем «Полный доступ» для группы «Администраторы».
- Сохраняем изменения и переименовываем файл.
- Файл переименован, теперь копируем файл c_1251.nls в эту же папку.
- Переименовываем копию файла в c_1252.nls.
- Перезапускаем компьютер. После загрузки компьютера кириллическая кодировка будет без проблем отображаться.
Если у вас возникнут еще какие-либо проблемы с отображением или этот способ не помог, повторите так же эти операции к файлам c_1253.nls, c_1254.nls, c_1255.nls. Так же заменив их копиями файла c_1251.nls.
Прежде всего, попробуем исправить ошибку через панель управления. Чтобы зайти в неё нажимаем ПКМ по кнопке-меню «Пуск» и в выпавшем списке выбираем соответствующий пункт.
В открывшемся новом окне находим раздел Часы, язык, регион. В новом разделе выбираем категорию региональных стандартов. Здесь мы сможем настроить вариант даты и времени, а также числовой разделитель, количество дробных значений, формат отрицательных чисел, систему единиц измерения и пр.
Также здесь нам предлагается изменить формат денежных единиц и обозначение таковых. Здесь же мы можем настроить локальные параметры для разных регионов, включая отображаемые в системе текстовые символы. Именно эти опции нас и интересуют. Для их выбора переходим ко вкладке «Дополнительно» в верхней части окна.
Переходим в раздел выбора языка, не поддерживающего Юникод, и далее выбираем опцию изменение языка системы.
В списке выбираем нужный вариант (в нашем случае «Русский (Россия)» и нажимаем «ОК») В появившемся окне уведомлений выбираем «Перезагрузить сейчас». ПК уйдёт в перезагрузку, после чего проблема с кракозябрами должна исчезнуть. Однако не всегда этот способ срабатывает.
Ну и напоследок
Если работаете с реестром, то не забывайте делать бэкап (резервную копию) на тот случай, если что-то пойдёт не так. На этом всё. Теперь Вы знаете как исправить убрать/исправить Кракозябры (квадратики, иероглифы, восклицательные и вопросительные знаки) в программе или Windows.
2 066 просмотров
Отказ от ответственности: Автор или издатель не публиковали эту статью для вредоносных целей. Вся размещенная информация была взята из открытых источников и представлена исключительно в ознакомительных целях а также не несет призыва к действию. Создано лишь в образовательных и развлекательных целях. Вся информация направлена на то, чтобы уберечь читателей от противозаконных действий. Все причиненные возможные убытки посетитель берет на себя. Автор проделывает все действия лишь на собственном оборудовании и в собственной сети. Не повторяйте ничего из прочитанного в реальной жизни. | Так же, если вы являетесь правообладателем размещенного на страницах портала материала, просьба написать нам через контактную форму жалобу на удаление определенной страницы, а также ознакомиться с инструкцией для правообладателей материалов. Спасибо за понимание.
Universal online Cyrillic decoder — recover your texts
Universal online Cyrillic decoder — recover your texts
Version: 20210318
By the same author: Virtour.fr — visites virtuelles
Output
The resulting text will be displayed here…
Guestbook Please link to this site! | Custom Work For a small fee I can help you quickly recode/recover large pieces of data — texts, databases, websites… or write custom functions you can use (invoice available). FAQ and contact information. |
About the program
Welcome!
You may find this site useful, if you have recieved some texts that you believe are written in the Cyrillic alphabet, but instead are displayed in some strange combination of bizarre characters. This program will try to guess the encoding, and if it does not, it will show samples, examples of all encoding-combinations, so as you will be able to select the good one.
How to
- Paste the text to decode in the big text area. The first few words will be analyzed so they should be (scrambled) in supposed Cyrillic.
- The program will try to decode the text and will print the result below.
- If the translation is successful, you will see the text in Cyrillic characters and will be able to copy it and save it if it’s important.
- If the translation isn’t successful (still the text is not in Cyrillic but in the same or other unintelligible characters), you can choose from the newly created select-listbox the variant that is in Cyrillic (if there are more than one, select the longest). By pressing the button OK you will have the correct text converted.
- If the text is not totally converted, try all other variants in Cyrillic from the select-listbox.
Limits
- If your text contains question marks «???? ?? ??????», the problem is with the sender and no recovery will be possible. Ask them to resend the text, eventually as an ordinary text file or in LibreOffice/OpenOffice/MSOffice format.
- There is no claim that every text is recoverable, even if you are certain that the text is in Cyrillic.
- The analyzed and converted text is limited to 100 KiB.
- A 100% precision is not always achieved — in a conversion from a codepage to another code page, some characters may be lost, like the Bulgarian quotes or rarely some single letters. Some of this depends on your Windows Clipboard character handling.
- The program will try a maximum of 7245 variants in two or three levels: if there had been a multiple encoding like koi8(utf(cp1251(utf))), it will not be detected or tested. Usually the possible and displayed correct variants are between 32 and 255.
- If a part of the text is encoded with one code page, and another part — with another code page, the program could recognize only one of the parts at a time.
Terms of use
Please notice that this freeware program is created with the hope that it would be useful, but has no warranty, not even an implied warranty for fitness for any particular use. Please use it at your own risk.
If you have very long texts to translate, please make sure you have a backup copy.
What’s new
- March 2021 : After a server upgrade, the program stopped working and some parts of it had to be rewritten.
- May 2020 : Added Тоҷикӣ/Tajik translation, thanks to Анвар/Anvar.
- October 2017 : Added «Select all / Copy» button.
- July 2016 : SSL Certificate installed, you can now access the Decoder on a secure connection.
- October 2013 : I am trying different optimizations for the system which should make the decoder run faster and handle more text. If you notice any problem, please notify me ASAP.
- March 2013 : My hosting provider sent me a warning that the Decoder is using too much server CPU power and its processes were killed more than 100 times. I am making some changes so that the program will use less CPU, especially when reposting a previously sampled text, however, the decoded form may load somewhat slower. Please contact me if you have some difficulties using the program.
- 2012-08-09 : Added French translation, thanks to Arnaud D.
- 2011-03-06 : Added Belorussian translation, thanks to Зыль and Aliaksandr Hliakau.
- 31.07.10 : Added Serbian translation, thanks to Miodrag Danilovic (Boston — Beograd).
- 07.05.09 : Raised limit of MAX text size to 50 kiB.
- may 2009 : Added Ukrainian interface thanks to Barmalini.
- 2008-2009 : A number of small fixes and tweaks of the detection algorithm. Changed interface to default to automatic decoding.
- 12.08.07 : Fixed Russian language translation, thanks to Petr Vasilyev. This page will be significantly restructured in the near future.
- 10.11.06 : Three new postfilters added: «base64», «unix-to-unix» и «bin-to-hex», theoretically the tested combinations are 4725. Changes to the frequency analysis function (testing).
- 11.10.06 : The main site is on a new hardware server, should run faster.
- 11.09.06 : The program now uses PHP5 and should run times faster.
- 19.08.06 : Because of a broken DNS entry, this site was inaccessible from 06:00 on 15 august up to 15:00 on 18 august. That was the reason for me to set two «mirror» sites (5ko.free.fr/decode and www.accent.bg/decode) with the same program. If the original has a problem, you can find the copies in Google and recover your texts.
- 17.06.06 : Added two more antique Cyrillic encodings, MIK и KOI-7, but you better not need them.
- 03.03.06 : Added Slovak translation, thanks to Martin from KPR Slovakia.
- 15.02.06 : More encodings added and tested.
- 20.10.05 : Small improvement to the frequency-analysis function: for texts, written in all-capital letters.
- 14.10.05 : Two more gmail-Cyrillic encodings were added. Theoretically the tested combinations are 2112.
- 15.06.05 : Russian language interface was added. Big thanks to chAlx!
- 16.02.05 : One more postfilter decoding is added, for strings like this: «%u043A%u0438%u0440%u0438%u043B%u0438%u0446%u0430».
- 05.02.05 : More encodings tests added, the number of tested encodings is doubled, but thus the program may work slightly slower.
- 03.02.05 : The frequency analysis function that detects the original encoding works much better now. Currently the program recognises most of the encodings if the first few words are not too weird. It although still needs some improvement.
- 15.01.05 : The input text limit is raised from 10 to 20 kB.
- 01.12.04 : First public release.
Back to the Latin to Cyrillic convertor.
Кодировка текста ASCII (Windows 1251, CP866, KOI8-R) и Юникод (UTF 8, 16, 32) — как исправить проблему с кракозябрами
Сегодня мы поговорим о том, откуда берутся кракозябры на сайте и в программах, какие кодировки текста существуют и какие из них следует использовать. Подробно рассмотрим историю их развития, начиная с базовой ASCII, а также ее расширенных версий CP866, KOI8-R, Windows 1251 и заканчивая современными кодировками консорциума Юникод UTF 16 и 8.
Оглавление:
Кому-то эти сведения могут показаться излишними, но знали бы вы, сколько мне приходит вопросов именно касаемо вылезших кракозябров (нечитаемого набора символов). Теперь у меня будет возможность отсылать всех к тексту этой статьи и самостоятельно отыскивать свои косяки. Ну что же, приготовьтесь впитывать информацию и постарайтесь следить за ходом повествования.
ASCII — базовая кодировка текста для латиницы
Развитие кодировок текстов происходило одновременно с формированием отрасли IT, и они за это время успели претерпеть достаточно много изменений. Исторически все начиналось с довольно-таки неблагозвучной в русском произношении EBCDIC, которая позволяла кодировать буквы латинского алфавита, арабские цифры и знаки пунктуации с управляющими символами.
Но все же отправной точкой для развития современных кодировок текстов стоит считать знаменитую ASCII (American Standard Code for Information Interchange, которая по-русски обычно произносится как «аски»). Она описывает первые 128 символов из наиболее часто используемых англоязычными пользователями — латинские буквы, арабские цифры и знаки препинания.
Еще в эти 128 знаков, описанных в ASCII, попадали некоторые служебные символы вроде скобок, решеток, звездочек и т.п. Собственно, вы сами можете увидеть их:
Именно эти 128 символов из первоначального варианта ASCII стали стандартом, и в любой другой кодировке вы их обязательно встретите и стоять они будут именно в таком порядке.
Но дело в том, что с помощью одного байта информации можно закодировать не 128, а целых 256 различных значений (двойка в степени восемь равняется 256), поэтому вслед за базовой версией Аски появился целый ряд расширенных кодировок ASCII, в которых можно было кроме 128 основных знаков закодировать еще и символы национальной кодировки (например, русской).
Тут, наверное, стоит еще немного сказать о системах счисления, которые используются при описании. Во-первых, как вы все знаете, компьютер работает только с числами в двоичной системе, а именно с нулями и единицами («булева алгебра», если кто проходил в институте или в школе). Один байт состоит из восьми бит, каждый из которых представляет собой двойку в степени, начиная с нулевой, и до двойки в седьмой:
Не трудно понять, что всех возможных комбинаций нулей и единиц в такой конструкции может быть только 256. Переводить число из двоичной системы в десятичную довольно просто. Нужно просто сложить все степени двойки, над которыми стоят единички.
В нашем примере это получается 1 (2 в степени ноль) плюс 8 (два в степени 3), плюс 32 (двойка в пятой степени), плюс 64 (в шестой), плюс 128 (в седьмой). Итого получается 233 в десятичной системе счисления. Как видите, все очень просто.
Но если вы присмотритесь к таблице с символами ASCII, то увидите, что они представлены в шестнадцатеричной кодировке. Например, «звездочка» соответствует в Аски шестнадцатеричному числу 2A. Наверное, вам известно, что в шестнадцатеричной системе счисления используются кроме арабских цифр еще и латинские буквы от A (означает десять) до F (означает пятнадцать).
Ну так вот, для перевода двоичного числа в шестнадцатеричное прибегают к следующему простому способу. Каждый байт информации разбивают на две части по четыре бита. Т.е. в каждой половинке байта двоичным кодом можно закодировать только шестнадцать значений (два в четвертой степени), что можно легко представить шестнадцатеричным числом.
Причем в левой половине байта считать степени нужно будет опять начиная с нулевой, а не так, как показано на скриншоте. В результате мы получим, что на скриншоте закодировано число E9. Надеюсь, что ход моих рассуждений и разгадка данного ребуса вам оказались понятны. Ну, а теперь продолжим, собственно, говорить про кодировки текста.
Расширенные версии Аски — кодировки CP866 и KOI8-R с псевдографикой
Итак, мы с вами начали говорить про ASCII, которая являлась как бы отправной точкой для развития всех современных кодировок (Windows 1251, юникод, UTF 8).
Изначально в нее было заложено только 128 знаков латинского алфавита, арабских цифр и еще чего-то там, но в расширенной версии появилась возможность использовать все 256 значений, которые можно закодировать в одном байте информации. Т.е. появилась возможность добавить в Аски символы букв своего языка.
Тут нужно будет еще раз отвлечься, чтобы пояснить — зачем вообще нужны кодировки текстов и почему это так важно. Символы на экране вашего компьютера формируются на основе двух вещей — наборов векторных форм (представлений) всевозможных знаков (они находятся в файлах со шрифтами, которые установлены на вашем компьютере) и кода, который позволяет выдернуть из этого набора векторных форм (файла шрифта) именно тот символ, который нужно будет вставить в нужное место.
Понятно, что за сами векторные формы отвечают шрифты, а вот за кодирование отвечает операционная система и используемые в ней программы. Т.е. любой текст на вашем компьютере будет представлять собой набор байтов, в каждом из которых закодирован один единственный символ этого самого текста.
Программа, отображающая этот текст на экране (текстовый редактор, браузер и т.п.), при разборе кода считывает кодировку очередного знака и ищет соответствующую ему векторную форму в нужном файле шрифта, который подключен для отображения данного текстового документа. Все просто и банально.
Значит, чтобы закодировать любой нужный нам символ (например, из национального алфавита), нужно выполнить два условия: векторная форма этого знака должна быть в используемом шрифте, и этот символ можно было бы закодировать в расширенных кодировках ASCII в один байт. Поэтому таких вариантов существует целая куча. Только лишь для кодирования символов русского языка существует несколько разновидностей расширенной Аски.
Например, изначально появилась CP866, в которой была возможность использовать символы русского алфавита, и она являлась расширенной версией ASCII.
То есть, ее верхняя часть полностью совпадала с базовой версией Аски (128 символов латиницы, цифр и еще всякой лабуды), которая представлена на приведенном чуть выше скриншоте, а вот уже нижняя часть таблицы с кодировкой CP866 имела указанный на скриншоте чуть ниже вид и позволяла закодировать еще 128 знаков (русские буквы и всякая там псевдографика):
Видите, в правом столбце цифры начинаются с 8, т.к. числа с 0 до 7 относятся к базовой части ASCII (см. первый скриншот). Таким образом, у кириллической буквы «М» в CP866 будет код 9С (она находится на пересечении соответствующих строки с 9 и столбца с цифрой С в шестнадцатеричной системе счисления), который можно записать в одном байте информации, и при наличии подходящего шрифта с русскими символами эта буква без проблем отобразится в тексте.
Откуда взялось такое количество псевдографики в CP866? Тут все дело в том, что эта кодировка для русского текста разрабатывалась еще в те мохнатые года, когда графические операционные системы не были распространены как сейчас. А в Досе и подобных ей текстовых операционках псевдографика позволяла хоть как-то разнообразить оформление текстов и поэтому ею изобилует CP866 и все другие ее ровесницы из разряда расширенных версий Аски.
CP866 распространяла компания IBM, но кроме этого для символов русского языка были разработаны еще ряд кодировок, например, к этому же типу (расширенных ASCII) можно отнести KOI8-R:
Принцип ее работы остался тот же самый, что и у описанной чуть ранее CP866 — каждый символ текста кодируется одним единственным байтом. На скриншоте показана вторая половина таблицы KOI8-R, т.к. первая половина полностью соответствует базовой Аски, которая показана на первом скриншоте в этой статье.
Среди особенностей кодировки KOI8-R можно отметить то, что кириллические буквы в ее таблице идут не в алфавитном порядке, как это сделали в CP866.
Если посмотрите на самый первый скриншот (базовой части, которая входит во все расширенные кодировки), то заметите, что в KOI8-R русские буквы расположены в тех же ячейках таблицы, что и созвучные им буквы латинского алфавита из первой части таблицы. Это было сделано для удобства перехода с русских символов на латинские путем отбрасывания всего одного бита (два в седьмой степени или 128).
Windows 1251 — современная версия ASCII и почему вылезают кракозябры
Дальнейшее развитие кодировок текста было связано с тем, что набирали популярность графические операционные системы и необходимость использования псевдографики в них со временем пропала. В результате возникла целая группа, которая по своей сути по-прежнему являлись расширенными версиями Аски (один символ текста кодируется всего одним байтом информации), но уже без использования символов псевдографики.
Они относились к так называемым ANSI кодировкам, которые были разработаны американским институтом стандартизации. В просторечии еще использовалось название кириллица для варианта с поддержкой русского языка. Примером такой может служить Windows 1251.
Она выгодно отличалась от используемых ранее CP866 и KOI8-R тем, что место символов псевдографики в ней заняли недостающие символы русской типографики (окромя знака ударения), а также символы, используемые в близких к русскому славянских языках (украинскому, белорусскому и т.д.):
Из-за такого обилия кодировок русского языка, у производителей шрифтов и производителей программного обеспечения постоянно возникала головная боль, а у нас с вам, уважаемые читатели, зачастую вылезали те самые пресловутые кракозябры, когда происходила путаница с используемой в тексте версией.
Очень часто они вылезали при отправке и получении сообщений по электронной почте, что повлекло за собой создание очень сложных перекодировочных таблиц, которые, собственно, решить эту проблему в корне не смогли, и зачастую пользователи для переписки использовали транслит латинских букв, чтобы избежать пресловутых кракозябров при использовании русских кодировок подобных CP866, KOI8-R или Windows 1251.
По сути, кракозябры, вылазящие вместо русского текста, были результатом некорректного использования кодировки данного языка, которая не соответствовала той, в которой было закодировано текстовое сообщение изначально.
Допустим, если символы, закодированные с помощью CP866, попробовать отобразить, используя кодовую таблицу Windows 1251, то эти самые кракозябры (бессмысленный набор знаков) и вылезут, полностью заменив собой текст сообщения.
Аналогичная ситуация очень часто возникает при создании и настройке сайтов, форумов или блогов, когда текст с русскими символами по ошибке сохраняется не в той кодировке, которая используется на сайте по умолчанию, или же не в том текстовом редакторе, который добавляет в код отсебятину не видимую невооруженным глазом.
В конце концов такая ситуация с множеством кодировок и постоянно вылезающими кракозябрами многим надоела, появились предпосылки к созданию новой универсальной вариации, которая бы заменила собой все существующие и решила бы проблему с появлением не читаемых текстов. Кроме этого существовала проблема языков подобных китайскому, где символов языка было гораздо больше, чем 256.
Юникод (Unicode) — универсальные кодировки UTF 8, 16 и 32
Эти тысячи знаков языковой группы юго-восточной Азии никак невозможно было описать в одном байте информации, который выделялся для кодирования символов в расширенных версиях ASCII. В результате был создан консорциум под названием Юникод (Unicode — Unicode Consortium) при сотрудничестве многих лидеров IT индустрии (те, кто производит софт, кто кодирует железо, кто создает шрифты), которые были заинтересованы в появлении универсальной кодировки текста.
Первой вариацией, вышедшей под эгидой консорциума Юникод, была UTF 32. Цифра в названии кодировки означает количество бит, которое используется для кодирования одного символа. 32 бита составляют 4 байта информации, которые понадобятся для кодирования одного единственного знака в новой универсальной кодировке UTF.
В результате чего один и тот же файл с текстом, закодированный в расширенной версии ASCII и в UTF-32, в последнем случае будет иметь размер (весить) в четыре раза больше. Это плохо, но зато теперь у нас появилась возможность закодировать с помощью ЮТФ число знаков, равное двум в тридцать второй степени (миллиарды символов, которые покроют любое реально необходимое значение с колоссальным запасом).
Но многим странам с языками европейской группы такое огромное количество знаков использовать в кодировке вовсе и не было необходимости, однако при задействовании UTF-32 они ни за что ни про что получали четырехкратное увеличение веса текстовых документов, а в результате и увеличение объема интернет-трафика и объема хранимых данных. Это много, и такое расточительство себе никто не мог позволить.
В результате развития Юникода появилась UTF-16, которая получилась настолько удачной, что была принята по умолчанию как базовое пространство для всех символов, которые у нас используются. Она использует два байта для кодирования одного знака. Давайте посмотрим, как это дело выглядит.
В операционной системе Windows вы можете пройти по пути «Пуск» — «Программы» — «Стандартные» — «Служебные» — «Таблица символов». В результате откроется таблица с векторными формами всех установленных у вас в системе шрифтов. Если вы выберете в «Дополнительных параметрах» набор знаков Юникод, сможете увидеть для каждого шрифта в отдельности весь ассортимент входящих в него символов.
Кстати, щелкнув по любому из них, вы сможете увидеть его двухбайтовый код в формате UTF-16, состоящий из четырех шестнадцатеричных цифр:
Сколько символов можно закодировать в UTF-16 с помощью 16 бит? 65 536 (два в степени шестнадцать), и именно это число было принято за базовое пространство в Юникоде. Помимо этого существуют способы закодировать с помощью нее и около двух миллионов знаков, но ограничились расширенным пространством в миллион символов текста.
Но даже эта удачная версия кодировки Юникода не принесла особого удовлетворения тем, кто писал, допустим, программы только на английском языке, ибо у них после перехода от расширенной версии ASCII к UTF-16, вес документов увеличивался в два раза (один байт на один символ в Аски и два байта на тот же самый символ в ЮТФ-16).
Вот именно для удовлетворения всех и вся в консорциуме Unicode было решено придумать кодировку переменной длины. Ее назвали UTF-8. Несмотря на восьмерку в названии, она действительно имеет переменную длину, т.е. каждый символ текста может быть закодирован в последовательность длиной от одного до шести байт.
На практике же в UTF-8 используется только диапазон от одного до четырех байт, потому что за четырьмя байтами кода ничего уже даже теоретически не возможно представить. Все латинские знаки в ней кодируются в один байт, так же как и в старой доброй ASCII.
Что примечательно, в случае кодирования только латиницы, даже те программы, которые не понимают Юникод, все равно прочитают то, что закодировано в ЮТФ-8. То есть, базовая часть Аски просто перешла в это детище консорциума Unicode.
Кириллические же знаки в UTF-8 кодируются в два байта, а, например, грузинские — в три байта. Консорциум Юникод после создания UTF 16 и 8 решил основную проблему — теперь у нас в шрифтах существует единое кодовое пространство. И теперь их производителям остается только исходя из своих сил и возможностей заполнять его векторными формами символов текста.
В приведенной чуть выше «Таблице символов» видно, что разные шрифты поддерживают разное количество знаков. Некоторые насыщенные символами Юникода шрифты могут весить очень прилично. Но зато теперь они отличаются не тем, что они созданы для разных кодировок, а тем, что производитель шрифта заполнил или не заполнил единое кодовое пространство теми или иными векторными формами до конца.
Кракозябры вместо русских букв — как исправить
Давайте теперь посмотрим, как появляются вместо текста кракозябры или, другими словами, как выбирается правильная кодировка для русского текста. Собственно, она задается в той программе, в которой вы создаете или редактируете этот самый текст, или же код с использованием текстовых фрагментов.
Для редактирования и создания текстовых файлов лично я использую очень хороший, на мой взгляд, Html и PHP редактор Notepad++. Впрочем, он может подсвечивать синтаксис еще доброй сотни языков программирования и разметки, а также имеет возможность расширения с помощью плагинов. Читайте подробный обзор этой замечательной программы по приведенной ссылке.
В верхнем меню Notepad++ есть пункт «Кодировки», где у вас будет возможность преобразовать уже имеющийся вариант в тот, который используется на вашем сайте по умолчанию:
В случае сайта на Joomla 1.5 и выше, а также в случае блога на WordPress следует во избежании появления кракозябров выбирать вариант UTF 8 без BOM. А что такое приставка BOM?
Дело в том, что когда разрабатывали кодировку ЮТФ-16, зачем-то решили прикрутить к ней такую вещь, как возможность записывать код символа, как в прямой последовательности (например, 0A15), так и в обратной (150A). А для того, чтобы программы понимали, в какой именно последовательности читать коды, и был придуман BOM (Byte Order Mark или, другими словами, сигнатура), которая выражалась в добавлении трех дополнительных байтов в самое начало документов.
В кодировке UTF-8 никаких BOM предусмотрено в консорциуме Юникод не было и поэтому добавление сигнатуры (этих самых пресловутых дополнительных трех байтов в начало документа) некоторым программам просто-напросто мешает читать код. Поэтому мы всегда при сохранении файлов в ЮТФ должны выбирать вариант без BOM (без сигнатуры). Таким образом, вы заранее обезопасите себя от вылезания кракозябров.
Что примечательно, некоторые программы в Windows не умеют этого делать (не умеют сохранять текст в ЮТФ-8 без BOM), например, все тот же пресловутый Блокнот Windows. Он сохраняет документ в UTF-8, но все равно добавляет в его начало сигнатуру (три дополнительных байта). Причем эти байты будут всегда одни и те же — читать код в прямой последовательности. Но на серверах из-за этой мелочи может возникнуть проблема — вылезут кракозябры.
Поэтому ни в коем случае не пользуйтесь обычным блокнотом Windows для редактирования документов вашего сайта, если не хотите появления кракозябров. Лучшим и наиболее простым вариантом я считаю уже упомянутый редактор Notepad++, который практически не имеет недостатков и состоит из одних лишь достоинств.
В Notepad ++ при выборе кодировки у вас будет возможность преобразовать текст в кодировку UCS-2, которая по своей сути очень близка к стандарту Юникод. Также в Нотепаде можно будет закодировать текст в ANSI, т.е. применительно к русскому языку это будет уже описанная нами чуть выше Windows 1251. Откуда берется эта информация?
Она прописана в реестре вашей операционной системы Windows — какую кодировку выбирать в случае ANSI, какую выбирать в случае OEM (для русского языка это будет CP866). Если вы установите на своем компьютере другой язык по умолчанию, то и эти кодировки будут заменены на аналогичные из разряда ANSI или OEM для того самого языка.
После того, как вы в Notepad++ сохраните документ в нужной вам кодировке или же откроете документ с сайта для редактирования, то в правом нижнем углу редактора сможете увидеть ее название:
Чтобы избежать кракозябров, кроме описанных выше действий, будет полезным прописать в его шапке исходного кода всех страниц сайта информацию об этой самой кодировке, чтобы на сервере или локальном хосте не возникло путаницы.
Вообще, во всех языках гипертекстовой разметки кроме Html используется специальное объявление xml, в котором указывается кодировка текста.
<?xml version="1.0" encoding="windows-1251"?>
Прежде, чем начать разбирать код, браузер узнает, какая версия используется и как именно нужно интерпретировать коды символов этого языка. Но что примечательно, если вы сохраняете документ в принятом по умолчанию юникоде, это объявление xml можно будет опустить (кодировка будет считаться UTF-8, если нет BOM или ЮТФ-16, если BOM есть).
В случае же документа языка Html для указания кодировки используется элемент Meta, который прописывается между открывающим и закрывающим тегом Head:
<head>
...
<meta charset="utf-8">
...
</head>
Эта запись довольно сильно отличается от принятой в стандарте в Html 4.01, но полностью соответствует стандарту Html 5, и она будет стопроцентно правильно понята любыми используемыми на текущий момент браузерами.
По идее элемент Meta с указание кодировки Html документа лучше будет ставить как можно выше в шапке документа, чтобы на момент встречи в тексте первого знака не из базовой ANSI (которые правильно прочитаются всегда и в любой вариации) браузер уже должен иметь информацию о том, как интерпретировать коды этих символов.
Ссылка на первоисточник: Кодировка текста ASCII (Windows 1251, CP866, KOI8-R) и Юникод (UTF 8, 16, 32) — как исправить проблему с кракозябрами
Таблица кодов символов Windows-1251
Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Данная кодировка пользуется довольно большой популярностью в восточно-европейских странах. Windows-1251 выгодно отличается от других 8-битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в традиционной русской типографике для обычного текста (отсутствует только знак ударения). Кириллические символы идут в алфавитном порядке.
Windows-1251 также содержит все символы для близких к русскому языку языков: белорусского, украинского, сербского, македонского и болгарского.
На практике этого оказалось достаточно, чтобы кодировка Windows-1251 закрепилась в интернете вплоть до распространения UTF-8.
Dec | Hex | Символ | Dec | Hex | Символ | |
---|---|---|---|---|---|---|
000 | 00 | NOP | 128 | 80 | Ђ | |
001 | 01 | SOH | 129 | 81 | Ѓ | |
002 | 02 | STX | 130 | 82 | ‚ | |
003 | 03 | ETX | 131 | 83 | ѓ | |
004 | 04 | EOT | 132 | 84 | „ | |
005 | 05 | ENQ | 133 | 85 | … | |
006 | 06 | ACK | 134 | 86 | † | |
007 | 07 | BEL | 135 | 87 | ‡ | |
008 | 08 | BS | 136 | 88 | € | |
009 | 09 | TAB | 137 | 89 | ‰ | |
010 | 0A | LF | 138 | 8A | Љ | |
011 | 0B | VT | 139 | 8B | ‹ | |
012 | 0C | FF | 140 | 8C | Њ | |
013 | 0D | CR | 141 | 8D | Ќ | |
014 | 0E | SO | 142 | 8E | Ћ | |
015 | 0F | SI | 143 | 8F | Џ | |
016 | 10 | DLE | 144 | 90 | ђ | |
017 | 11 | DC1 | 145 | 91 | ‘ | |
018 | 12 | DC2 | 146 | 92 | ’ | |
019 | 13 | DC3 | 147 | 93 | “ | |
020 | 14 | DC4 | 148 | 94 | ” | |
021 | 15 | NAK | 149 | 95 | • | |
022 | 16 | SYN | 150 | 96 | – | |
023 | 17 | ETB | 151 | 97 | — | |
024 | 18 | CAN | 152 | 98 | ||
025 | 19 | EM | 153 | 99 | ™ | |
026 | 1A | SUB | 154 | 9A | љ | |
027 | 1B | ESC | 155 | 9B | › | |
028 | 1C | FS | 156 | 9C | њ | |
029 | 1D | GS | 157 | 9D | ќ | |
030 | 1E | RS | 158 | 9E | ћ | |
031 | 1F | US | 159 | 9F | џ | |
032 | 20 | SP | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | « | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | ‘ | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Ё | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | AC | ¬ | |
045 | 2D | — | 173 | AD | | |
046 | 2E | . | 174 | AE | ® | |
047 | 2F | / | 175 | AF | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | ё | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | BA | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | BC | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | BE | ѕ | |
063 | 3F | ? | 191 | BF | ї | |
064 | 40 | @ | 192 | C0 | А | |
065 | 41 | A | 193 | C1 | Б | |
066 | 42 | B | 194 | C2 | В | |
067 | 43 | C | 195 | C3 | Г | |
068 | 44 | D | 196 | C4 | Д | |
069 | 45 | E | 197 | C5 | Е | |
070 | 46 | F | 198 | C6 | Ж | |
071 | 47 | G | 199 | C7 | З | |
072 | 48 | H | 200 | C8 | И | |
073 | 49 | I | 201 | C9 | Й | |
074 | 4A | J | 202 | CA | К | |
075 | 4B | K | 203 | CB | Л | |
076 | 4C | L | 204 | CC | М | |
077 | 4D | M | 205 | CD | Н | |
078 | 4E | N | 206 | CE | О | |
079 | 4F | O | 207 | CF | П | |
080 | 50 | P | 208 | D0 | Р | |
081 | 51 | Q | 209 | D1 | С | |
082 | 52 | R | 210 | D2 | Т | |
083 | 53 | S | 211 | D3 | У | |
084 | 54 | T | 212 | D4 | Ф | |
085 | 55 | U | 213 | D5 | Х | |
086 | 56 | V | 214 | D6 | Ц | |
087 | 57 | W | 215 | D7 | Ч | |
088 | 58 | X | 216 | D8 | Ш | |
089 | 59 | Y | 217 | D9 | Щ | |
090 | 5A | Z | 218 | DA | Ъ | |
091 | 5B | [ | 219 | DB | Ы | |
092 | 5C | \ | 220 | DC | Ь | |
093 | 5D | ] | 221 | DD | Э | |
094 | 5E | ^ | 222 | DE | Ю | |
095 | 5F | _ | 223 | DF | Я | |
096 | 60 | ` | 224 | E0 | а | |
097 | 61 | a | 225 | E1 | б | |
098 | 62 | b | 226 | E2 | в | |
099 | 63 | c | 227 | E3 | г | |
100 | 64 | d | 228 | E4 | д | |
101 | 65 | e | 229 | E5 | е | |
102 | 66 | f | 230 | E6 | ж | |
103 | 67 | g | 231 | E7 | з | |
104 | 68 | h | 232 | E8 | и | |
105 | 69 | i | 233 | E9 | й | |
106 | 6A | j | 234 | EA | к | |
107 | 6B | k | 235 | EB | л | |
108 | 6C | l | 236 | EC | м | |
109 | 6D | m | 237 | ED | н | |
110 | 6E | n | 238 | EE | о | |
111 | 6F | o | 239 | EF | п | |
112 | 70 | p | 240 | F0 | р | |
113 | 71 | q | 241 | F1 | с | |
114 | 72 | r | 242 | F2 | т | |
115 | 73 | s | 243 | F3 | у | |
116 | 74 | t | 244 | F4 | ф | |
117 | 75 | u | 245 | F5 | х | |
118 | 76 | v | 246 | F6 | ц | |
119 | 77 | w | 247 | F7 | ч | |
120 | 78 | x | 248 | F8 | ш | |
121 | 79 | y | 249 | F9 | щ | |
122 | 7A | z | 250 | FA | ъ | |
123 | 7B | { | 251 | FB | ы | |
124 | 7C | | | 252 | FC | ь | |
125 | 7D | } | 253 | FD | э | |
126 | 7E | ~ | 254 | FE | ю | |
127 | 7F | DEL | 255 | FF | я |
Описание специальных (управляющих) символов
Первоначально управляющие символы таблицы ASCII (диапазон 00-31, плюс 127) были разработаны для того, чтобы управлять устройствами аппаратных средств, таких как телетайп, ввод данных на перфоленту и др.
Управляющие символы (кроме горизонтальной табуляции, перевода строки и возврата каретки) не используются в HTML-документах.
Код | Описание |
---|---|
NUL, 00 | Null, пустой |
SOH, 01 | Start Of Heading, начало заголовка |
STX, 02 | Start of TeXt, начало текста |
ETX, 03 | End of TeXt, конец текста |
EOT, 04 | End of Transmission, конец передачи |
ENQ, 05 | Enquire. Прошу подтверждения |
ACK, 06 | Acknowledgement. Подтверждаю |
BEL, 07 | Bell, звонок |
BS, 08 | Backspace, возврат на один символ назад |
TAB, 09 | Tab, горизонтальная табуляция |
LF, 0A | Line Feed, перевод строки Сейчас в большинстве языков программирования обозначается как \n |
VT, 0B | Vertical Tab, вертикальная табуляция |
FF, 0C | Form Feed, прогон страницы, новая страница |
CR, 0D | Carriage Return, возврат каретки Сейчас в большинстве языков программирования обозначается как \r |
SO, 0E | Shift Out, изменить цвет красящей ленты в печатающем устройстве |
SI, 0F | Shift In, вернуть цвет красящей ленты в печатающем устройстве обратно |
DLE, 10 | Data Link Escape, переключение канала на передачу данных |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Device Control, символы управления устройствами |
NAK, 15 | Negative Acknowledgment, не подтверждаю |
SYN, 16 | Synchronization. Символ синхронизации |
ETB, 17 | End of Text Block, конец текстового блока |
CAN, 18 | Cancel, отмена переданного ранее |
EM, 19 | End of Medium, конец носителя данных |
SUB, 1A | Substitute, подставить. Ставится на месте символа, значение которого было потеряно или испорчено при передаче |
ESC, 1B | Escape Управляющая последовательность |
FS, 1C | File Separator, разделитель файлов |
GS, 1D | Group Separator, разделитель групп |
RS, 1E | Record Separator, разделитель записей |
US, 1F | Unit Separator, разделитель юнитов |
DEL, 7F | Delete, стереть последний символ. |
Смотрите также:
URL коды символов ACSII
URL коды символов UTF-8 диапазон от U+0400 до U+04FF
HTML Кодирование URL
Таблица кодов символов кирилицы UTF-8
Как исправить проблемы с отображением русских букв в Windows 10
При работе с Windows 10 у пользователей иногда возникают проблемы с правильным отображением символов. Вместо привычных букв и цифр в тексте мы можем лицезреть какие-то замудрённые иероглифы или «кракозябры», которые не несут в себе никакого логического смысла. Чаще всего к этому приводят неправильно установленные значения в опциях региональных параметров.
Нередко такое случается, когда пользователь работает с русской раскладкой клавиатуры в ОС с английской локализацией. Проблема заключается в том, что в такой системе для программ, работающих с кириллицей, не предусмотрена обработка нужных символов. Также это справедливо и для других языков, в которых отсутствуют латинские символы, например, японского, китайского или греческого.
Сегодня мы поговорим о том, как избавиться от кракозябр в Windows 10 и настроить корректное отображение русских символов.
Как правило, мы можем наблюдать эти кракозябры не в каждой программе. Например, символы, изображённые кириллицей в названии программ, отображены корректно. Но если запустить программу установки дистрибутивов, поддерживающих русский язык, мы получаем неведомую нам «китайскую грамоту».
И, пожалуй, основная проблема кроется в том, что в имеющейся ОС по дефолту отсутствует поддержка кириллических символов. На практике это может значить, что вы инсталлировали английский дистрибутив с установленным поверх него расширенным пакетом русификации. Однако последний не смог решить проблему корректно.
Первое, что пытаются делать пользователи в такой ситуации – переустановка операционки с чистого листа. Однако не все согласятся на такое, ведь кто-то, возможно, намеренно хочет работать с англоязычной средой. И в этой среде кириллические символы по идее могут и должны отображаться корректно.
Прежде всего, попробуем исправить ошибку через панель управления. Чтобы зайти в неё нажимаем ПКМ по кнопке-меню «Пуск» и в выпавшем списке выбираем соответствующий пункт.
В открывшемся новом окне находим раздел Часы, язык, регион.
В новом разделе выбираем категорию региональных стандартов.
Здесь мы сможем настроить вариант даты и времени, а также числовой разделитель, количество дробных значений, формат отрицательных чисел, систему единиц измерения и пр.
Также здесь нам предлагается изменить формат денежных единиц и обозначение таковых. Здесь же мы можем настроить локальные параметры для разных регионов, включая отображаемые в системе текстовые символы. Именно эти опции нас и интересуют. Для их выбора переходим ко вкладке «Дополнительно» в верхней части окна.
Переходим в раздел выбора языка, не поддерживающего Юникод, и далее выбираем опцию изменение языка системы.
В списке выбираем нужный вариант (в нашем случае «Русский (Россия)» и нажимаем «ОК»)
В появившемся окне уведомлений выбираем «Перезагрузить сейчас».
ПК уйдёт в перезагрузку, после чего проблема с кракозябрами должна исчезнуть. Однако не всегда этот способ срабатывает. Если он не помог решить проблему, рассмотрим ещё один вариант, в котором нам придётся поработать с реестром.
Загрузка …
Для начала нам нужно создать обычный файл в текстовом редакторе. Сохранить его нужно будет с расширением .reg. Таким образом, мы сможем прописать нужные параметры в файле и применить изменения непосредственно к реестру. Вот что нам следует прописать в нашем файлике:
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\FontMapper] «ARIAL»=dword:00000000
[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\FontSubstitutes]
«Arial,0″=»Arial,204»
«Comic Sans MS,0″=»Comic Sans MS,204»
«Courier,0″=»Courier New,204»
«Courier,204″=»Courier New,204»
«MS Sans Serif,0″=»MS Sans Serif,204»
«Tahoma,0″=»Tahoma,204»
«Times New Roman,0″=»Times New Roman,204»
«Verdana,0″=»Verdana,204»
Просто скопируйте это в свой текстовый документ и сохраните его. Теперь нужно запустить созданный и сохранённый файл, кликнув по нему дважды ЛКМ. Соглашаемся с системным уведомлением о внесении изменений в ОС. Далее перезагружаем ПК. Как правило, перед любыми изменениями в реестре нужно создавать резервную копию реестра, чтобы в любой момент можно было откатить его к первоначальной конфигурации.
Загрузка …
Страницы кода отвечают за сопоставление символов с байтами. Таких таблиц бывает много, и каждая из них работает с различными языками. Зачастую кракозябры появляются при неправильном выборе страницы и её сопоставлении. Чтобы исправить это, нам предстоит поработать с реестром. Для этого:
- Win+R запускаем системную службу «Выполнить». Прописываем в единственной строке regedit и жмём Ок.
- В окне реестра нам нужно перейти по следующему пути: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls
- Здесь выбираем папку CodePage и в правой части окна идём вниз, чтобы найти пункт ACP.
- Дважды кликаем ЛКМ по ACP, и перед нами открывается окно изменений строковых настроек. Здесь выставляем значение 1251. Если такое значение уже установлено для этого пункта, тогда нужно сделать по-другому.
Загрузка …
Находясь в том же разделе CodePage, в правой части окна ищем пункт 1252. Жмём по нему дважды ЛКМ и в появившемся окне меняем текущее значение 1252 на 1251.
После произведённых манипуляций отправляем компьютер в перезагрузку, чтобы применённые изменения вступили в силу.
Загрузка …
Post Views:
10 291
кириллических шрифтов для MS Windows
кириллических шрифтов для MS Windows
СОДЕРЖАНИЕ
Интернет: два типа кодировки кириллицы для Windows-клиента
Хорошо, вы работаете с MS Windows и хотите просматривать русский язык
Веб-сайтов или просто используйте кириллицу в текстовом редакторе.
Если у вас , а не , собираетесь работать с кириллицей (русской) на
Интернет , и хотел бы, скажем, просто создать русский документ
в MS Word, тогда вы делаете , а не , нужно это читать,
Связанный с Интернетом раздел и может
перейти непосредственно к следующему разделу этой страницы —
который поможет вам использовать русский язык в текстовом редакторе или текстовом редакторе:«Кириллические шрифты включены в Windows ».
Разные авторы кириллических веб-страниц используют различных методов
для представления кириллических букв, то есть используются разные кодировки .
Кодировка определяет, какой код (числовое значение)
присваивается каждой букве набора символов.
Например, в кодированном наборе западноевропейских символов
Английская буква A имеет код 65, немецкая a-umlaut — 228 и т. Д.
Метод кодирования напрямую связан с используемым шрифтом , то есть
шрифты созданы для определенной кодировки.
Исторически (и к сожалению) существует несколько разных ,
несовместимые кодировки кириллицы:
- MS Windows использует кодировку «Windows Cyrillic» (кодовая страница 1251).
В меню браузера эта кодировка называется «Кириллица (Windows)» или «Кириллица (Windows-1251)» - В Internet для русского языка в почте и новостях используется кодировка KOI8-R, а также
на некоторых русскоязычных сайтах - Macintosh использует кодировку Mac Cyrillic
- Unix компьютеры используют кодировку Cyrillic ISO-8859-5 или KOI8-R
Отличие в том, что одни и те же буквы кириллицы имеют разные
кодирует в этих кодировках, поэтому они несовместимы.
Это,
- Текст, написанный под Macintosh, будет выглядеть бессмысленным набором
символов под Windows, т.к. там кириллические шрифты сделаны для Windows-1251
кодировка и, следовательно, буквы кириллицы находятся не на тех позициях, которые предполагает «Mac Cyrillic» - Это могло произойти даже в одной среде, скажем,
под MS Windows —
если один человек пишет в текстовом редакторе русский текст (например, файл abc.TXT)
используя шрифт кодировки KOI8-R , и другой человек попытается прочитать этот русский текст
со шрифтом, который принадлежит кодировке « Windows Cyrillic «,
тогда этот второй человек увидит только бессмысленный набор букв.
Опять же, это происходит потому, что шрифты созданы для определенных кодировок.
и текст хранится в компьютерах как набор кодов , , представляющих буквы.
Например, английское слово «собака» хранится как набор кодов для
соответствующие письма: 100 111 103
Английские буквы имеют одинаковые коды в разных кодировках,
Таким образом, слово «собака» можно будет прочитать любым шрифтом на любом компьютере (даже на японском).
Для кириллицы это не так.Например, русское слово «три»
содержит следующие русские буквы -.
Написано шрифтом в кодировке кириллицы Windows-1251,
он будет храниться как 242 240 232 — это
коды присвоены этим буквам в кодировке и этой кодировке .
Теперь, если мы попытаемся прочитать этот текст, используя шрифт другой кодировки, скажем,
кодировки KOI8-R или «Macintosh Cyrillic», где то же
Кириллические буквы имеют различных кодовых значений ,
тогда текст будет нечитабельным.
Например, в шрифте KOI8-R эти 3 кода обозначают совершенно разные русские языки.
буквы, поэтому этот текст ( 242 240 232 ) будет показан
как следующий набор русских букв —
что , а не не имеет никакого смысла.
Это был небольшой кусочек теории / объяснения, а теперь вернемся к
практика.
Пользователь MS Windows обычно имеет дело со следующими двумя
Кодировки кириллицы на Web :
Примечание.В приложениях , не относящихся к Интернету, под MS Windows, таких как редакторы и текстовые процессоры (например, MS Word),
люди используют только , одна кодировка для русского — Windows-1251, это то, что Microsoft использует для системы:
все шрифты Microsoft , поддерживающие кириллицу («Arial», «Times New Roman», «Courier New» и т. д.)
— это шрифты, созданные для кодировки Windows-1251, а также инструменты Cyrillic keyboard .
Современные браузеры и почтовые / новостные программы — MS Internet Explorer, Outlook Express, MS Outlook,
Netscape ver.4 и выше, Mozilla и т. Д. — для , а не для требуются шрифты KOI8-R
обрабатывать кодировку KOI8-R
тексты (веб-страницы, сообщения электронной почты и т. д.)
Более того, такие современные программы просто не работают со шрифтами KOI8-R.
Объяснение будет дано ниже, в
следующий раздел посвящен KOI8-R.
Старые системы (например, Windows 3.1 / 3.11) и более старые программы (например, Netscape 3 ) требовали
KOI8-R шрифты.
Некоторым приложениям по-прежнему требуются шрифты KOI8-R, но они не являются основными программами,
очень немногие используют их (например, некоторые программы эмуляции терминала, старые версии почтовой программы Eudora).Я предлагаю скачать бесплатные шрифты KOI8-R для этого типа пользователей (старые системы, редкое программное обеспечение),
но я поместил соответствующую информацию в конце этой страницы, потому что она редко нужна —
он находится в разделе этой страницы под названием
«Бесплатная , отличная от Microsoft ,» старая « (сделанная для Windows 3.1) русских шрифтов »
Почему пользователю MS Windows нужно знать о кодировке KOI8-R
?
Почему тогда этому пользователю не нужны шрифты KOI8-R / клавиатура ?
KOI8-R, как и другие кириллические кодировки, иногда используется
для представления русского текста на веб-странице, но его основная цель — служить
сеть , транспорт кодирование с первых дней Интернета.
Видите ли, разные компьютеры используют разные локальные кодировки для русского языка:
- Машины MS Windows — кодировка Windows-1251
- Машины OS / 2, а также пользователи сети DOS и FIDO7 — кодировка CP-866
- UNIX — кодировка ISO-8859-5 (в России KOI8-R также используется в UNIX)
- Apple Macintosh — кодировка Mac Cyrillic
К сожалению, эти кодировки несовместимы с . Как это случилось
еще в компьютерной истории, и теперь это реальность.
То есть пользователь Mac может , а не читать текст Windows-1251 без специального
преобразование, и наоборот.
Итак, как все эти разных компьютеров обмениваются русскими сообщениями по
глобальная сеть, интернет ?
Они используют кодировку «общая земля» — KOI8-R, которая служит в качестве «транспорта»
кодирование.
Большая часть программного обеспечения, связанного с Интернетом, которое может работать с кириллицей
(Почтовый и новостной серверы, а также программы-клиенты электронной почты и программы чтения новостей)
‘знай’, что KOI8-R — это сетевая кодировка , а когда русская
сообщение «путешествует» по Интернету в этой кодировке, все
различных компьютеров умеют обращаться с этим.
То есть, скажем, программе электронной почты Macintosh не нужно было знать , а не , как обрабатывать
все многочисленные кириллические кодировки, она должна была знать только свою, локальную, плюс
KOI8-R как «транспортная» кодировка.
(Конечно, если программа не может работать с кириллицей вообще , например,
Английская версия Lotus cc: Mail, то про
любая из русских кодировок, включая KOI8-R).
Представьте, если все различных компьютеров отправят сообщений в Интернет
в собственных локальных кодировках
(из Windows — в «Windows-1251», из UNIX — в «ISO-8859-5» и т. Д.)) !
Самый простой пример — это группы новостей. Группа новостей может быть прочитана пользователем
из Mac, Windows или Unix. Тогда сообщения в этой группе новостей только должны
использовать одну общую кодировку кириллицы для пользователя
каждая платформа, чтобы иметь возможность ее прочитать.
А теперь представьте, что этот сервер новостей ведет цепочку (с кириллицей в теме)
русскоязычной группы новостей, где
одно сообщение от пользователя Unix — в ISO-8859-5,
другое сообщение от пользователя OS / 2 или DOS — в CP-866,
еще один от пользователя Windows — в Windows-1251.
Такая ветка будет нечитабельна для любого пользователя …
Имея только один , общая кодировка для русских сообщений, путешествующих
через Интернет разрешает ситуацию, и эта общая кодировка — исторически — KOI8-R:
КОИ8-Р использовался как «точка соприкосновения» для русских в регионах.
электронной почты, групп новостей Usenet, Telnet и т. д.
с первых дней Интернета, даже когда Интернет еще не существовал,
поэтому все программы, связанные с Интернетом, разработанные для работы с кириллицей, были построены с предположением
что кодировка сети — KOI8-R.
Вот почему большинство писем на русском языке отправлено в KOI8-R,
и большинство русскоязычных Группы новостей Usenet (дискуссионные группы)
использовать KOI8-R, который делает статьи групп новостей доступными для чтения пользователем
любой компьютер типа .
Очевидно, группа пользователей, где все говорят, что работает под Windows, может решить, что они
будет обмениваться сообщениями в кодировке «Windows-1251» по электронной почте или только в Windows
Группа новостей.
Но на самом деле даже группы новостей только для Windows, такие как
microsoft.public.ru.russian. * иерархия
(microsoft.public.ru.russian.windowsxp и др.)
до сих пор использую KOI8-R …
То есть KOI8-R является стандартом де-факто для обмена русскими текстами через интернет ,
это кодировка сети , в то время как разные компьютеры используют разные
локальная кодировок для русского языка. Одна из таких локальных кодировок
это Windows-1251 (Windows Cyrillic)
на машине под управлением MS Windows.
KOI8-R и Интернет-программное обеспечение под MS Windows
Пользователю MS Windows необходима возможность работы с кодировкой KOI8-R в
дополнение к «родной» русской кодировке Windows-машины — Windows-1251:
- Есть русскоязычный Интернет страниц в КОИ8-Р.
То есть ваш браузер должен отображать текст KOI8-R.
Некоторые страницы KOI8-R содержат также формы , которые необходимо заполнить, то есть
они ожидают ввода текста KOI8-R в дополнение к отображению
текста КОИ8-Р - электронная почта писем нужно отправить в Интернет в KOI8-R
и входящие электронные письма в большинстве случаев приходят из Интернета
в КОИ8-Р - Русский Группы новостей Usenet (дискуссионные группы) используют KOI8-R, поэтому
их статьи содержат текст KOI8-R.Новые статьи должны быть
также размещен в группе новостей в KOI8-R.
Если программное обеспечение, используемое в перечисленных выше случаях, является устаревшим программным обеспечением (например, Netscape 3 ) или
недостаточно изощренный,
тогда пользователь должен установить шрифты KOI8-R (предлагается ниже на этой странице)
и клавиатура KOI8-R tools (предлагается в разделе «Русская клавиатура» моего сайта)
чтобы иметь возможность читать и писать в KOI8-R.
В противном случае, если это программа , современная , она позволяет пользователю MS Windows
работают только с локальной кодировкой -Windows-1251 («Кириллица (Windows)»),
пользователю , а не нужны шрифты KOI8-R и инструменты клавиатуры.
Например, электронное письмо может быть набрано как с использованием шрифтов Windows-1251 и инструментов клавиатуры,
но будет отправлено в Интернет в KOI8-R, чтобы «путешествовать» по
сеть в кодировке «общая земля», если требуется.
Вот некоторые из таких современных Интернет-программ:
- Internet Explorer
- Outlook Express
- MS Outlook вер. 2000 и выше
- Netscape ver. 4 и выше и его компоненты Почта и Новости
- Mozilla и ее компоненты почты и новостей
Эти программы выполняют «за кадром»,
все необходимые преобразований русского текста между Windows-1251 и KOI8-R
при необходимости.
Следовательно, если у вас этих программ , то вам НЕ нужны шрифты KOI8-R
и KOI8-R клавиатура инструменты:
- чтение текстов КОИ8-Р
Эти программы преобразуют текст KOI8-R в текст Windows-1251 с до .
отображение его вам (отображение с использованием собственных шрифтов Windows-1251, таких как «Arial») ,
в следующих случаях:- , чтобы показать вам KOI8-R Web page
- , чтобы показать вам входящее письмо по электронной почте , пришедшее из Интернета —
по правилам — в
сетевая кодировка KOI8-R - , чтобы показать вам статью KOI8-R русскоязычной группы новостей (дискуссионная группа)
(опять же, большинство групп новостей на русском языке используют KOI8-R как «общую основу»,
потому что пользователь может публиковать и читать статьи с разных компьютеров —
UNIX, Mac, Windows и т. Д.)
- запись в KOI8-R, то есть создание текста KOI8-R.
Современные программы конвертируют ваш ввод Windows-1251 в (который вы сделали с помощью Windows-1251
шрифты и инструменты клавиатуры — родные для MS Windows)в текст KOI8-R при необходимости:
MS Internet Explorer, Outlook Express, MS Outlook 2000, Netscape, Mozilla —
все эти программы должны быть настроены на на русский язык,
нужно уметь работать с русским языком с помощью этих программ.
После вы закончите читать эту страницу шрифтов и кодировок,
см. соответствующие инструкции по настройке для перечисленных выше программ на моей странице
«Русский язык в браузерах / Почта / Новости под Windows» .
Другие программы (программы электронной почты, графические программы, музыкальные программы,
и т. д.) требуют собственной уникальной настройки для русского языка.
Я лично знаю тюнинг только
для программ, перечисленных выше, поэтому, если вам нужно настроить, скажем, Eudora или WinAMP, тогда
пожалуйста, посмотрите ссылки на другие сайты людей в разделе
«Еще русификация.Вопросы и ответы, Ссылки « моего сайта.
Web и
два шрифта типа
Как правило, World Wide Web использует методы 2 для отображения
у вас на экране текст :
Для каждого типа страницы в вашем браузере должен использоваться собственный шрифт:
К содержанию
Шрифты Microsoft Cyrillic CP-1251
включены в Windows
Некоторые бесплатные кириллических шрифтов, отличных от Microsoft
(из семейств кодировок KOI8-R и Windows-1251)
предлагаются в следующем разделе .
Но C ode P возраст 1251 ( CP-1251 )
это то, что Microsoft использует для кириллицы в MS Windows.
(следующие альтернативные имена
часто используется для кириллицы CP-1251 кодировка:
«Кириллица (Windows)», «Windows-1251»).
То есть всякий раз, когда вы видите слово «кириллица» в шрифте или клавиатуре Microsoft
описание, на самом деле это означает «Кириллица, Windows-1251 кодировка «.
Следовательно, для эта кодировка , родная для Windows, вы должны:
вместо загрузки некоторых старых шрифтов сторонних разработчиков ,
использовать собственные кириллические шрифты Microsoft гораздо лучшего качества
которые уже включены в вашу Windows.
Более того, многие современных приложений просто , а не работают с такими старыми не-MS.
шрифты, они работают только с современными шрифтами Unicode , включенными в Windows, такими как «Arial» и др.
(В большинстве случаев также нет необходимости загружать шрифты KOI8-R —
как было сказано выше, современные программы не работают со шрифтами KOI8-R, они обрабатывают
KOI8-R тексты без таких шрифтов).
Кириллические буквы кодировки Windows-1251 присутствуют в такой стандартной многоязычной Windows.
шрифты как «Arial», «Times New Roman», «Courier New» и др.
Эти стандартные шрифты Microsoft Cyrillic доступны на всех современных
версии Windows, даже если это не русская Windows
(для нерусской Windows 3.1 / 3.11 это не так и пользователь должен
загрузите те бесплатные шрифты сторонних производителей, предлагаемые в следующем разделе) .
Вот процедура проверки наличия и / или активации этих стандартных шрифтов
Кириллица (Windows-1251) в кодировке включена в Windows 95/98 / ME / NT 4.0/2000 / XP / 2003 / Vista:
1. Русские (локализованные) версии MS Windows
Пользователи русских версий MS Windows уже имеют
такие CP-1251 шрифтов активированы (как и у пользователей PanEuropean Windows 95).
Просто откройте редактор Wordpad (Пуск / Программы / Стандартные / Wordpad) и
увидеть кириллические вариации нескольких шрифтов,
например, вы увидите, помимо «западного» варианта (сценария), следующее:
- Пропорциональные шрифты — «Arial (Cyrillic)»,
«Times New Roman (кириллица)» - Исправлено — «Courier New (кириллица)»
2.Окна 95/98 / ME
Большинство пользователей версии U.S. (или другой нерусской версии) Windows 95/98 / ME изначально не имеют этих кириллических вариантов стандартных шрифтов Microsoft.
Для активации кириллицы в стандартных шрифтах MS эти пользователи должны
установите бесплатное программное обеспечение Microsoft — « MS Multilanguage Support » — обычно через Панель управления.
(помимо шрифтов , активируется кириллица
клавиатура файлов тоже).
Вот моя краткая инструкция по его установке:
«Windows 95/98 / ME: поддержка кириллицы и многоязычности MS».
3. Windows NT 4.0 / 2000 / XP / 2003 / Vista
Пользователи Windows U.S. (или любой другой нерусской) версии Windows NT 4.0 / 2000 / XP / 2003 / Vista
уже есть такие стандартные, Windows-1251 шрифты!
Вот несколько способов проверить это:
- Если у вас есть доступ в Интернет, перейдите на русский сайт
например, скажем «поисковая машина Яндекс»
и сами убедитесь, что русский текст читается Ок, там.
Это означает, что стандартные шрифты Windows, которые браузер использует для отображения —
«Arial» или «Times News Roman» — содержат кириллицу, в противном случае
вы не увидите на этом сайте никакого читаемого текста. - Откройте редактор Wordpad (Пуск / Программы / Стандартные / Wordpad) и
увидеть кириллические вариации нескольких шрифтов,
например, вы увидите, помимо «западного» варианта (сценария), следующее:- Пропорциональные шрифты — «Ариал (кириллица)»,
«Times New Roman (кириллица)» - Исправлено — «Courier New (кириллица)»
- Пропорциональные шрифты — «Ариал (кириллица)»,
Важное примечание для Windows 2000:
Хотя кириллические шрифты Windows-1251 уже активны в Windows 2000,
для этого требуется (в отличие от Windows NT 4.0 и Windows XP / 2003 / Vista) специальный
процедура включения полной поддержки кириллицы для пользователя, например,
включить конвертацию кодировки и / или получить файл русской раскладки клавиатуры.
То есть пользователь Windows 2000 должен выполнить следующие дополнительные шаги (не требуется в Windows NT 4.0 / XP / 2003 / Vista) .
Как включить полную поддержку кириллицы на уровне пользователя в Windows 2000:
- Пуск / Настройка / Панель управления
- В окне ПАНЕЛЬ УПРАВЛЕНИЯ — дважды щелкните значок
значок региональных параметров в виде земного шара - В окне «Региональные параметры» на вкладке Общие см. Второй фрейм — «Языковые настройки для системы ».
- Посмотрите, стоит ли у вас галочка в поле «Кириллица».
Если нет, то щелкните это поле, чтобы активировать поддержку кириллицы на уровне пользователя и
затем нажмите Применить внизу справа.
Вам будет предложено вставить компакт-диск Windows 2000, а затем
необходимые файлы будут скопированы оттуда.
Вы видели выше, как включить поддержку кириллицы (Windows-1251) в стандартных шрифтах MS.
которые входят в состав Windows 95/98 / ME / NT 4.0/2000 / XP / 2003 / Vista.
Итак, если у вас , ваша версия MS Windows :
- есть теперь эти симпатичные кириллица Windows-1251 букв в стандартной многоязычной
Шрифты Windows, такие как «Arial»
а также - делать не нужны KOI8-R шрифты
(то есть, как было подробно объяснено выше, вы используете современные системы и современные интернет-программы
которые, как было объяснено выше, позволяют вам работать
с текстами KOI8-R без необходимости использования шрифтов KOI8-R и клавиатурных инструментов;
или вы вообще не используете русский язык в Интернете, только в текстовом редакторе)
тогда вам следует пропустить оставшуюся часть этой страницы, связанной со шрифтами,
потому что текст ниже о тех старых бесплатных , отличных от Microsoft
Русские шрифты KOI8-R и CP-1251, которые я собрал из Интернета во время работы с Netscape 3 и / или Windows 3.1
Эти старые бесплатные русские шрифты , отличные от Microsoft KOI8-R и CP-1251, работают только с , а не с .
современные программы, такие как Internet Explorer, Outlook Express, Mozilla и т. д., поэтому пользователи таких программ
нет причин читать остальную часть этой страницы.
(Современные программы работают с современными шрифтами Unicode , включенными в MS Windows, например «Arial» и др.)
К содержанию
Бесплатные русские шрифты
сторонних производителей
1.Загрузите предлагаемые шрифты из Интернета
Ниже вы найдете загрузку , расположение и
описания бесплатно кириллические шрифты —
кодирование как KOI8-R, так и Windows-1251 —
что я нашел в Интернете, протестировал , и предлагаю
использовать для работы в сети под MS Windows — только в некоторых редких случаях.
Важно. Как было объяснено выше, в конце предыдущего раздела,
Вам понадобятся эти старые шрифты сторонних разработчиков только в следующих случаях
( большинству пользователей Windows они не нужны):
- вы работаете с Windows 3.1 / 3,11
или же
- нужно KOI8-R шрифтов
Как было подробно описано в начале этой страницы, вам нужны только шрифты KOI8-R.
если вы работаете с какой-либо программой, не относящейся к основному потоку, такой как Netscape 3 . Редкий случай!
Современные программы — как я описал выше — делают , а не нужны (и не работают) с KOI8-R
шрифты, они обрабатывают тексты KOI8-R без этого.
Так что, только если вам нужны описанные выше редкие сценарии, читайте дальше, иначе эта страница закончится.
Все эти бесплатные шрифты сторонних производителей позволяют читать на одной странице и английский, и русский языки.
(наряду с кириллицей они включают в себя английские буквы).
Вам необходимо создать каталог (папку) на вашем ПК, где вы будете размещать
эти файлы шрифтов, например, C: \ RUSFONTS .
Я создал один файл (архив) ForWWW.zip , который включает в себя все
эти бесплатные русские шрифты.
Чтобы скачать файл, вам просто нужно нажать на его подчеркнутый
имя в ссылке ниже. Затем ваш браузер предлагает СОХРАНИТЬ ФАЙЛ .
В этом диалоговом окне СОХРАНИТЬ ФАЙЛ вам нужно выбрать каталог (папку)
которые вы создали для хранения файлов шрифтов — C: \ RUSFONTS .
ПРИМЕЧАНИЕ:
Если браузер вместо этого начинает с , отобразить содержимое этого файла
на экране, затем попробуйте загрузить его еще раз, но на этот раз удерживайте
SHIFT на клавиатуре, щелкая этот файл.
Вот:
файл ForWWW.zip
После скачивания архива (файл ForWWW.zip ) необходимо
откройте (разархивируйте) его, чтобы извлечь файлы из него.
Вы можете извлечь файлов из архива с помощью условно-бесплатного ПО.
программа WinZip для Windows, если она у вас есть
ИЛИ
просто с помощью небольшой бесплатной программы MS DOS pkunzip .
Если у вас нет PKUNZIP, вы можете скачать его здесь:
pkunzip.exe.
Поместите его в каталог (папку) Windows (или WinNT ),
то есть в вашу основную папку MS Windows.
Чтобы извлечь файлы шрифтов с помощью pkunzip ,
сначала откройте окно MS-DOS :
- в Windows 95/98 / ME — Пуск / Программы / Подсказка MS-DOS
- в Windows NT 4.0 — Пуск / Программы / Командная строка
- в Windows 2000 / XP / 2003 / Vista — Пуск / Программы / Стандартные / Командная строка
- в Windows 3.1, 3.11 это значок «MS-DOS Prompt» в группе Main
а затем введите эти две команды MS DOS
(первый переключает на нужный каталог (папку) и
второй выполняет извлечение) :
C: \ ........> cd \ RUSFONTS C: \ RUSFONTS> pkunzip для www.zip
2. Описание загруженных шрифтов.
ПРИМЕЧАНИЕ: я собрал в ForWWW.zip такие шрифты, которые нормально работают со старым Netscape 2,3
и другие старые программы под разными версиями Windows.
Если вы где-то нашли другую версию того же шрифта, возможно, не работает правильно
с помощью Netscape ver. 2,3 или с какой-либо платформой Windows (например, NT 4.0).
Помните, что для работы с кириллицей в старом браузере, например, Netscape 3 ,
нужно установить не менее 4 новой кириллицы
Шрифты True Type в вашей Windows:
- Пропорциональные и фиксированные шрифты для кодировки KOI8-R
- Пропорциональные и фиксированные шрифты для кодировки CP-1251 (Windows) (a.k.a «Окна-1251»)
(как было описано в начале этой страницы, современные браузеры не работают
со шрифтами KOI8-R им требуется только шрифты Windows-1251)
а) KOI8-R шрифтов:
- ‘ЭР Букинист КОИ-8 Нормальный’ — Шрифт пропорциональный —
дело bkkoi8n.TTF от 20 декабря 1995 г. - ‘ROL: KOI8-Courier’ — Фиксированный шрифт —
файл rolk8c1.TTF от 27 февраля 1997 г.ПРИМЕЧАНИЕ. Под Windows NT 4.0 —
версии до Service Pack 3 — шрифт
‘ROL: KOI8-Courier’ работает с
ошибка в Netscape 3 при отображении маркированных списков , таких как
Yahoo! страница поиска.
Следовательно, для эти версии NT нужно использовать еще
Исправлен шрифт KOI8-R:‘ER Kurier KOI-8 Normal’ — Фиксированный шрифт —
файл cokoi8n.TTF от 15 ноября 1995 г.
б) CP-1251 (Windows) шрифты:
- ‘ER Bukinist 1251’ — Пропорциональный шрифт —
дело bk1251n.TTF от 5 марта 1995 г. - ‘ER Kurier 1251’ — Фиксированный шрифт —
файл co1251n.TTF от 17 сентября 1995 г.
К содержанию
3.Как установить эти шрифты в Windows
Следуйте инструкциям ниже для Windows 3.1,3.11 и для более новых версий Windows, чтобы
установите загруженные бесплатные шрифты в вашу систему Windows.
Windows 95 и новее :
- Нажмите ПУСК , НАСТРОЙКИ , ПАНЕЛЬ УПРАВЛЕНИЯ
- Щелкните значок FONTS
- В меню выберите ФАЙЛ , УСТАНОВИТЬ НОВЫЕ ШРИФТЫ
- Выберите папку, в которой находятся все эти распакованные файлы шрифтов — C: \ RUSFONTS .
Справа есть кнопка — ВЫБРАТЬ ВСЕ . Нажмите здесь - Нажмите кнопку ОК
Windows 3.1, 3.11 :
- В Windows 3.1 у вас есть такая группа (окно) как MAIN .
Здесь, например, находится программа File Manager .
В этой группе ГЛАВНАЯ есть значок ПАНЕЛЬ УПРАВЛЕНИЯ .
Откройте это приложение двойным щелчком. - В этом окне ПАНЕЛЬ УПРАВЛЕНИЯ вы увидите несколько
иконы. Один из них — ШРИФТОВ .
Откройте приложение FONTS , дважды щелкнув его. - Справа вы увидите список шрифтов и несколько кнопок.
Один из них — ADD . Нажмите здесь. Он предложит вам
выберите диск и каталог. - Выберите каталог, в котором находятся все эти распакованные файлы шрифтов — C: \ RUSFONTS .
Справа есть кнопка — ВЫБРАТЬ ВСЕ . Нажмите здесь. - Нажмите кнопку ОК .
Вы вернетесь к экрану со списком шрифтов. - Нажмите кнопку ЗАКРЫТЬ .
Теперь у вас в Windows установлены эти русские шрифты и
готовы к использованию, если они вам понадобятся в каком-нибудь несовременном Интернет-приложении, например,
Netscape 3.
К содержанию
Сделать так, чтобы Windows правильно отображала символы языков, отличных от английского (установка программ, не поддерживающих Юникод)
Вы используете Windows на английском языке и запускаете приложения, файлы и мультимедийные файлы на других языках с другими символами? Были ли у вас проблемы с приложениями или контентом, написанными на языках, в которых используются символы, отличные от английских? Такие языки, как испанский, немецкий, польский, арабский, русский, румынский или иврит? Если да, то вам следует прочитать эту статью и понять, как заставить Windows правильно отображать символы других языков:
ПРИМЕЧАНИЕ: Это руководство применимо ко всем версиям Windows.Пожалуйста, прочтите сначала теоретические главы, а не только практические, чтобы у вас было хорошее понимание этой темы.
Что такое Юникод и почему это важно?
Во-первых, давайте поговорим о Unicode и о том, что это такое. Понимание этого означает, что вы знаете, как Windows отображает специальные символы, такие как ῦ, Ᾰ и многие другие, с разных языков.
Unicode — это стандарт кодировки символов, разработанный Консорциумом Unicode, который определяет набор букв, цифр и символов, которые представляют почти все письменные языки мира.Его успех в унификации наборов символов привел к широкому использованию при создании программного обеспечения.
Откуда тут Юникод? Когда вы говорите о программном обеспечении, написанном на языке с определенным набором символов (например, китайском), ожидается, что оно будет работать и правильно отображаться на компьютере с операционной системой, которая использует другой набор символов (например, Windows на английском языке) . Противоположная ситуация также применима: программное обеспечение, написанное на английском языке и использующее латинские символы, должно работать и правильно отображаться на компьютере с Windows на китайском языке.В таких случаях, в зависимости от того, как было написано приложение, не все символы в интерфейсе приложения могут отображаться правильно.
Сложности возникают, когда вам нужно использовать программное обеспечение и операционные системы с «конфликтующими» наборами символов. Например, приложение написано на китайском, японском, арабском, иврите, русском языке, а операционная система использует латинские символы, такие как английский, испанский, немецкий, румынский и т. Д.
Когда возникают такие конфликты, язык отображения, используемый операционной системой, считается языком Unicode, а запускаемая программа (с другим набором символов) — не-Unicode.По умолчанию программы, не поддерживающие Юникод, настроены в Windows на использование того же языка, что и операционная система. Поскольку в программе используется набор символов, совершенно отличный от того, который используется по умолчанию в языке программы, отличном от Unicode, он отображается неправильно. Чтобы решить эту проблему, вам необходимо изменить язык по умолчанию, используемый Windows для программ, не поддерживающих Unicode, чтобы он соответствовал языку, используемому приложением, которое вы хотите запустить.
Ниже вы можете увидеть пример такого конфликта и то, как некоторые символы отображались до изменения языка программ, не поддерживающих Юникод, в Windows, и после того, как он был изменен на правильный язык.
Программы, не поддерживающие Юникод, язык, Windows
Наиболее частая проблема: в субтитрах фильмов некорректно отображаются некоторые символы
Наиболее распространенная ситуация, когда язык для программ, не поддерживающих Юникод, вызывает неудобства при использовании, — это воспроизведение фильмов или других мультимедийных файлов. Например, у вас Windows на английском языке, и вы воспроизводите фильм, для которого вам нужно воспроизвести субтитры на вашем местном языке, который включает некоторые символы, которых нет на английском языке — эти символы могут отображаться неправильно.
Программы, не поддерживающие Юникод, язык, Windows
Вы также можете воспроизводить музыку на своем местном языке, а название группы или песни содержит символы, которых нет на английском языке. Скорее всего, эти символы некорректно отображаются в используемом вами медиаплеере. Установка языка для программ, не поддерживающих Юникод, на ваш местный язык устраняет эти проблемы.
Как установить язык для программ, не поддерживающих Юникод, в Windows
Не имеет значения, какую версию Windows вы используете.Вы должны открыть панель управления. Затем перейдите к «Часы, язык и регион».
Программы, не поддерживающие Юникод, язык, Windows
Если вы используете Windows 10 или Windows 8.1, перейдите в Регион . Если вы используете Windows 7, перейдите к «Регион и язык».
Программы, не поддерживающие Юникод, язык, Windows
Откроется окно Region или, если вы работаете в Windows 7, окно «Регион и язык ». Перейдите на вкладку Administrative .В «Язык для программ, не поддерживающих Юникод» вы видите текущий установленный язык для этих приложений и программ. Чтобы изменить его, щелкните или коснитесь « Изменить язык системы ».
Программы, не поддерживающие Юникод, язык, Windows
Отображается окно Настройки региона . По умолчанию вы видите текущий язык, который используется для приложений и файлов, не поддерживающих Юникод.
Программы, не поддерживающие Юникод, язык, Windows
Щелкните или коснитесь раскрывающегося списка «Текущий языковой стандарт системы» , чтобы просмотреть все языки, которые вы можете выбрать.Выберите новый язык, который вы хотите использовать, и нажмите OK .
Программы, не поддерживающие Юникод, язык, Windows
Вам сообщают, что вам необходимо перезагрузить компьютер или устройство с Windows, чтобы изменения вступили в силу. Закройте все открытые приложения и файлы и нажмите или коснитесь Перезагрузить сейчас .
Программы, не поддерживающие Юникод, язык, Windows
Windows перезапускается, и при повторном входе в систему новый язык применяется к приложениям и файлам, не поддерживающим Юникод.
ВАЖНО: изменение языка, используемого для программ, не поддерживающих Unicode, применяется ко ВСЕМ приложениям и файлам, не поддерживающим Unicode.Поэтому, если вам нужно запустить другое приложение, отличное от Unicode, которое использует другой набор символов, вам необходимо снова изменить язык программы, отличной от Unicode.
Заключение
Изменить язык, используемый для программ, не поддерживающих Unicode, не так уж и сложно. К сожалению, теория немного сложна для объяснения и понимания, но, надеюсь, мы хорошо с ней поработали. Если у вас есть какие-либо вопросы, не стесняйтесь оставлять комментарии ниже.
Как исправить отображение кириллической (русской) кодировки в Windows 10
В большинстве случаев проблемы с отображением кириллицы во всей операционной системе Windows 10 или в некоторых программах появляются сразу после ее установки на компьютер или после смены языка системы.Это связано с неверно установленными параметрами отображения кириллицы в системе. Начнем с рассмотрения двух эффективных методов решения этой проблемы.
Исправить отображение кириллических букв в Windows 10
Есть два способа решить эту проблему. Они связаны с редактированием системных настроек или определенных файлов. Они различаются по сложности и эффективности, поэтому начнем с легкости. Если первый вариант не приносит результата, переходите ко второму и внимательно следуйте инструкциям, изложенным там.
Способ 1. Измените системный язык
- Откройте меню «Пуск» и введите «Панель управления» в строке поиска. Щелкните отображаемый результат, чтобы перейти к этому приложению.
- Найдите «Регион» и щелкните этот значок.
- В открывшемся меню перейдите на вкладку «Администрирование», где нужно нажать кнопку «Изменить языковой стандарт системы …».
- Убедитесь, что пункт «Русский (Россия)» выбран, если его нет, то выберите его во всплывающем меню. Также могу порекомендовать активировать бета-версию Unicode, так как это иногда помогает решить проблему с отображением кириллицы.После всех правок нажмите ОК.
- Изменения вступят в силу только после перезагрузки ПК, поэтому перезагружаем его.
Подождите, пока компьютер перезагрузится, и проверьте, решена ли проблема с русскими буквами. Если нет, переходите к следующему, более сложному методу решения этой проблемы.
Метод 2: Редактирование кодовой страницы
Я настоятельно рекомендую вам создать точку восстановления перед выполнением этого метода, это поможет вам вернуть конфигурацию перед внесением изменений, если после них что-то пойдет не так.
- Удерживая нажатой комбинацию клавиш Win + R , введите в строке regedit и нажмите ОК.
- Окно редактора реестра содержит множество каталогов и параметров. Все они структурированы, а нужная вам папка находится по следующему пути:
HKEY_LOCAL_MACHINE \ SYSTEM \ CurrentControlSet \ Control \ Nls
- Выберите «CodePage» и спуститесь вниз, чтобы найти там имя «ACP» .В столбце «Данные» вы увидите числа, в случае, если 1251 там не задано, дважды щелкните по строке.
- В открывшемся окне введите 1251 .
- После изменения перезагрузите компьютер и проверьте, решена ли проблема.
Если значение уже равно 1251, вам нужно сделать немного другие вещи: - В той же папке «CodePage» поднимитесь по списку и найдите строковый параметр с именем «1252» . Справа вы увидите, что его значение выглядит как c_1252.NLS . Это необходимо исправить на c_1251.nls .
После завершения работы с редактором реестра обязательно перезагрузите компьютер, чтобы все изменения вступили в силу.
Как видите, есть два довольно простых метода исправить ошибку с отображением русских символов в Windows 10. Надеюсь, предоставленное нами руководство помогло вам с этой проблемой. Если остались вопросы, постараюсь ответить на них в комментариях.
Онлайн-калькулятор: Кодировка текстового файла
В предыдущей статье я уже затрагивал тему кодирования текста, более подробно описал Unicode и его представление UTF-8 в виде последовательности символов переменной длины.
Этот калькулятор может преобразовывать текст в несколько устаревших кодировок. Я называю их устаревшими, потому что в современных приложениях можно использовать Unicode и его наиболее удобное представление UTF-8.
Однако старые кодировки также могут быть полезны, когда вам нужно компактно закодировать текст, например, для последующего сжатия и передачи, когда принимающая сторона точно знает, в какой кодировке передается текст. Например, русский текст, закодированный в Windows-1251, займет половину места, чем текст в UTF-8.
Итак, калькулятор ниже позволяет вам загрузить файл в выбранной кодировке или просмотреть шестнадцатеричный дамп закодированного текста.
Закодированный текст
Encoding Atari STCP 856 Hebrew DOS Arabic (CP864) DOS Baltic Rim (CP775) DOS Cyrillic (CP855) DOS Cyrillic Russian (CP866) DOS French Canada (CP863) DOS Greek (CP737) DOS Greek 2 (CP869) DOS Hebrew (CP869) DOS Hebrew CP862) DOS Исландский (CP861) DOS Latin 1 (CP850) DOS Latin 2 (CP852) DOS Latin США (CP437) DOS Nordic (CP865) DOS Португальский (CP860) DOS Турецкий (CP857) EBCDIC 037 США / Канада EBCDIC 1026 Турецкий EBCDIC 424 Иврит EBCDIC 500 Международный EBCDIC 875 Греческий GSM 03.38ISO 8-битный урду (IBM CP1006) ISO 8859-5ISO 8859-6ISO 8859-7ISO 8859-8ISO 8859-9ISO-IR-68ISO / IEC 8859-1 (Latin-1) ISO / IEC 8859-10 (Latin-6) ISO / IEC 8859-11ISO / IEC 8859-13 (Latin-7) ISO / IEC 8859-14ISO / IEC 8859-15 (Latin-9) ISO / IEC 8859-16 (Latin-10) ISO / IEC 8859-2 ( Latin-2) ISO / IEC 8859-3ISO / IEC 8859-4 (Latin-4) KOI8-RKOI8-UKPS 9566KZ-1048Mac OS CelticMac OS Central EuropeanMac OS CroatianMac OS CyrillicMac OS DingbatsMac OS GaelicMac OS GreekMac OS IcelandicMac OS InuitMac OS Roman Румынский Mac OS ТурецкийUTF-8Windows-1250Windows-1251Windows-1252Windows-1253Windows-1254Windows-1255Windows-1256Windows-1257Windows-1258Windows-874Windows-932Windows-936Windows-949Windows-950Будет или не быть , это вопрос сохранения контента Сохранить расширение Виджет
Вы можете просмотреть созданный файл с помощью декодера текстовых файлов.
Калькулятор выдаст ошибку, если выбрана несовместимая кодировка. В случае Unicode это невозможно — он содержит символы всех современных языков. Но устаревшие 8-битные кодировки содержат ограниченный набор символов. Для текста на нескольких языках необходимая кодировка может вообще не быть найдена.
За годы до Unicode было изобретено множество кодировок для разных языков и наборов символов, поэтому выбор правильной кодировки для текста может быть сложной задачей.Следующий калькулятор находит все кодировки, совместимые с введенным текстом.
Выберите кодировку текста
Быть или не быть, Вот в чем вопрос Кодировка Atari STCP 856 Hebrew DOS Arabic (CP864) DOS Baltic Rim (CP775) DOS Cyrillic (CP855) DOS Cyrillic Russian (CP866) DOS French Canada (CP863) DOS Greek (CP737) DOS Греческий 2 (CP869) DOS Иврит (CP862) DOS Исландский (CP861) DOS Latin 1 (CP850) DOS Latin 2 (CP852) DOS Latin США (CP437) DOS Nordic (CP865) DOS Португальский (CP860) DOS Турецкий ( CP857) EBCDIC 037 США / Канада EBCDIC 1026 Турецкий EBCDIC 424 Иврит EBCDIC 500 Международный EBCDIC 875 Греческий GSM 03.38ISO 8-битный урду (IBM CP1006) ISO 8859-5ISO 8859-6ISO 8859-7ISO 8859-8ISO 8859-9ISO-IR-68ISO / IEC 8859-1 (Latin-1) ISO / IEC 8859-10 (Latin-6) ISO / IEC 8859-11ISO / IEC 8859-13 (Latin-7) ISO / IEC 8859-14ISO / IEC 8859-15 (Latin-9) ISO / IEC 8859-16 (Latin-10) ISO / IEC 8859-2 ( Latin-2) ISO / IEC 8859-3ISO / IEC 8859-4 (Latin-4) KOI8-RKOI8-UKPS 9566KZ-1048Mac OS CelticMac OS Central EuropeanMac OS CroatianMac OS CyrillicMac OS DingbatsMac OS GaelicMac OS GreekMac OS IcelandicMac OS InuitMac OS Roman Румынский Mac OS ТурецкийUTF-8Windows-1250Windows-1251Windows-1252Windows-1253Windows-1254Windows-1255Windows-1256Windows-1257Windows-1258Windows-874Windows-932Windows-936Windows-949Windows-950
Файл очень большой.Во время загрузки и создания может произойти замедление работы браузера.
Скачать
закрыть
content_copy Ссылка сохранить Сохранить расширение Виджет
Калькуляторы поддерживают 70 различных кодировок:
IBM EBCDIC
EBCDIC — стандартная 8-битная кодировка, разработанная IBM для использования на мэйнфреймах IBM.
Кодировка | Языки / Страны |
---|---|
EBCDIC 424 Еврейский | Еврейский |
EBCDIC 037 США / Канада | США, Канада, Португалия, Бразилия, Австралия, Новая Зеландия, Южная Африка |
EBCDIC 1026 Турецкий | Турецкий |
EBCDIC 500 Международный | Международный |
EBCDIC 875 Греческий | Греческий |
ISO 8859 кодировки
Семейство кодировок, совместимых с ASCII, разработанных Международной организацией по стандартизации (ISO) и Международной электротехнической комиссией (IEC)
Кодировка | Языки / Страны |
---|---|
ISO 8859-2 (Latin-2) | восточноевропейских языков с использованием латинского алфавита |
ISO 8859-5 | Кириллица |
ISO 8859-6 | Арабский |
ISO 8859-7 | Новогреческий |
ISO / IEC 8859-1 (Latin-1) | западноевропейских языков |
ISO / IEC 8859-10 (Latin-6) | Североевропейские языки |
ИСО / МЭК 8859-11 | Тайский |
ISO / IEC 8859-13 (Latin-7) | Эстонский, Латышский, Литовский |
ИСО / МЭК 8859-14 | Кельтские языки |
ISO / IEC 8859-15 (Latin-9) | западноевропейских языков |
ISO / IEC 8859-16 (Latin-10) | восточноевропейских языков с использованием латинского алфавита |
ИСО / МЭК 8859-3 | Турецкий, Мальтийский, Эсперанто |
ISO / IEC 8859-4 (Latin-4) | эстонский, латышский, литовский, гренландский, саамский |
ИСО / МЭК 8859-8 | Еврейский |
ИСО / МЭК 8859-9 | Турецкий |
Семейство кодировок KOI8
KOI8 — 8-битная ASCII-совместимая кодировка для представления букв кириллических алфавитов
Кодировка | языков |
---|---|
КОИ8-Р | Русский |
КОИ8-У | Украинский |
Кодировки Mac OS
Кодировка | Языки / Страны |
---|---|
Mac OS Celtic | Кельтские языки |
Mac OS Гаэльский | гэльский |
Mac OS Центральноевропейская | языков Центральной Европы |
Mac OS Хорватский | Хорватский |
Mac OS Кириллица | Кириллица |
Mac OS Греческий | Греческий |
Mac OS Исландский | Исландский |
Mac OS Инуиты | Инуиты |
Mac OS Роман | западноевропейских языков |
Mac OS Румынский | Румынский |
Mac OS турецкий | Турецкий |
DOS Cod Pages
кодировок для MS-DOS и аналогичных операционных систем.
Кодировка | Языки / Страны |
---|---|
DOS Latin США (CP437) | восточноевропейских языков с использованием латинского алфавита |
DOS Греческий (CP737) | Греческий |
DOS Baltic Rim (CP775) | Эстонский, Латышский, Литовский |
DOS Latin 1 (CP850) | западноевропейских языков |
DOS Latin 2 (CP852) | восточноевропейских языков с использованием латинского алфавита |
DOS Кириллица (CP855) | Кириллица |
CP 856 Еврейский | Еврейский |
DOS Турецкий (CP857) | Турецкий |
DOS Португальский (CP860) | Португальский |
DOS Исландский (CP861) | Исландский |
DOS Еврейский (CP862) | Еврейский |
DOS Французская Канада (CP863) | Французский |
DOS Арабский (CP864) | Арабский |
DOS Nordic (CP865) | Северный |
DOS Кириллица Русский (CP866) | Русский |
DOS Греческий 2 (CP869) | Греческий |
Кодировки Windows
Кодировка | Языки / Страны |
---|---|
Окна-1250 | Языки Центральной и Восточной Европы |
Окна-1251 | русский, украинский белорусский, сербский, македонский, болгарский |
Окна-1252 | западноевропейских языков |
Окна-1253 | Новогреческий |
Окна-1254 | Турецкий |
Окна-1255 | Еврейский |
Окна-1256 | Арабский |
Окна-1257 | Эстонский, Латышский, Литовский |
Окна-1258 | Вьетнамский |
Окна-874 | Тайский |
Окна-932 | Японский |
Окна-936 | Упрощенный китайский |
Окна-949 | Корейский |
Windows-950 | Традиционный китайский |
KZ-1048 | казах |
прочие
Кодировка | Описание |
---|---|
Atari ST | Кодировка, используемая в домашних персональных компьютерах Atari |
GSM 03.38 | Кодировка использовалась в сетях GSM для SMS, CB (передача коротких сообщений) и USSD |
KPS 9566 | Кодировка, разработанная в Северной Корее для поддержки корейских символов хангыль |
ISO 8-битный урду (IBM CP1006) | Кодировка, используемая IBM в операционной системе AIX в Пакистане для языка урду. |
ISO-IR-68 | Кодировка для представления символов на языке программирования APL |
Правила преобразования кодировок в Unicode были получены из Unicode.org сайт.
Как русифицировать компьютер в порядке заказа кириллицей
Как русифицировать компьютер в порядке заказа в кириллице
Обучение русскому языку в Лондоне
B&B в Санкт-Петербурге
Программа проверки лондонской зоны перегрузки
Как набрать на компьютере русский (кириллический) алфавит
Начальный
конфигурация Фонетическая
установка клавиатуры русская
электронная почта русский
типограф
Эти инструкции применимы для Windows 95 или выше и предназначены для людей
желая иметь возможность печатать на русском языке в таких приложениях, как Microsoft Word,
Outlook, Internet Explorer, Netscape и большинство других программ.
Настройка компьютера для ввода русского языка
Окна 95/98 / ME
Из Панели управления (Пуск -> Настройка -> Панель управления) перейдите в Добавить / Удалить
Программы -> Установка Windows, нажмите «Многоязыковая поддержка», а затем нажмите
Нажмите кнопку «Подробнее», выберите «Поддержка кириллицы» и нажмите «ОК» в этом окне.
и «ОК» из предыдущего окна. После этого должна быть установлена поддержка кириллицы.
и вам будет предложено перезапустить Windows.
(Если языковая поддержка недоступна, вы можете загрузить и запустить ее (lang.exe) из
здесь.)
Затем в Панели управления дважды щелкните «Клавиатура», выберите вкладку «Язык» и
нажмите кнопку «Добавить», выберите из списка «Русский» и нажмите «ОК». Убедитесь, что
«Включить индикатор на панели задач» отмечен галочкой, а переключение языков с помощью «Left Alt + Shift»
выбрано.
Только Windows 2000
На Панели управления (Пуск -> Настройка -> Панель управления) дважды щелкните
на значке «Региональные параметры», затем на вкладке «Общие» и в разделе «Язык».
Настройки системы »нажмите« Кириллица ».
Windows 2000 (продолжение) и Windows NT
На Панели управления дважды щелкните «Клавиатура», выберите «Ввод».
Вкладка Locales и
нажмите кнопку «Добавить», выберите из списка «Русский» и нажмите «ОК». Убедитесь, что
«Включить индикатор на панели задач» отмечен галочкой, а переключение языков с помощью «Left Alt + Shift»
выбрано.
Windows XP
На Панели управления (Пуск -> Настройка -> Панель управления) дважды щелкните
на значке «Язык и региональные стандарты», затем «Языки», затем «Подробности».
в разделе «Текстовые службы и языки ввода», затем «Добавить» в «Установлено»
Услуги », а затем нажмите« Русский ».
Windows Vista / Windows 7
На Панели управления (Пуск -> Панель управления) дважды щелкните
на значке «Язык и региональные стандарты», затем «Клавиатуры и языки», затем «Сменить клавиатуру».
, затем «Добавить» в «Установленные службы» в разделе «Текстовые службы и языки ввода», а затем нажмите «Русский».
Теперь вы должны иметь возможность печатать по-русски в Microsoft Word, Internet Explorer,
Netscape Navigator и большинство других приложений, переключившись на русский язык
либо щелкнув значок «Ru» на панели задач, либо используя Alt + Shift.
(Вы также можете вернуться к английскому языку, щелкнув «En» или снова нажав Alt + Shift.)
(В некоторых программах, таких как AOL и старые версии Word (95), вам также понадобится
чтобы выбрать определенный кириллический шрифт, например Arial Cyr.)
Установка более фонетической клавиатуры для тех, кто использует стандартный английский
(QWERTY) клавиатура
Вы заметите, что клавиатура не отображается интуитивно для английской клавиатуры, поэтому
иметь более фонетическую клавиатуру:
Если вы используете Windows 95/98 / ME , щелкните здесь.Выберите
запустите файл и при появлении запроса нажмите кнопку «Разархивировать». Это поместит файл kbd1251y.kbd в
то
c: \ windows \ system и запустит файл y1251.reg
который пропишет новый русский макет.
Если вы используете Windows NT или 2000 , убедитесь, что вы вошли в систему как
администратор, а затем щелкните здесь. Выберите
запустите файл и при появлении запроса нажмите кнопку «Разархивировать». Это поместит kbd1251y.dll
в папку c: \ winnt \ System32 \, а затем запустит y1251_nt.рег
файл, который зарегистрирует новый макет.
Если вы используете Windows XP , убедитесь, что вы вошли в систему как
администратор, а затем щелкните здесь. Выберите
запустите файл и при появлении запроса нажмите кнопку «Разархивировать». Это поместит kbd1251y.dll
файл в папку c: \ windows \ System32 \ и затем запустит y1251_nt.reg
файл, который зарегистрирует новый макет.
Если вы используете Windows Vista или Windows 7 , убедитесь, что вы вошли в систему как
администратор, а затем щелкните здесь.Выберите
запустите файл и при появлении запроса нажмите кнопку «Разархивировать». Через несколько секунд программа установки запустится после того, как вы нажали «Разрешить» в приглашении, которое установит новую фонетическую раскладку. Чтобы убедиться, что фонетическая раскладка является русской раскладкой по умолчанию, в Панели управления (Пуск -> Панель управления) дважды щелкните
на значке «Язык и региональные стандарты», затем «Клавиатуры и языки», затем «Сменить клавиатуру». В разделе «Русский» щелкните только что установленную раскладку «Фонетический русский» и нажмите кнопку «Вверх», чтобы она оказалась в верхней части списка.
Вам необходимо перезагрузить компьютер, чтобы увидеть изменения и
тогда у вас должно быть все готово.
Ъ = Ctrl-Alt-7 ъ =
Ctrl-Alt-8 Ё = Ctrl-Alt-9 ё =
Ctrl-Alt-0
Файлы с клавиатурой были предоставлены Полом Городянским с помощью Janko’s Keyboard Generator и Microsoft Keyboard Layout Creator. Павел Городянский также дает более подробное описание.
для разных типов систем по вопросам русификации.
Отправка и получение русской почты
Если вы получили электронное письмо с какими-то странно выглядящими персонажами, которые вы
подозреваемый должен быть русский, тогда скорее всего вам нужно изменить кодировку
в вашей почтовой системе.Кириллица обычно кодируется либо кириллицей KOI8-R, либо Windows 1251. Кириллица KOI8-R обычно считается
стандарт для отправки и получения электронной почты.
Вы можете декодировать символы в читаемый русский язык на странице Расшифровка русских символов.
Чтобы изменить кодировку в Outlook Express, откройте сообщение, а затем из
в меню выберите «Формат», затем «Кодировка», затем «Еще» и выберите «Кириллица».
КОИ8-Р ‘. Затем сообщение должно быть волшебным образом преобразовано в узнаваемый
символы.Если это не так, попробуйте другую кодировку, например «Кириллица Windows».
Перед тем, как отправить электронное письмо на русском языке, убедитесь, что кодировка
установите «Кириллица KOI8-R», чтобы почтовая программа получателя знала, что
ожидать и, следовательно, может правильно отображать кириллический текст. Если вы этого не сделаете, тогда ваш
получатель, вероятно, получит много странных символов и, чтобы
расшифровать им придется вручную изменить кодировку в своей почтовой системе.
NB. Если вы используете AOL 6.5, то для отправки электронного письма на русском языке необходимо изменить шрифт на определенный кириллический шрифт, например Arial Cyr.
Русский типограф
Вы действительно можете печатать по-русски с русского
typer веб-сайт без необходимости вносить какие-либо изменения в компьютер, на котором вы находитесь
с использованием. Это может быть полезно, если вы используете общедоступный компьютер, на котором вы не можете
изменить его настройки.
Нажмите здесь, чтобы получить Private
Уроки русского в Лондоне или по электронной почте
Русское слово
использование Как печатать по-русски Пиковая
Дама русский язык
конечно Быстрый старт
Русские
Электронная почта
— Уильям Бридж в williambridge @ stanwardine.ком
Дом
Чтение и запись кириллицы
Если вы используете Windows, вы можете загрузить точный шрифт, используемый для создания этих страниц, нажав ЗДЕСЬ . Если вы установите его на 10 pt., Вы должны получить очень точное совпадение со шрифтами в графике. Компьютеры Macintosh выглядят лучше, если шрифты ER Bukinist установлены на 12 пунктов. Они доступны ЗДЕСЬ . Если вы используете другую платформу, установите размер шрифта 10 pts. должен дать вам наилучшее совпадение со словами действия, встроенными в текст.
После того, как вы установили шрифты KOI8-R на свой компьютер, вы также должны настроить Netscape Navigator или MS Internet Explorer 5.0 для доступа к ним. Чтобы настроить Netscape Navigator 4.5, необходимо выполнить три шага:
Откройте меню «Правка» и выберите «Настройки» и «Шрифты», а затем выберите «Кириллица» в окне «Для кодировки документа». Если у вас есть многоязычная поддержка, вы можете использовать шрифт Times New Roman или Arial в качестве специального шрифта.Если вы не используете многоязычную поддержку, выберите шрифты KOI8-R (новый русский или ERBukinist) для «пропорционального шрифта» и KOI8-R Courier (Courier Cyrillic или Bukinist) для выбора «шрифта фиксированной ширины» в Папка «Шрифты».
В разделе «Просмотр» откройте «Набор символов» и установите для него «Кириллица (KOI8-R)»
Наконец, вернитесь в «Набор символов» и нажмите «Установить по умолчанию», если вы хотите, чтобы этот шрифт изначально появлялся в Navigator каждый раз, когда вы его открываете.
Для MS Internet Explorer 5.0 выберите «Свойства обозревателя» в меню «Инструменты». Внизу страницы выберите «Шрифты» и выберите подходящий шрифт для вашего языкового сценария «Кириллица». Все остальное MSIE сделает за вас. Возможно, вам придется установить «Кодировку» в «Просмотр» для «Кириллица (KOI-8)» для некоторых страниц; однако все страницы в этой грамматике должны автоматически открываться шрифтами KOI8. Однако, хотя страница может открываться в KOI8 автоматически, клавиатура может не работать без ручной установки кодировки страницы на «Кириллица (KOI8)».
Письменный русский
Если вы хотите записать упражнения в справочную грамматику, помимо установки шрифтов KOI8-R вам потребуется (1) установить кириллическую клавиатуру и (2) настроить ваш браузер для кодирования документов KOI8-R.
KOI8-R Клавиатуры
Чтобы установить буквенно-буквенную кириллическую клавиатуру учащегося, вы должны приобрести ее или загрузить в Интернете. Следуйте инструкциям по его установке.Если вы используете Windows 95/98, загрузите Bucknell KOI8 Keyboard Package здесь. Он основан на Tavultesoft Keyboard Manager Летнего института лингвистики. Пакет Bucknell поставляется со стандартной русской раскладкой клавиатуры и буквенной раскладкой учащегося, где русские буквы соответствуют латинским буквам с таким же или похожим звуком. Инструкции по установке Tavultesoft Keyboard Manager включены в пакет. Теперь есть менеджер клавиатуры Tavultesoft для Windows NT, доступный от автора за 30 долларов.
Если вы используете Mac, вы можете получить клавиатуру с раскладкой, аналогичной латинице, загрузив наш пакет шрифтов ERBukinist выше. Вы устанавливаете клавиатуру, перетаскивая ее в системный каталог, затем вы должны установить расширение клавиатуры (под яблоком) на KOI8-R.
Печать кириллицей
Если у вас нет цветного принтера, перед печатью этих страниц проверьте в Netscape в разделе «Файл / Параметры страницы» и убедитесь, что установлен флажок «Черный текст».Когда вы распечатываете эти страницы, сами генерируемые слова будут отображаться как основа + окончание, а не как полностью производное слово. (В конце концов, именно поэтому электронный формат предпочтительнее.)
Преобразование кириллических файлов, обработанных Word, в текст
Кириллица
Если вы работаете с кириллицей (русским языком и т. Д.) На компьютере, который использует не кириллический системный шрифт, и когда-либо пытались сохранить файл, созданный в обычном текстовом редакторе, как текст, вы знаете, в чем проблема.У вас есть текстовый файл, содержащий кириллический текст. Кириллица отлично отображается в текстовом редакторе, но если вы сохраните его как текст, а затем попытаетесь открыть текстовый файл, все, что вы увидите, — это вопросительные знаки. (Если вы используете компьютер с кириллическим системным шрифтом, это не должно быть проблемой.)
Есть способ обойти это?
Один из способов — изменить системный шрифт вашего компьютера на кириллический системный шрифт. Если вы хотите поэкспериментировать с изменением системного шрифта, некоторые операционные системы могут позволить вам настроить это самостоятельно.Если вы используете обычную операционную систему для настольных ПК и нуждаетесь в стороннем решении, вы можете рассмотреть Parawin, который доступен у таких компаний, как Smartlink Corporation и VirtualWare Technologies. (Обратите внимание, что менеджер загрузки, такой как System Commander, позволит вам установить несколько версий одной и той же операционной системы на ваш компьютер, так что у вас может быть одна версия с западным системным шрифтом, а другая с кириллическим системным шрифтом, если вы беспокоитесь о кириллическом системном шрифте, вызывающем проблемы.)
Однако большинству людей, у которых еще нет кириллического системного шрифта, он не нужен. Это особенно верно, если вы используете другие иностранные языки, такие как немецкий или французский, поскольку символы других языков, отличные от ASCII (é, ô, ß, ü и т. Д.), Не будут правильно отображаться кириллическим системным шрифтом. Более того, большинство людей думают, что это слишком много работы и затрат, чтобы решить такую простую задачу.
Другой способ — использовать бесплатный продукт Antiword, который может извлекать текст из определенных типов текстовых документов.Это решение, безусловно, работает, однако оно предназначено в основном для людей, у которых нет доступа к рассматриваемому текстовому процессору.
К счастью, есть более простой способ:
(1) Запустите редактор HTML, такой как Mozilla или Netscape, и откройте новую страницу Composer. (2) Выберите желаемую кодировку символов, например «Кириллица (KOI8-R)». или «Кириллица (Windows-1251)». Для этого войдите в меню следующим образом: Просмотр | Кодирование символов | Кириллица (Windows-1251) В первый раз, когда вы сделаете это, вам нужно будет заглянуть под меню: Подробнее | Восточноевропейский (3) Переключитесь на свой текстовый редактор, выделите весь текст, который вы хотите сохранить как текст, и скопируйте его.(4) Переключитесь на Composer и вставьте текст на новую страницу Composer. (5) Сохраните файл HTML.
Теперь откройте этот HTML-файл в текстовом редакторе. Для этого используйте команду «Открыть»: не щелкайте дважды по файлу. Вуаля! У вас обратно кириллица (без форматирования, конечно).
Затем закройте HTML-файл в текстовом редакторе и откройте его в текстовом редакторе. Если у вас не кириллический системный шрифт, текст будет выглядеть как мусор (например, «» «), но на самом деле это кириллический текст, отображаемый с использованием не кириллического шрифта.Примечание. Если вы видите такие коды, как «& # 1103; & # 1079; & # 1099; & # 1082;», значит, вы либо забыли изменить кодировку символов в Composer, либо сделали это ПОСЛЕ вставки текста. Вы ДОЛЖНЫ установить кодировку символов ПЕРЕД вставкой текста.
Этот HTML-файл представляет собой простой текстовый файл, хотя он также содержит HTML-теги, например следующие:
russdict_text.koi8
Вы можете удалить эти теги сейчас, если они вам не нужны. Примечание. После того, как вы удалите теги, ваш мертвый текстовый редактор может больше не отображать текст правильно, однако текст по-прежнему будет правильным.
Теперь у вас есть кириллический текстовый файл! Обратите внимание: если вы хотите отправить этот файл по электронной почте, он должен быть сначала закодирован MIME или uuencoded, иначе он будет поврежден, если пройдет через 7-битный шлюз. Сегодня большинство обычных почтовых клиентов делают это автоматически.
Щелкните здесь, чтобы вернуться на домашнюю страницу Томаса Хеддена
Авторские права © 2003-2010 Thomas Hedden
Эта страница доступна для просмотра в любом браузере.
.