Выбор кодировки текста при открытии и сохранении файлов

Как правило, при обмене файлами никого не волнует, как в них сохраняется текст. Однако если обмен файлами происходит между людьми, работающими на различных языках, если осуществляется загрузка текстовых файлов из Интернета или обмен текстовыми файлами между различными системами компьютеров, то при открытии или сохранении файла может возникнуть необходимость выбрать определенную кодировку.

При открытии текстового файла приложением Microsoft Office Word или другой программой — возможно, на компьютере с системным программным обеспечением на языке, отличающемся от языка, на котором был создан файл — кодировка помогает определить, как этой программе представить текст, чтобы он был читаемым.

Предполагаемое действие:


Кодировка текста

То, что отображается на экране в виде текста, на самом деле хранится в текстовом файле как числовое значение. Компьютер, используя стандарт кодировки, преобразует эти числовые значения в видимые знаки.

Стандарт кодировки представляет собой числовую схему, где каждому текстовому знаку из набора знаков соответствует числовое значение. Набор знаков может включать буквы алфавита, цифры и другие знаки. Разные языки обычно состоят из разных наборов знаков, поэтому существует много разных стандартов кодировки для представления наборов знаков, используемых в разных языках.

Разные стандарты кодировки для разных алфавитов

Стандарт кодировки, сохраняемый вместе с текстовым файлом, предоставляет информацию, необходимую для того, чтобы отображать текст на экране. Например, в кодировке «кириллица (Windows)» знаку Й соответствует числовое значение 201. При открытии файла, содержащего эту букву, на компьютере, использующем кодировку «кириллица (Windows)», будет прочтено числовое значение 201 и на экране отобразится знак Й.

Однако если тот же самый файл открыть на компьютере, использующем другую кодировку, то он отобразит знак, которому соответствует числовое значение 201, в том стандарте кодировки, который использует данный компьютер по умолчанию. Например, если компьютер использует стандарт кодировки «Западная Европа (Windows)», этот знак в оригинальном файле, созданном в кодировке «кириллицы», будет отображаться как É, а не Й, поскольку в кодировке «Западная Европа (Windows)» значение 201 отображает знак É.

Юникод: единый стандарт кодировки для множества алфавитов

Чтобы избежать проблем, связанных с кодированием и раскодированием файлов, можно сохранять файлы в кодировке Юникод. Юникод включает наборы знаков для большинства языков, которые в наши дни используются на компьютерах.

Поскольку Word создан на основе Юникод, он автоматически сохраняет файлы в кодировке Юникод. Файлы в кодировке Юникод можно открывать и читать на компьютере с англоязычной системой независимо от того, на каком языке написан текст. Подобным же образом, если использовать англоязычную систему для сохранения файла в кодировке Юникод, файл может включать знаки, которые отсутствуют в западноевропейских алфавитах, в частности греческие, кириллические, арабские или японские знаки.

К началу страницы К началу страницы

Выбор стандарта кодировки при открытии файла

Если при открытии файла текст отображается искаженным или заменяется вопросительными знаками или квадратиками, это означает, что приложение Microsoft Office Word не может точно определить стандарт кодировки текста в файле. Чтобы отобразить (раскодировать) текст, стандарт кодировки можно указать следующим образом.

  1. Нажмите кнопку Microsoft Office Значок кнопки, а затем выберите пункт Параметры Word.
  1. Щелкните Дополнительно.
  2. Прокрутите раздел Общие и установите флажок Подтверждать преобразование формата файла при открытии.

 Примечание.   Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла каждый раз, когда файл открывается в формате, отличающемся от формата Word (форматы Word включают в себя файлы DOC, DOT, DOCX, DOCM, DOTX и DOTM). Если работа с такими файлами выполняется часто, то, чтобы каждый раз не выбирать стандарт кодировки и не открывать без необходимости это диалоговое окно, не забудьте отключить этот параметр.

  1. Закройте и повторно откройте файл.
  2. В диалоговом окне Преобразование файла выберите Кодированный текст.
  3. В диалоговом окне Преобразование файла выберите параметр Другая, а затем выберите в списке требуемый стандарт кодировки.

Чтобы проверить, весь ли текст отображается в читаемом виде в выбранном стандарте кодировки, его можно просмотреть в области Просмотр.

Если почти весь текст выглядит одинаково (например, состоит из одних квадратов или точек), возможно, не установлен шрифт, который требуется для отображения этих знаков. Если нужный шрифт недоступен, можно установить дополнительные шрифты.

ПоказатьУстановка шрифтов

  1. В Microsoft Windows нажмите кнопку Пуск и выберите Панель управления.
  2. Выполните одно из следующих действий.

ПоказатьВ Microsoft Windows Vista

  1. На панели управления выберите компонент Удаление программы.
  2. В списке программ выберите Microsoft Office или Microsoft Word в зависимости от того, установлено ли приложение Word как часть Office или как самостоятельная программа, и нажмите кнопку Изменить.

ПоказатьВ Microsoft Windows XP

  1. На панели управления щелкните Добавление и удаление программ.
  2. В поле Установленные программы выберите Microsoft Office или Microsoft Word в зависимости от того, устанавливалось ли приложение Word как часть Office или как отдельная программа, а затем щелкните Изменить.
  1. В разделе Изменить установку Microsoft Office нажмите кнопку Добавление или удаление компонентов, а затем щелкните Продолжить.
  2. В разделе Параметры установки разверните группы Общие средства Office, а затем — Многоязыковая поддержка.
  3. Выберите требуемый шрифт, щелкните стрелку рядом с выделением, а затем выберите параметр Запускать с моего компьютера.

 Совет.   При открытии кодированного текстового файла Word использует шрифты, которые определяются в диалоговом окне Параметры веб-документа. (Чтобы найти диалоговое окно Параметры веб-документа, нажмите кнопку Office, выберите пункт Параметры Word, а затем щелкните Дополнительно. В разделе Общие выберите Параметры веб-документа.) Чтобы настроить шрифт для каждого набора знаков, можно выбрать соответствующие параметры на вкладке Шрифты диалогового окна Параметры веб-документа.

К началу страницы К началу страницы

Выбор стандарта кодировки при сохранении файла

Если при сохранении файла стандарт кодировки не выбран, Word кодирует файл в стандарте Юникод. Обычно можно использовать стандарт кодировки Юникод по умолчанию, поскольку он поддерживает большинство знаков в большинстве языков.

Если документ будет открываться в программе, которая не поддерживает Юникод, можно выбрать стандарт кодировки, соответствующий этой программе. Например, Юникод позволяет создать документ в традиционном китайском письме в англоязычной системе. Однако если этот документ будет открываться программой, использующей традиционное китайское письмо и не поддерживающей Юникод, его можно сохранить в кодировке традиционного китайского письма Big5. При открытии этого документа программой, использующей традиционное китайское письмо, весь текст будет отображен должным образом.

 Примечание.   Поскольку Юникод представляет собой наиболее всеобъемлющий стандарт, сохранение текста в какой-либо другой кодировке может привести к тому, что некоторые знаки перестанут отображаться. В частности, документ в кодировке Юникод может содержать тексты на иврите и на кириллице. Если его сохранить в кодировке «кириллица (Windows)», текст на иврите больше не будет отображаться, а если — в кодировке «Иврит (Windows)», отображаться перестанет текст на кириллице.

Если выбран стандарт кодировки, который не поддерживает знаки, используемые в файле, Word помечает красным цветом все знаки, которые он не может сохранить. Перед тем как сохранять файл, текст можно предварительно просмотреть в выбранном стандарте кодировки.

Текст, форматированный с использованием шрифта Symbol или кодов полей, удаляется из файла при сохранении файла в виде кодированного текста.

Выбор стандарта кодировки

  1. Нажмите кнопку Microsoft Office Значок кнопки, а затем выберите команду Сохранить как.

Если нужно сохранить файл в другой папке, укажите путь и откройте ее.

  1. В поле Имя файла введите новое имя файла.
  2. В поле Тип файла выделите Обычный текст.
  3. Нажмите кнопку Сохранить.
  4. Если появится диалоговое окно Microsoft Office Word - проверка совместимости, щелкните Продолжить.
  5. В диалоговом окне Преобразование файла выберите параметр требуемого стандарта кодировки.
    • Чтобы использовать стандартную кодировку по умолчанию, щелкните Windows (по умолчанию).
    • Чтобы использовать стандарт кодировки MS-DOS, щелкните MS-DOS.
    • Для выбора определенного стандарта кодировки щелкните Другая, а затем выберите в списке требуемый стандарт кодировки. Чтобы проверить, весь ли текст отображается читаемым в выбранном стандарте кодировки, его можно просмотреть в области Просмотр.

 Примечание.   Размер диалогового окна Преобразование файла можно изменить для более полного обзора документа.

  1. При получении сообщения «Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке» можно попробовать выбрать другую кодировку или установить флажок Разрешить подстановку знаков.

Если дано разрешение на подстановку знаков, Word заменяет знак, который не может быть отображен, на ближайший эквивалентный знак в выбранной кодировке. Например, многоточие заменяет эллипс, а прямые кавычки заменяют парные.

Если в выбранной кодировке нет знака, эквивалентного знаку, помеченному красным цветом, то последний будет сохранен оторванным от контекста, как знак вопроса.

  1. Если документ будет открываться программой, которая не поддерживает перенос текстовых строк, в документ можно включить условие твердого переноса слов, установив флажок Вставлять разрывы строк и указав, должен ли перенос слов разделяться возвратом каретки (CR), переводом строки (LF) или и тем, и другим в поле Завершать строки.

К началу страницы К началу страницы

Поиск стандартов кодировок, доступных в приложении Word

Word распознает ряд стандартов кодировки и поддерживает стандарты кодировки, которые обеспечиваются системным программным обеспечением компьютера.

В нижеследующем списке систем письма перечисляются стандарты кодировки (также называемые кодовыми страницами), связанные с каждой из этих систем письма.

Система письма Стандарты кодировки Используемый шрифт
Многоязычная Юникод (UCS-2 little-endian и big-endian, UTF-8, UTF-7) Шрифт по умолчанию основан на стиле Normal для соответствующей языковой версии Word
Арабская Windows 1256, ASMO 708 Courier New
Китайская (упрощенное письмо) GB2312, GBK, EUC-CN, ISO-2022-CN, HZ SimSun
Китайская (традиционное письмо) BIG5, EUC-TW, ISO-2022-TW MingLiU
Кириллица Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 Courier New
Английская, западноевропейская или другая латинская система письма Windows 1250, 1252-1254, 1257, ISO8859-x Courier New
Греческая Windows 1253 Courier New
Иврит Windows 1255 Courier New
Японская Shift-JIS, ISO-2022-JP (JIS), EUC-JP MS Gothic
Корейская Wansung, Johab, ISO-2022-KR, EUC-KR GulimChe
Тайская Windows 874 Tahoma
Вьетнамская Windows 1258 Courier New
Индийская: тамильский язык ISCII 57004 Latha
Индийская: непальский язык ISCII 57002 (Devanagari) Mangal
Индийская: конкани ISCII 57002 (Devanagari) Mangal
Индийская: хинди ISCII 57002 (Devanagari) Mangal
Индийская: ассамский язык ISCII 57006  
Индийская: бенгальский язык ISCII 57003  
Индийская: гуджарати ISCII 57010  
Индийская: каннада ISCII 57008  
Индийская: малаялам ISCII 57009  
Индийская: ория ISCII 57007  
Индийская: маратхи ISCII 57002 (Devanagari)  
Индийская: панджаби ISCII 57011  
Индийская: санскрит ISCII 57002 (Devanagari)  
Индийская: телугу ISCII 57005  

 Примечания 

  • Для непальского, ассамского, бенгальского и языков гуджарати, малаялам и ория имеется лишь ограниченная поддержка.

К началу страницы К началу страницы

 
 
Применимо к:
Word 2007