在打开和保存文件时选择文本编码

通常,在共享文本文件时,您不必考虑有关文本的存储方式的底层详细信息。不过,如果您要与使用其他语言的用户共享文本文件、从 Internet 下载文本文件,或与其他计算机系统共享文本文件,那么,在打开或保存文件时,则可能需要选择编码标准。

当您或其他人打开一个文本文件,Microsoft Word 中,或在另一个程序  ? 可能是在具有不同于用于创建该文件的语言的语言的系统软件的计算机上  ? 编码标准有助于该程序确定如何表示文本,使其可读  

请选择要执行的是什么?


了解文本编码

显示在屏幕上的文本实际以数值的形式存储在文本文件中。计算机使用编码标准将数值转换为可见字符。

编码标准是一种编号方案,它为字符集中的每个文本字符指定一个数值。字符集可以包含字母字符、数字和其他符号。不同的语言通常包含不同的字符集,因此,存在多种不同的编码标准,用于显示不同语言中使用的字符集。

用于不同字母表的不同编码标准

随文本文件一起保存的编码标准为计算机提供在屏幕上显示文本所需的信息。例如,在西里尔文 (Windows) 编码中,字符 Й 的数值为 201。在使用西里尔文 (Windows) 编码的计算机上打开包含该字符的文件时,计算机将读取数值 201,并在屏幕上显示 Й。

不过,如果在使用其他不同编码的计算机上打开该文件,计算机将显示与其默认使用的编码标准中的数值 201 对应的字符。例如,如果计算机使用西欧 (Windows) 编码标准,基于西里尔文的原始文件中的字符将显示为 é 而不是 Й,原因是西欧 (Windows) 编码中的值 201 映射到 é。

Unicode:一种编码标准涵盖众多字母表

为了避免在给文本文件编码和解码时出现问题,您可将文件以 Unicode 编码的形式保存。Unicode 包含目前计算机用户常用的所有语言的大多数字符集。

由于 Word 基于 Unicode,Word 自动以 Unicode 编码的形式保存文件。不论文件中的文本是什么语言,您都能在英语计算机系统上打开和读取 Unicode 编码的文件。同样,在使用英语系统保存 Unicode 编码的文件时,文件可以包含西欧字母表中没有字符,如希腊语、西里尔文、阿拉伯语或日语字符。

返回页首 返回页首

在打开文件时选择编码标准

打开文件时,如果文本显示为乱码、问号或者方格,则 Word 可能未准确检测到文件中文本的编码标准。您可以指定用以显示(解码)文本的编码标准:

  1. 单击“文件”选项卡。
  2. 单击“选项”
  3. 单击“高级”
  4. 滚动到“常规”部分,然后选中“打开时确认文件格式转换”复选框。

 注释   如果选中此复选框,每当打开的文件不是 Word 格式(Word 格式包括 .doc、.dot、.docx、.docm、.dotx 或 .dotm)时,Word 都会显示“转换文件”对话框。如果经常处理此类文件,而很少需要选择编码标准,则记住关闭此选项,以避免在不必要的情况下打开此对话框。

  1. 关闭文件,然后再重新打开。
  2. “转换文件”对话框中,选择“编码文本”
  3. “文件转换”对话框中,选择“其他编码”,然后从列表中选择所需的编码标准。

您可在“预览”区域预览文本,以检查所有文本在采用所选的编码标准时是否都能正常显示。

如果几乎所有文本的显示都相同(例如,全部显示成方框或点),则可能未安装显示字符所需的字体。如果需要的字体不可用,则可安装这些字体。

若要安装其他字体,请执行以下操作:

  1. 单击 Microsoft Windows 中的 开始 按钮,然后单击 控制面板
  2. 执行以下任一操作:

显示在 Windows 7 中

  1. 在“控制面板”中,单击“卸载程序”
  2. 在程序列表中单击 Microsoft Office 或 Microsoft Word 的列表,具体取决于是否将 Word 安装 Office 的一部分或作为一个单独的程序,然后单击 更改

显示在 Windows Vista 中

  1. 在“控制面板”中,单击“卸载程序”
  2. 在程序列表中单击 Microsoft Office 或 Microsoft Word 的列表,具体取决于是否将 Word 安装 Office 的一部分或作为一个单独的程序,然后单击 更改

显示在 Microsoft Windows XP 中

  1. 在“控制面板”中,单击“添加或删除程序”
  2. “当前安装的程序”框中,单击列表中的 Microsoft Office 或 Microsoft Word,这取决于 Word 是作为 Office 的一部分安装的还是单独安装的,然后单击“更改”
  1. 更改您的 Microsoft Office 的安装 ,请单击 添加或删除功能 ,然后单击 继续
  2. “安装选项”下,展开“Office 共享功能”,然后展开“国际性支持”
  3. 选择所需的字体集,单击所选内容旁边的箭头,然后选择“从本机运行”

 提示   在打开编码文本文件时,Word 应用“Web 选项”对话框中定义的字体。(要访问“Web 选项”对话框,请单击 Microsoft Office 按钮,单击“Word 选项”,然后单击“高级”。在“常规”部分,单击“Web 选项”。)您可通过在“Web 选项”对话框的“字体”选项卡上选择选项来自定义每个字符集的字体。

返回页首 返回页首

在保存文件时选择编码标准

如果在保存文件时不选择编码标准,Word 将以 Unicode 的形式对文件进行编码。通常,您可以使用默认的 Unicode 编码,因为它支持大多数语言中的大多数字符。

如果文档将在不支持 Unicode 的程序中打开,则可选择与目标程序的编码标准相匹配的编码标准。例如,Unicode 允许在英语系统上创建繁体中文的文档。不过,如果要在不支持 Unicode 的繁体中文程序中打开文档,则可将文档保存为繁体中文 (Big5) 编码。当在繁体中文程序中打开文档时,所有文本都能正确显示。

 注释   由于 Unicode 是最全面的标准,因此,以任何其他编码保存文件都可能导致不能显示某些字符。例如,采用 Unicode 编码的文档可能包含希伯来语和西里尔文文本。如果以西里尔文 (Windows) 编码保存该文档,则不能再显示希伯来语文本,如果以希伯来语 (Windows) 编码保存该文档,则不能再显示西里尔文文本。

如果选择的编码标准不支持文件中使用的字符,Word 会将无法保存的字符标为红色。您可在保存文件之前,以所选的编码标准预览文本。

将文件保存为编码文本时,将删除采用 Symbol 字体的文本或域代码形式的文本。

选择编码标准

  1. 单击“文件”选项卡。
  2. 单击“另存为”

如果要将文件保存在不同的文件夹中,请找到并打开该文件夹。

  1. “文件名”框中,键入文件的新名称。
  2. “保存类型”框中,选择“纯文本”
  3. 单击“保存”
  4. 如果出现“Microsoft Office Word 兼容性检查器”对话框,则单击“继续”
  5. “文件转换”对话框中,选择与要用的编码标准对应的选项:
    • 要使用系统的默认编码标准,请单击“Windows(默认)”
    • 要使用 MS-DOS 编码标准,请单击“MS-DOS”
    • 要选择特定的编码标准,请单击“其他编码”,然后从列表中选择所需的编码标准。您可在“预览”区域预览文本,以检查所有文本在采用所选的编码标准时是否都能正常显示。

 注释   您可调整“文件转换”对话框的大小,以便能预览文档的更多内容。

  1. 如果出现消息“标为红色的文字将无法用所选编码正确保存”,则可尝试选择另一不同的编码,或者可以选中“允许字符替换”复选框。

在允许字符替换时,Word 将不能显示的字符替换为所选编码中最相近的对等字符。例如,用三个点替换省略号,用直引号替换弯引号。

如果所选编码中没有标为红色的字符的对等字符,则将标为红色的字符保存为脱离上下文的字符,如问号。

  1. 如果文档将在不支持文本换行的程序中打开,则可在文档中包含硬换行符,方法是选中“插入换行符”复选框,然后在“行终止符号”框中指定是用回车 (CR)、换行 (LF) 还是同时使用两者来表示换行符。

返回页首 返回页首

查找 Word 中的可用编码标准

Word 识别多种编码标准,并支持随计算机上的系统软件一起提供的编码标准。

下面的书写系统列表显示与每种书写系统相关的编码标准(也称为代码页)。

书写系统 编码标准 应用的字体
多语言 Unicode(UCS-2 little-endian 和 big-endian、UTF-8、UTF-7) 基于您的语言版本的 Word 中“标准”样式的默认字体
阿拉伯语 Windows 1256、ASMO 708 Courier New
简体中文 GB2312、GBK、EUC-CN、ISO-2022-CN、HZ 宋体
繁体中文 BIG5、EUC-TW、ISO-2022-TW MingLiU
西里尔语 Windows 1251、KOI8-R、KOI8-RU、ISO8859-5、DOS 866 Courier New
英语、西欧或其他拉丁脚本 Windows 1250、1252-1254、1257、ISO8859-x Courier New
希腊语 Windows 1253 Courier New
希伯来语 Windows 1255 Courier New
日语 Shift-JIS、ISO-2022-JP (JIS)、EUC-JP MS Mincho
朝鲜语 Wansung、Johab、ISO-2022-KR、EUC-KR Malgun 字体
泰语 Windows 874 Tahoma
越南语 Windows 1258 Courier New
印度语:泰米尔语 ISCII 57004 Latha
印度语:尼泊尔语 ISCII 57002 (Devanagari) Mangal
印度语:贡根语 ISCII 57002 (Devanagari) Mangal
印度语:印地语 ISCII 57002 (Devanagari) Mangal
印度语:阿萨姆语 ISCII 57006  
印度语:孟加拉语 ISCII 57003  
印度语:古吉拉特语 ISCII 57010  
印度语:卡纳达语 ISCII 57008  
印度语:马拉雅拉姆语 ISCII 57009  
印度语:奥里雅语 ISCII 57007  
印度语:马拉地语 ISCII 57002 (Devanagari)  
印度语:旁遮普语 ISCII 57011  
印度语:梵语 ISCII 57002 (Devanagari)  
印度语:泰卢固语 ISCII 57005  

 注释 

  • 印度语的使用,都需要系统支持和适当的 OpenType 字体。
  • 对于尼泊尔语、阿萨姆语、孟加拉语、古吉拉特语、马拉雅拉姆语和奥里雅语,仅提供有限支持。

返回页首 返回页首

 
 
适用于:
Word 2010