Elegir la codificación de texto al abrir y guardar archivos

Normalmente podemos compartir archivos de texto sin preocuparnos por la forma en que se almacena el texto. No obstante, si se comparten archivos de texto con usuarios de otros idiomas, para descargar archivos de texto de Internet o compartirlos con otros sistemas, puede que deba elegir un estándar de codificación al abrir o guardar un archivo.

Cuando usted u otra persona abre un archivo de texto en Microsoft Office Word o en otro programa (quizá en un equipo cuyo software del sistema esté en un idioma que es distinto del que se usó para crear el archivo) el estándar de codificación ayuda a ese programa a determinar cómo representar el texto para que se pueda leer.  

¿Qué desea hacer?


Comprender la codificación de texto

Lo que aparece como texto en la pantalla realmente se almacena como valores numéricos en el archivo de texto. El equipo traduce los valores numéricos en caracteres visibles. Esta acción se lleva a cabo mediante el estándar de codificación.

Un estándar de codificación es un esquema numérico que asigna a cada carácter de texto de un conjunto de caracteres un valor numérico. Un conjunto de caracteres puede incluir caracteres alfabéticos, numéricos y otros símbolos. Los distintos idiomas están formados, normalmente, por diferentes conjuntos de caracteres; por lo tanto, existen muchos estándares de codificación distintos para representar los conjuntos de caracteres que se usan en los diferentes idiomas.

Estándares de codificación distintos para alfabetos diferentes

El estándar de codificación que se guarda con un archivo de texto proporciona la información que necesita el equipo para mostrar el texto en la pantalla. Por ejemplo, en la codificación cirílica (Windows), el carácter Й tiene el valor numérico 201. Al abrir un archivo que contiene este carácter en un equipo que utiliza la codificación cirílica (Windows), el equipo lee el valor numérico 201 y muestra el símbolo Й en la pantalla.

Sin embargo, si abre el mismo archivo en un equipo que use una codificación distinta, el equipo muestra el carácter que se corresponda con el valor numérico 201 del estándar de codificación que utilice el equipo de forma predeterminada. Por ejemplo, si su equipo usa el estándar de codificación de Europa Occidental (Windows), el carácter del archivo basado en el alfabeto cirílico original se mostrará como el símbolo É en vez de Й porque en la codificación de Europa Occidental (Windows), el valor 201 se asigna al símbolo É.

Unicode: un estándar de codificación para muchos alfabetos

Para evitar problemas con el codificado y descodificado de los archivos de texto, puede guardar los archivos con codificación Unicode. Unicode alberga la mayor parte de los caracteres de todos los idiomas que suelen usar los usuarios de equipos en la actualidad.

Puesto que Word se basa en Unicode, esta aplicación guarda los archivos codificados en Unicode automáticamente. Puede abrir y leer los archivos codificados en Unicode en el sistema del equipo en español independientemente del idioma del texto. De igual forma, cuando utilice su sistema en español para guardar archivos codificados en Unicode, el archivo puede incluir caracteres que no están en los alfabetos de Europa Occidental, como los caracteres del griego, cirílico, árabe o japonés.

Volver al principio Volver al principio

Elegir una codificación estándar al abrir un archivo

Si, al abrir un archivo, el texto aparece truncado o como signos de interrogación o cuadrados, Microsoft Office Word puede que no haya detectado con precisión el estándar de codificación del texto del archivo. Puede especificar el estándar de codificación que se vaya a usar para mostrar (descodificar) el texto:

  1. Haga clic en el botón de Microsoft Office Imagen del botón y, a continuación, haga clic en Opciones de Word.
  1. Haga clic en Avanzadas.
  2. Desplácese hasta la sección General y, a continuación, active la casilla de verificación Confirmar conversiones del formato de archivo al abrir.

 Nota   Cuando está activada esta casilla de verificación, Word muestra el cuadro de diálogo Convertir archivo cada vez que abra un archivo en un formato que no sea el de Word (los formatos de Word incluyen los archivos .doc, .dot, .docx, .docm, .dotx o .dotm). Si suele trabajar con estos archivos, pero en muy pocas ocasiones desea elegir un estándar de codificación, no se olvide de desactivar esta opción para evitar que se abra sin necesidad.

  1. Cierre y vuelva a abrir el archivo.
  2. En el cuadro de diálogo Convertir archivo, seleccione Texto codificado.
  3. En el cuadro de diálogo Conversión de archivos, seleccione Otra codificación y después elija en la lista el estándar de codificación que desee.

Puede obtener una vista previa del texto en el área Vista previa para comprobar si se puede leer todo el texto en el estándar de codificación seleccionado.

Si casi todo el texto tiene el mismo aspecto (por ejemplo, si sólo aparecen cuadros o puntos), puede que la fuente necesaria para mostrar los caracteres no esté instalada. Si la fuente que necesita no está disponible, puede instalar fuentes adicionales.

Mostrar¿Cómo?

  1. En Microsoft Windows, haga clic en el botón Inicio y, a continuación, en Panel de control.
  2. Siga uno de estos procedimientos:

MostrarEn Microsoft Windows Vista:

  1. En Panel de control, haga clic en Desinstalar un programa.
  2. En la lista de programas, haga clic en la entrada de la lista correspondiente a Microsoft Office o Microsoft Word, en función de si instaló Word como parte de Office o de forma independiente, y haga clic en Cambiar.

MostrarEn Microsoft Windows XP

  1. En el Panel de control, haga clic en Agregar o quitar programas.
  2. En el cuadro Programas actualmente instalados, haga clic en la entrada de la lista correspondiente a Microsoft Office o Microsoft Word, en función de si instaló Word como parte de Office o de forma independiente, y haga clic en Cambiar.
  1. En Cambie la instalación de Microsoft Office, haga clic en Agregar o quitar funciones y, a continuación, en Continuar.
  2. En Opciones de instalación, expanda Características compartidas de Office y, a continuación, expanda Soporte internacional.
  3. Seleccione el conjunto de fuentes que necesite, haga clic en la flecha que aparece junto a la selección y luego en Ejecutar desde mi PC.

 Sugerencia   Cuando abre un archivo de texto codificado, Word aplica las fuentes definidas en el cuadro de diálogo Opciones Web. (Para llegar a este cuadro de diálogo, haga clic en el botón de Microsoft Office, en Opciones de Word y, a continuación, en Avanzadas. En la sección General, haga clic en Opciones Web.) Puede seleccionar las opciones en la ficha Fuentes del cuadro de diálogo Opciones Web para personalizar la fuente de cada conjunto de caracteres.

Volver al principio Volver al principio

Elegir una codificación estándar al guardar un archivo

Si no elige un estándar de codificación al guardar un archivo, Word lo codifica como Unicode. Normalmente, puede usar el codificado Unicode predeterminado, ya que es compatible con la mayoría de los caracteres de la mayor parte de los idiomas.

Si el documento se va a abrir en un programa que no admite la codificación Unicode, puede elegir un estándar de codificación que coincida con el del programa de destino. Por ejemplo, Unicode le permite crear un documento en el idioma chino tradicional en el sistema del idioma español. Sin embargo, si el documento se va a abrir en el idioma chino tradicional que no admite esta codificación, puede guardar el documento en la codificación (Big5) del chino tradicional. Cuando el documento se abra en el programa de este idioma, todo el texto se mostrará correctamente.

 Nota   Puesto que Unicode es el estándar más amplio, si se guarda el texto en otro tipo de codificación, puede que algunos caracteres ya no se puedan mostrar. Por ejemplo, un documento codificado en Unicode puede contener texto en hebreo y cirílico. Si este documento se guarda con la codificación cirílica (Windows), el texto en hebreo ya no se mostrará y si el documento se guarda con la codificación hebrea (Windows), el texto cirílico ya no se mostrará.

Si elige un estándar de codificación que no admite los caracteres utilizados en el archivo, Word los marca en rojo. Puede obtener una vista previa del texto en el estándar de codificación que elija antes de guardar el archivo.

Cuando guarde un archivo como texto codificado, se quita el texto con el formato de la fuente Symbol o los códigos de campo del archivo.

Elegir una codificación estándar

  1. Haga clic en el botón de Microsoft Office Imagen del botón y, a continuación, haga clic en Guardar como.

Si desea guardar un archivo en una carpeta diferente, búsquela y ábrala.

  1. En el cuadro Nombre de archivo, escriba un nuevo nombre para el archivo.
  2. En el cuadro Guardar como tipo, seleccione Texto sin formato.
  3. Haga clic en Guardar.
  4. Si aparece el cuadro de diálogo Comprobador de compatibilidad de Microsoft Office Word, haga clic en Continuar.
  5. En el cuadro de diálogo Conversión de archivos, seleccione la opción del estándar de codificación que desee usar:
    • Para utilizar el estándar de codificación predeterminado para su sistema, haga clic en Windows (predeterminada).
    • Para utilizar el estándar de codificación de MS-DOS, haga clic en MS-DOS.
    • Para elegir un estándar de codificación específico, haga clic en Otra codificación y, a continuación, seleccione el estándar de codificación que desee en la lista. Puede obtener una vista previa del texto en el área Vista previa para comprobar si se lee todo el texto en el estándar de codificación seleccionado.

 Nota   Puede cambiar el tamaño del cuadro de diálogo Conversión de archivos para que pueda obtener una vista previa que contenga más texto del documento.

  1. Si recibe un mensaje que dice: "El texto marcado en rojo no se guardará correctamente en la codificación elegida", puede intentar elegir una codificación distinta o puede activar la casilla de verificación Permitir la sustitución de caracteres.

Al permitir la sustitución de caracteres, Word reemplaza un carácter que no se puede mostrar por el carácter equivalente más semejante de la codificación que elija. Por ejemplo, tres puntos reemplazan a los puntos suspensivos y las comillas rectas reemplazan a las curvas.

Si la codificación que elija no tiene un carácter equivalente para un carácter marcado en rojo, este carácter se guardará como carácter fuera de contexto, como un signo de interrogación.

  1. Si el documento se va a abrir en un programa que no ajusta el texto de una línea con la siguiente, puede incluir saltos de línea duros en el documento mediante la activación de la casilla de verificación Insertar saltos de línea y, a continuación, especificar si desea que los saltos de línea sean delineados con un retorno de carro (CR, carriage return), avance de línea (LF, line feed) o ambos, en el cuadro Terminar líneas con.

Volver al principio Volver al principio

Buscar los estándares de codificación que están disponibles en Word

Word reconoce muchos estándares de codificación y admite los que incluye el software del sistema del equipo.

La siguiente lista de sistemas de escritura muestra los estándares de codificación (también denominados páginas de códigos) asociados con cada uno de estos sistemas.

Sistema de escritura Estándares de codificación Fuente aplicada
Multilingüe Unicode (byte significativo izquierdo y byte significativo derecho UCS-2, UTF-8, UTF-7). Fuente predeterminada basada en el estilo Normal de la versión del idioma de Word
Árabe Windows 1256, ASMO 708 Courier New
Chino simplificado GB2312, GBK, EUC-CN, ISO-2022-CN, HZ SimSun
Chino tradicional BIG5, EUC-TW, ISO-2022-TW MingLiU
Cirílico Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 Courier New
Inglés, Europeo Occidental u otro alfabeto latino Windows 1250, 1252-1254, 1257, ISO8859-x Courier New
Griego Windows 1253 Courier New
Hebreo Windows 1255 Courier New
Japonés Shift-JIS, ISO-2022-JP (JIS), EUC-JP MS Gothic
Coreano Wansung, Johab, ISO-2022-KR, EUC-KR GulimChe
Tailandés Windows 874 Tahoma
Vietnamita Windows 1258 Courier New
Lenguas indias: tamil ISCII 57004 Latha
Lenguas indias: nepalés ISCII 57002 (Devanagari) Mangal
Lenguas indias: konkani ISCII 57002 (Devanagari) Mangal
Lenguas indias: hindi ISCII 57002 (Devanagari) Mangal
Lenguas indias: asamés ISCII 57006  
Lenguas indias: bengalí ISCII 57003  
Lenguas indias: gujarati ISCII 57010  
Lenguas indias: kannada ISCII 57008  
Lenguas indias: malayalam ISCII 57009  
Lenguas indias: oriya ISCII 57007  
Lenguas indias: marathi ISCII 57002 (Devanagari)  
Lenguas indias: punjabi ISCII 57011  
Lenguas indias: sánscrito ISCII 57002 (Devanagari)  
Lenguas indias: telugu ISCII 57005  

 Notas 

  • Para utilizar las lenguas indias se requiere que el sistema sea compatible y las fuentes OpenType correspondientes.
  • Las lenguas nepalés, asamés, bengalí, gujarati, malayalam y oriya sólo cuentan con soporte limitado.

Volver al principio Volver al principio

 
 
Corresponde a:
Word 2007