Normalmente podemos compartir archivos de texto sin preocuparnos por la forma en que se almacena el texto. No obstante, si se comparten archivos de texto con usuarios de otros idiomas, para descargar archivos de texto de Internet o compartirlos con otros sistemas, puede que deba elegir un estándar de codificación al abrir o guardar un archivo.
Cuando usted u otra persona abre un archivo de texto en Microsoft Office Word o en otro programa (quizá en un equipo cuyo software del sistema esté en un idioma que es distinto del que se usó para crear el archivo) el estándar de codificación ayuda a ese programa a determinar cómo representar el texto para que se pueda leer.
¿Qué desea hacer?
Comprender la codificación de texto
Lo que aparece como texto en la pantalla realmente se almacena como valores numéricos en el archivo de texto. El equipo traduce los valores numéricos en caracteres visibles. Esta acción se lleva a cabo mediante el estándar de codificación.
Un estándar de codificación es un esquema numérico que asigna a cada carácter de texto de un conjunto de caracteres un valor numérico. Un conjunto de caracteres puede incluir caracteres alfabéticos, numéricos y otros símbolos. Los distintos idiomas están formados, normalmente, por diferentes conjuntos de caracteres; por lo tanto, existen muchos estándares de codificación distintos para representar los conjuntos de caracteres que se usan en los diferentes idiomas.
Estándares de codificación distintos para alfabetos diferentes
El estándar de codificación que se guarda con un archivo de texto proporciona la información que necesita el equipo para mostrar el texto en la pantalla. Por ejemplo, en la codificación cirílica (Windows), el carácter Й tiene el valor numérico 201. Al abrir un archivo que contiene este carácter en un equipo que utiliza la codificación cirílica (Windows), el equipo lee el valor numérico 201 y muestra el símbolo Й en la pantalla.
Sin embargo, si abre el mismo archivo en un equipo que use una codificación distinta, el equipo muestra el carácter que se corresponda con el valor numérico 201 del estándar de codificación que utilice el equipo de forma predeterminada. Por ejemplo, si su equipo usa el estándar de codificación de Europa Occidental (Windows), el carácter del archivo basado en el alfabeto cirílico original se mostrará como el símbolo É en vez de Й porque en la codificación de Europa Occidental (Windows), el valor 201 se asigna al símbolo É.
Unicode: un estándar de codificación para muchos alfabetos
Para evitar problemas con el codificado y descodificado de los archivos de texto, puede guardar los archivos con codificación Unicode. Unicode alberga la mayor parte de los caracteres de todos los idiomas que suelen usar los usuarios de equipos en la actualidad.
Puesto que Word se basa en Unicode, esta aplicación guarda los archivos codificados en Unicode automáticamente. Puede abrir y leer los archivos codificados en Unicode en el sistema del equipo en español independientemente del idioma del texto. De igual forma, cuando utilice su sistema en español para guardar archivos codificados en Unicode, el archivo puede incluir caracteres que no están en los alfabetos de Europa Occidental, como los caracteres del griego, cirílico, árabe o japonés.
Volver al principio
Elegir una codificación estándar al abrir un archivo
Si, al abrir un archivo, el texto aparece truncado o como signos de interrogación o cuadrados, Microsoft Office Word puede que no haya detectado con precisión el estándar de codificación del texto del archivo. Puede especificar el estándar de codificación que se vaya a usar para mostrar (descodificar) el texto:
- Haga clic en el botón de Microsoft Office
y, a continuación, haga clic en Opciones de Word.
- Haga clic en Avanzadas.
- Desplácese hasta la sección General y, a continuación, active la casilla de verificación Confirmar conversiones del formato de archivo al abrir.
Nota Cuando está activada esta casilla de verificación, Word muestra el cuadro de diálogo Convertir archivo cada vez que abra un archivo en un formato que no sea el de Word (los formatos de Word incluyen los archivos .doc, .dot, .docx, .docm, .dotx o .dotm). Si suele trabajar con estos archivos, pero en muy pocas ocasiones desea elegir un estándar de codificación, no se olvide de desactivar esta opción para evitar que se abra sin necesidad.
- Cierre y vuelva a abrir el archivo.
- En el cuadro de diálogo Convertir archivo, seleccione Texto codificado.
- En el cuadro de diálogo Conversión de archivos, seleccione Otra codificación y después elija en la lista el estándar de codificación que desee.
Puede obtener una vista previa del texto en el área Vista previa para comprobar si se puede leer todo el texto en el estándar de codificación seleccionado.
Si casi todo el texto tiene el mismo aspecto (por ejemplo, si sólo aparecen cuadros o puntos), puede que la fuente necesaria para mostrar los caracteres no esté instalada. Si la fuente que necesita no está disponible, puede instalar fuentes adicionales.
¿Cómo?
- En Microsoft Windows, haga clic en el botón Inicio y, a continuación, en Panel de control.
- Siga uno de estos procedimientos:
En Microsoft Windows Vista:
-
En Panel de control, haga clic en Desinstalar un programa.
- En la lista de programas, haga clic en la entrada de la lista correspondiente a Microsoft Office o Microsoft Word, en función de si instaló Word como parte de Office o de forma independiente, y haga clic en Cambiar.
En Microsoft Windows XP
-
En el Panel de control, haga clic en Agregar o quitar programas.
- En el cuadro Programas actualmente instalados, haga clic en la entrada de la lista correspondiente a Microsoft Office o Microsoft Word, en función de si instaló Word como parte de Office o de forma independiente, y haga clic en Cambiar.
- En Cambie la instalación de Microsoft Office, haga clic en Agregar o quitar funciones y, a continuación, en Continuar.
-
En Opciones de instalación, expanda Características compartidas de Office y, a continuación, expanda Soporte internacional.
-
Seleccione el conjunto de fuentes que necesite, haga clic en la flecha que aparece junto a la selección y luego en Ejecutar desde mi PC.
Sugerencia Cuando abre un archivo de texto codificado, Word aplica las fuentes definidas en el cuadro de diálogo Opciones Web. (Para llegar a este cuadro de diálogo, haga clic en el botón de Microsoft Office, en Opciones de Word y, a continuación, en Avanzadas. En la sección General, haga clic en Opciones Web.) Puede seleccionar las opciones en la ficha Fuentes del cuadro de diálogo Opciones Web para personalizar la fuente de cada conjunto de caracteres.
Volver al principio
Elegir una codificación estándar al guardar un archivo
Si no elige un estándar de codificación al guardar un archivo, Word lo codifica como Unicode. Normalmente, puede usar el codificado Unicode predeterminado, ya que es compatible con la mayoría de los caracteres de la mayor parte de los idiomas.
Si el documento se va a abrir en un programa que no admite la codificación Unicode, puede elegir un estándar de codificación que coincida con el del programa de destino. Por ejemplo, Unicode le permite crear un documento en el idioma chino tradicional en el sistema del idioma español. Sin embargo, si el documento se va a abrir en el idioma chino tradicional que no admite esta codificación, puede guardar el documento en la codificación (Big5) del chino tradicional. Cuando el documento se abra en el programa de este idioma, todo el texto se mostrará correctamente.
Nota Puesto que Unicode es el estándar más amplio, si se guarda el texto en otro tipo de codificación, puede que algunos caracteres ya no se puedan mostrar. Por ejemplo, un documento codificado en Unicode puede contener texto en hebreo y cirílico. Si este documento se guarda con la codificación cirílica (Windows), el texto en hebreo ya no se mostrará y si el documento se guarda con la codificación hebrea (Windows), el texto cirílico ya no se mostrará.
Si elige un estándar de codificación que no admite los caracteres utilizados en el archivo, Word los marca en rojo. Puede obtener una vista previa del texto en el estándar de codificación que elija antes de guardar el archivo.
Precaución Cuando guarde un archivo como texto codificado, se quita el texto con el formato de la fuente Symbol o los códigos de campo del archivo.
Elegir una codificación estándar
- Haga clic en el Botón Microsoft Office
y, a continuación, haga clic en Guardar como.
Si desea guardar un archivo en una carpeta diferente, búsquela y ábrala.
- En el cuadro Nombre de archivo, escriba un nuevo nombre para el archivo.
- En el cuadro Guardar como tipo, seleccione Texto sin formato.
- Haga clic en Guardar.
- Si aparece el cuadro de diálogo Comprobador de compatibilidad de Microsoft Office Word, haga clic en Continuar.
- En el cuadro de diálogo Conversión de archivos, seleccione la opción del estándar de codificación que desee usar:
- Si recibe un mensaje que dice: "El texto marcado en rojo no se guardará correctamente en la codificación elegida", puede intentar elegir una codificación distinta o puede activar la casilla de verificación Permitir la sustitución de caracteres.
Al permitir la sustitución de caracteres, Word reemplaza un carácter que no se puede mostrar por el carácter equivalente más semejante de la codificación que elija. Por ejemplo, tres puntos reemplazan a los puntos suspensivos y las comillas rectas reemplazan a las curvas.
Si la codificación que elija no tiene un carácter equivalente para un carácter marcado en rojo, este carácter se guardará como carácter fuera de contexto, como un signo de interrogación.
-
Si el documento se va a abrir en un programa que no ajusta el texto de una línea con la siguiente, puede incluir saltos de línea duros en el documento mediante la activación de la casilla de verificación Insertar saltos de línea y, a continuación, especificar si desea que los saltos de línea sean delineados con un retorno de carro (CR, carriage return), avance de línea (LF, line feed) o ambos, en el cuadro Terminar líneas con.
Volver al principio
Buscar los estándares de codificación que están disponibles en Word
Word reconoce muchos estándares de codificación y admite los que incluye el software del sistema del equipo.
La siguiente lista de sistemas de escritura muestra los estándares de codificación (también denominados páginas de códigos) asociados con cada uno de estos sistemas.
| Sistema de escritura |
Estándares de codificación |
Fuente aplicada |
| Multilingüe |
Unicode (byte significativo izquierdo y byte significativo derecho UCS-2, UTF-8, UTF-7). |
Fuente predeterminada basada en el estilo Normal de la versión del idioma de Word |
| Árabe |
Windows 1256, ASMO 708 |
Courier New |
| Chino simplificado |
GB2312, GBK, EUC-CN, ISO-2022-CN, HZ |
SimSun |
| Chino tradicional |
BIG5, EUC-TW, ISO-2022-TW |
MingLiU |
| Cirílico |
Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 |
Courier New |
| Inglés, Europeo Occidental u otro alfabeto latino |
Windows 1250, 1252-1254, 1257, ISO8859-x |
Courier New |
| Griego |
Windows 1253 |
Courier New |
| Hebreo |
Windows 1255 |
Courier New |
| Japonés |
Shift-JIS, ISO-2022-JP (JIS), EUC-JP |
MS Gothic |
| Coreano |
Wansung, Johab, ISO-2022-KR, EUC-KR |
GulimChe |
| Tailandés |
Windows 874 |
Tahoma |
| Vietnamita |
Windows 1258 |
Courier New |
| Lenguas indias: tamil |
ISCII 57004 |
Latha |
| Lenguas indias: nepalés |
ISCII 57002 (Devanagari) |
Mangal |
| Lenguas indias: konkani |
ISCII 57002 (Devanagari) |
Mangal |
| Lenguas indias: hindi |
ISCII 57002 (Devanagari) |
Mangal |
| Lenguas indias: asamés |
ISCII 57006 |
|
| Lenguas indias: bengalí |
ISCII 57003 |
|
| Lenguas indias: gujarati |
ISCII 57010 |
|
| Lenguas indias: kannada |
ISCII 57008 |
|
| Lenguas indias: malayalam |
ISCII 57009 |
|
| Lenguas indias: oriya |
ISCII 57007 |
|
| Lenguas indias: marathi |
ISCII 57002 (Devanagari) |
|
| Lenguas indias: punjabi |
ISCII 57011 |
|
| Lenguas indias: sánscrito |
ISCII 57002 (Devanagari) |
|
| Lenguas indias: telugu |
ISCII 57005 |
|
Notas
- Para utilizar las lenguas indias se requiere que el sistema sea compatible y las fuentes OpenType correspondientes.
- Las lenguas nepalés, asamés, bengalí, gujarati, malayalam y oriya sólo cuentan con soporte limitado.
Volver al principio