Normalerweise können Sie eine Textdatei mit anderen Personen austauschen, ohne sich um Einzelheiten des Speicherns einer Datei kümmern zu müssen. Wenn Sie allerdings Textdateien gemeinsam mit Personen verwenden, die in anderen Sprachen arbeiten, Textdateien aus dem Internet herunterladen oder Textdateien auf unterschiedlichen Computersystemen verwenden, müssen Sie möglicherweise beim Öffnen oder Speichern einer Datei eine Codierung auswählen.
Wenn Sie oder andere Personen eine Textdatei in Microsoft Office Word oder in einem anderen Programm öffnen, möglicherweise auf einem Computer mit Systemsoftware in einer anderen Sprache als der, in der die Datei erstellt wurde, legt das Programm mithilfe der Codeseite fest, wie der Text so dargestellt wird, dass er gelesen werden kann.
Was möchten Sie tun?
Grundlegendes zur Textcodierung
Was auf dem Bildschirm als Text angezeigt wird, ist in der Textdatei in Form von numerischen Werten gespeichert. Der Computer übersetzt die numerischen Werte in sichtbare Zeichen. Diese Übersetzung erfolgt mithilfe einer Codeseite.
Bei einer Codeseite handelt es sich um ein Nummerierungsschema, mit dem jedem Textzeichen in einem Zeichensatz ein numerischer Wert zugeordnet wird. Ein Zeichensatz kann alphabetische Zeichen, Zahlen und andere Symbole enthalten. Unterschiedliche Sprachen bestehen aus unterschiedlichen Zeichensätzen. Daher gibt es viele verschiedene Codeseiten zum Darstellen der in unterschiedlichen Sprachen verwendeten Zeichensätze.
Unterschiedliche Codeseiten für unterschiedliche Alphabete
Die mit einer Textdatei gespeicherte Codeseite enthält die Informationen, die der Computer benötigt, um den Text auf dem Bildschirm darzustellen. So ist in der Codierung Kyrillisch (Windows) dem Zeichen Й beispielsweise der numerische Wert 201 zugeordnet. Wenn Sie eine Datei mit diesem Zeichen auf einem Computer öffnen, der die Codierung Kyrillisch (Windows) verwendet, liest der Computer den numerischen Wert 201 und zeigt Й auf dem Bildschirm an.
Wenn Sie dieselbe Datei jedoch auf einem Computer öffnen, der eine andere Codeseite verwendet, zeigt der Computer das Zeichen an, das dem numerischen Wert 201 in der von diesem Computer standardmäßig verwendeten Codeseite entspricht. Wenn der Computer beispielsweise die Codierung Westeuropäisch (Windows) verwendet, wird das Zeichen der ursprünglich kyrillischen Datei nicht als Й, sondern als É angezeigt, da in der Codierung Westeuropäisch (Windows) der Wert 201 dem Zeichen É zugeordnet ist.
Unicode: Eine Codeseite für viele Alphabete
Um Probleme beim Codieren und Decodieren von Textdateien zu vermeiden, können Sie Dateien mit der Unicode-Codeseite speichern. Unicode enthält die meisten Zeichensätze all der Sprachen, die Computerbenutzer heute am häufigsten verwenden.
Da Word auf Unicode basiert, speichert Word Dateien automatisch in Unicode. Sie können mit Unicode codierte Seiten auf Ihrem deutschspracheigen Computersystem unabhängig von der Sprache des Texts öffnen und lesen. Wenn Sie Dateien mit einem deutschsprachigen System in Unicode speichern, kann die Datei auch Zeichen enthalten, die es in westeuropäischen Alphabeten nicht gibt, wie z. B. griechische, kyrillische, arabische oder japanische Zeichen.
Seitenanfang
Auswählen einer Codeseite beim Öffnen einer Datei
Wenn der Text beim Öffnen einer Datei verstümmelt oder wenn nur Fragezeichen oder Kästchen angezeigt werden, hat Microsoft Office Word die Codeseite des Texts in der Datei möglicherweise nicht richtig erkannt. Sie können die Codeseite angeben, die zum Anzeigen (Decodieren) des Texts verwendet werden soll:
- Klicken Sie auf die Schaltfläche Microsoft Office
und anschließend auf Word-Optionen.
- Klicken Sie auf Erweitert.
- Führen Sie einen Bildlauf zum Abschnitt Allgemein durch, und aktivieren Sie das Kontrollkästchen Dateiformatkonvertierung beim Öffnen bestätigen.
Hinweis Wenn dieses Kontrollkästchen aktiviert ist, zeigt Word das Dialogfeld Datei konvertieren an, wenn Sie eine Datei in einem anderen Format als einem Word-Format öffnen. (Zu den Word-Formaten zählen DOC-, DOT-, DOCX-, DOTX- und DOTM-Dateien.) Wenn Sie häufig mit Dateien dieser Art arbeiten, aber nur selten eine Codeseite auswählen möchten, deaktivieren Sie diese Option, damit dieses Dialogfeld nicht unnötigerweise geöffnet wird.
- Schließen Sie die Datei, und öffnen Sie sie erneut.
- Wählen Sie im Dialogfeld Datei konvertieren die Option Codierter Text aus.
- Wählen Sie im Dialogfeld Dateikonvertierung die Option Andere Codierung und dann in der Liste die gewünschte Codeseite aus.
Sie können im Bereich Vorschau prüfen, ob der Text mit der gewählten Codeseite lesbar ist.
Wenn fast der gesamte Text gleich aussieht (beispielsweise nur Kästchen oder nur Punkte), ist möglicherweise die zum Anzeigen der Zeichen erforderliche Schriftart nicht installiert. Wenn die benötigte Schriftart nicht verfügbar ist, können Sie zusätzliche Schriftarten installieren.
So wird’s gemacht
- Klicken Sie in Microsoft Windows auf die Schaltfläche Start und dann auf Systemsteuerung.
- Führen Sie eine der folgenden Aktionen aus:
In Microsoft Windows Vista
-
Klicken Sie in der Systemsteuerung auf Programm deinstallieren.
- Klicken Sie in der Programmliste auf den Eintrag für Microsoft Office oder Microsoft Word, je nachdem, ob Sie Word als Teil von Office oder als individuelles Programm installiert haben, und klicken Sie dann auf Ändern.
Unter Microsoft Windows XP
-
Klicken Sie in der Systemsteuerung auf Software.
- Klicken Sie im Feld Zurzeit installierte Programme auf die Liste für Microsoft Office oder Microsoft Word, je nachdem, ob Sie Word als Teil von Office oder als individuelles Programm installiert haben, und klicken Sie dann auf Ändern.
- Klicken Sie unter Ändern Sie die Installation von Microsoft Office auf Features hinzufügen oder entfernen, und klicken Sie dann auf Weiter.
-
Erweitern Sie unter Installationsoptionen die Option Gemeinsam genutzte Office-Features, und erweitern Sie dann die Option Internationale Unterstützung.
-
Wählen Sie die benötigte Schriftart aus, klicken Sie auf den nebenstehenden Pfeil, und wählen Sie dann die Option Von 'Arbeitsplatz' ausführen aus.
Tipp Wenn Sie eine codierte Textdatei öffnen, wendet Word die Schriftarten an, die im Dialogfeld Weboptionen definiert wurden. (Um das Dialogfeld Weboptionen zu öffnen, klicken Sie auf die Microsoft Office-Schaltfläche, auf Word-Optionen und dann auf Erweitert. Klicken Sie im Bereich Allgemein auf Weboptionen.) Mithilfe der Optionen auf der Registerkarte Schriftarten im Dialogfeld Weboptionen können Sie die Schriftart für die einzelnen Zeichensätze anpassen.
Seitenanfang
Auswählen einer Codeseite beim Speichern einer Datei
Wenn Sie beim Speichern einer Datei keine Codeseite auswählen, verwendet Word für die Datei die Unicode-Codeseite. Die Unicode-Standardcodeseite können Sie meist verwenden, da sie die meisten Zeichen in den meisten Sprachen unterstützt.
Wenn das Dokument in einem Programm geöffnet wird, das die Unicode-Codeseite nicht unterstützt, können Sie eine Codeseite auswählen, die mit der des Zielprogramms übereinstimmt. Mit Unicode können Sie auf Ihrem deutschsprachigen System beispielsweise ein Dokument in traditionellem Chinesisch erstellen. Wenn das Dokument jedoch in einem Programm für traditionelles Chinesisch geöffnet wird, das Unicode nicht unterstützt, können Sie das Dokument in der Codierung Chinesisch traditionell (Big5) speichern. Wenn das Dokument in dem Programm für traditionelles Chinesisch geöffnet wird, wird der gesamte Text richtig angezeigt.
Hinweis Da Unicode der umfassendste Standard ist, kann das Speichern von Text in einer anderen Codierung dazu führen, dass einige Zeichen nicht mehr angezeigt werden können. Ein in Unicode codiertes Dokument kann beispielsweise hebräischen und kyrillischen Text enthalten. Wenn dieses Dokument mit der Codierung Kyrillisch (Windows) gespeichert wird, kann der hebräische Text nicht mehr angezeigt werden. Und wenn das Dokument mit der Codierung Hebräisch (Windows) gespeichert wird, kann der kyrillische Text nicht mehr angezeigt werden.
Wenn Sie eine Codierung wählen, die die in der Datei verwendeten Zeichen nicht unterstützt, markiert Word die Zeichen mit Rot, die nicht gespeichert werden können. Sie können den Text in der gewählten Codierung in einer Vorschau anzeigen, bevor Sie die Datei speichern.
Vorsicht In der Schriftart Symbol formatierter Text oder Text in Feldfunktionen wird aus der Datei entfernt, wenn Sie eine Datei als codierten Text speichern.
Auswählen einer Codeseite
- Klicken Sie auf die Schaltfläche Microsoft Office
und anschließend auf Speichern unter.
Wenn Sie die Datei in einem anderen Ordner speichern möchten, suchen und öffnen Sie den Ordner.
- Geben Sie im Feld Dateiname einen neuen Namen für die Datei ein.
- Wählen Sie im Feld Dateityp die Option Nur Text aus.
- Klicken Sie auf Speichern.
- Wenn das Dialogfeld Microsoft Office Word-Kompatibilitätsprüfung angezeigt wird, klicken Sie auf Weiter.
- Wählen Sie im Dialogfeld Dateikonvertierung die Option für die gewünschte Textcodierung aus:
- Wenn die Meldung "Rot markierter Text wird in der gewählten Codierung nicht ordnungsgemäß gespeichert" angezeigt wird, können Sie eine andere Codierung auswählen oder das Kontrollkästchen Ersetzen von Zeichen zulassen aktivieren.
Wenn Sie zulassen, dass Zeichen ersetzt werden, ersetzt Word ein Zeichen, das nicht angezeigt werden kann, mit einem Zeichen der Codeseite, das dem nicht darstellbaren Zeichen am ehesten entspricht. Beispielsweise wird ein Auslassungszeichen durch drei Punkte ersetzt oder gerade Anführungszeichen durch typografische.
Wenn es in der ausgewählten Codierung für ein rot markiertes Zeichen kein entsprechendes Zeichen gibt, wird das rot markierte Zeichen als kontextloses Zeichen gespeichert, wie z. B. als Fragezeichen.
-
Wenn das Dokument in einem Programm geöffnet wird, das keine Zeilenumbrüche verwendet, können Sie im Dokument feste Zeilenumbrüche verwenden. Aktivieren Sie hierzu das Kontrollkästchen Zeilenumbrüche einfügen, und geben Sie dann im Feld Zeilen beenden mit an, ob die Zeilen mit einem Wagenrücklauf (CR), einem Zeilenvorschub (LF) oder mit beiden Optionen beendet werden sollen.
Seitenanfang
Suchen nach Codeseiten, die in Word verfügbar sind
Word erkennt verschiedene Codeseiten und unterstützt die Codeseiten, die mit der Systemsoftware des Computers bereitgestellt wird.
In der folgenden Schriftsystemeliste sind die dem jeweiligen Schriftsystem zugeordneten Codeseiten (auch als Codierungsstandards bezeichnet) aufgeführt.
| Schriftsystem |
Codeseite |
Angewendete Schriftart |
| Mehrsprachig |
Unicode (UCS-2 Little-Endian und Big-Endian, UTF-8, UTF-7) |
Standardschriftart, die auf der Formatvorlage Standard für Ihre Sprachversion von Word basiert |
| Arabisch |
Windows 1256, ASMO 708 |
Courier New |
| Vereinfachtes Chinesisch |
GB2312, GBK, EUC-CN, ISO-2022-CN, HZ |
SimSun |
| Traditionelles Chinesisch |
BIG5, EUC-TW, ISO-2022-TW |
MingLiU |
| Kyrillisch |
Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 |
Courier New |
| Englisch, Westeuropäisch oder anderer lateinischer Zeichensatz |
Windows 1250, 1252-1254, 1257, ISO8859-x |
Courier New |
| Griechisch |
Windows 1253 |
Courier New |
| Hebräisch |
Windows 1255 |
Courier New |
| Japanisch |
Shift-JIS, ISO-2022-JP (JIS), EUC-JP |
MS Gothic |
| Koreanisch |
Wansung, Johab, ISO-2022-KR, EUC-KR |
GulimChe |
| Thailändisch |
Windows 874 |
Tahoma |
| Vietnamesisch |
Windows 1258 |
Courier New |
| Indisch: Tamil |
ISCII 57004 |
Latha |
| Indisch: Nepali |
ISCII 57002 (Devanagari) |
Mangal |
| Indisch: Konkani |
ISCII 57002 (Devanagari) |
Mangal |
| Indisch: Hindi |
ISCII 57002 (Devanagari) |
Mangal |
| Indisch: Assamesisch |
ISCII 57006 |
|
| Indisch: Bengali |
ISCII 57003 |
|
| Indisch: Gujarati |
ISCII 57010 |
|
| Indisch: Kannada |
ISCII 57008 |
|
| Indisch: Malayalam |
ISCII 57009 |
|
| Indisch: Oriya |
ISCII 57007 |
|
| Indisch: Marathi |
ISCII 57002 (Devanagari) |
|
| Indisch: Pandschabisch |
ISCII 57011 |
|
| Indisch: Sanskrit |
ISCII 57002 (Devanagari) |
|
| Indisch: Telugu |
ISCII 57005 |
|
Hinweise
- Die Verwendung von indischen Sprachen erfordert Systemunterstützung und die passenden OpenType-Schriftarten.
- Die Unterstützung für die Sprachen Nepali, Assamesisch, Bengali, Gujarati, Malayalam und Oriya ist eingeschränkt.
Seitenanfang