Sie haben möglicherweise schon einmal von XML (Extensible Markup Language) gehört und kennen vielleicht auch schon viele Gründe, warum XML in Ihrer Organisation eingesetzt werden sollte. Aber was genau ist XML? In diesem Artikel werden die Grundlagen zu XML erläutert: was XML ist und wie es funktioniert.
Inhalt dieses Artikels
Ein kurzer Blick auf Bearbeitungen, Markups und Tags
Zum besseren Verständnis von XML sollte man mit dem Bearbeiten von Daten vertraut sein, d. h. dem Hinzufügen von Bemerkungen. Seit Jahrhunderten werden Dokumente erstellt, und seit Jahrhunderten werden diese Dokumente mit Bemerkungen versehen. Lehrer korrigieren beispielsweise ständig Klausuren von Schülern. Sie weisen die Schüler an, Absätze zu verschieben, Sätze deutlicher zu formulieren, Rechtschreibfehler zu korrigieren usw. Indem wir ein Dokument mit Bemerkungen versehen, definieren wir, wie die Informationen im Dokument strukturiert sind, welche Bedeutung sie haben und wie sie optisch dargestellt werden. Das Feature zum Nachverfolgen von Änderungen in Microsoft Office Word ist eine computerisierte Form der Bearbeitung.
Bei der Datenverarbeitung hat sich das Bearbeitungsverfahren, also das Hinzufügen von Bemerkungen, zum "Markup" entwickelt. Als Markup wird der Vorgang bezeichnet, bei dem als Tags (oder Token) bezeichneter Code verwendet wird, um die Struktur, die optische Darstellung und (im Fall von XML) die Bedeutung von Daten zu definieren.
Der für diesen Artikel verwendete HTML-Code ist ein gutes Beispiel für praktisches Computer-Markup. Wenn Sie sich den Code ansehen (indem Sie in Microsoft Internet Explorer mit der rechten Maustaste auf die Seite klicken und dann auf Quelltext anzeigen klicken), finden Sie eine Mischung aus lesbarem Text und HTML-Tags (Hypertext Markup Language), beispielsweise <p> und <h2>. Tags in HTML- und XML-Dokumenten sind leicht daran zu erkennen, dass sie von spitzen Klammern umgeben sind. Im Quellcode für diesen Artikel übernehmen die HTML-Tags eine Vielzahl an Aufgaben, sie definieren z. B. den Anfang und das Ende eines Absatzes (<p> ... </p>) und kennzeichnen den Speicherort der einzelnen Bilder.
Seitenanfang
Wie entsteht XML?
Sowohl HTML- als auch XML-Dokumente enthalten Daten, die von Tags umgeben sind, aber da hören die Gemeinsamkeiten zwischen den beiden Sprachen auch auf. Bei HTML definieren die Tags die Darstellungsweise der Daten: Die Schlagzeile soll hier angezeigt werden, der Absatz beginnt dort usw. Bei XML definieren die Tags die Struktur und die Bedeutung der Daten, was also genau die Daten sind.
Durch das Beschreiben von Struktur und Bedeutung der Daten können diese Daten auf jede erdenkliche Weise wiederverwendet werden. Wenn Sie beispielsweise einen Block mit Verkaufsdaten haben und jedes Element innerhalb des Blocks klar identifiziert ist, können Sie die benötigten Elemente in einen Verkaufsbericht und die anderen Elemente in eine Abrechnungsdatenbank laden. Anders ausgedrückt können Sie ein System dazu verwenden, Ihre Daten zu generieren und mit XML-Tags zu versehen, um die Daten dann in einem anderen System zu verarbeiten, wobei weder die Hardwareplattform noch das Betriebssystem eine Rolle spielt. Diese Portabilität ist der Grund, warum XML eine der beliebtesten Technologien für den Datenaustausch ist.
Beachten Sie bei der weiteren Vorgehensweise die folgenden Aspekte:
Sie können also mithilfe von XML-Tags genau erkennen, welche Art von Daten angezeigt werden. Sie wissen z. B., dass sich diese Informationen auf eine Katze beziehen, und auch Name und Alter der Katze lassen sich leicht finden. Die Möglichkeit, Tags zu erstellen, die fast jede Art von Datenstruktur definieren können, macht XML so flexibel.
Doch verwechseln Sie die Tags in diesem Codebeispiel nicht mit den Tags in einer HTML-Datei. Wenn Sie beispielsweise diese XML-Struktur in eine HTML-Datei einfügen und die Datei dann im Browser anzeigen, sieht das Ergebnis in etwa folgendermaßen aus:
Izzy Siamese 6 yes no Izz138bod Colin Wilcox
Der Browser ignoriert die XML-Tags und zeigt nur die Daten an.
Seitenanfang
Ein Wort zu wohlgeformten Daten
Sie haben vielleicht schon einmal gehört, wie ein IT-Experte von "wohlgeformtem" XML gesprochen hat. Eine wohlgeformte XML-Datei geht mit einer Gruppe sehr strenger Regeln konform, denen XML unterliegt. Wenn eine Datei nicht regelkonform ist, funktioniert XML nicht. Im vorherigen Codebeispiel hat beispielsweise jedes öffnende Tag ein schließendes Tag, d. h., in dem Beispiel wird eine der Regeln für wohlgeformtes XML eingehalten. Wenn Sie ein Tag entfernen und versuchen, die Datei in einem Office-Programm zu öffnen, wird eine Fehlermeldung angezeigt, und das Programm verhindert die Verwendung dieser Datei.
Sie müssen nicht unbedingt die Regeln zum Erstellen von wohlgeformtem XML kennen (obwohl sie leicht verständlich sind), aber Sie müssen beachten, dass XML-Daten nur dann in verschiedenen Programmen und Systemen gemeinsam verwendet werden können, wenn die Daten wohlgeformt sind. Wenn Sie eine XML-Datei nicht öffnen können, liegt dies wahrscheinlich daran, dass die Datei nicht wohlgeformt ist.
XML ist außerdem plattformunabhängig, d. h., XML-Daten können in jedem für die Verwendung von XML konzipierten Programm gelesen und verarbeitet werden, wobei weder Hardware noch Betriebssystem eine Rolle spielen. Mit den entsprechenden XML-Tags können Sie z. B. ein Desktopprogramm verwenden, um Daten von einem Standardcomputer zu öffnen und zu verwenden. Und unabhängig davon, wer einen XML-Datenblock erstellt, können dieselben Daten in verschiedenen Microsoft Office 2003- und Microsoft Office Professional 2007-Programmen verwendet werden, z. B. Microsoft Office Access 2007, Microsoft Office Word 2007, Microsoft Office InfoPath 2007 und Microsoft Office Excel 2007. Da XML so gut übertragbar ist, hat es sich zu einer der beliebtesten Technologien für den Datenaustausch zwischen Datenbanken und Benutzerdesktops entwickelt.

Neben wohlgeformten, mit Tags versehenen Daten verwenden XML-Systeme i. A. noch zwei weitere Komponenten: Schemas und Transformationen. In den folgenden Abschnitten wird erläutert, wie diese zusätzlichen Komponenten funktionieren.
Seitenanfang
Ein kurzer Blick auf Schemas
Lassen Sie sich nicht vom Begriff "Schema" einschüchtern. Ein Schema ist einfach eine XML-Datei, die die Regeln dazu enthält, was sich in einer XML-Datendatei befinden kann. Schemadateien haben i. A. die Dateinamenerweiterung XSD, während XML-Datendateien die Erweiterung XML verwenden.
Schemas ermöglichen einem Programm, Daten zu überprüfen. Sie bilden das Gerüst für das Strukturieren von Daten, indem sichergestellt wird, dass die Datenstruktur sowohl für die Person, die die Datei erstellt hat, als auch für andere Benutzer Sinn ergibt. Wenn ein Benutzer beispielsweise ungültige Daten eingibt, wie Text in ein Datumsfeld, kann das Programm den Benutzer auffordern, die richtigen Daten einzugeben. Solange die Daten in einer XML-Datei mit den Regeln eines bestimmten Schemas konform gehen, können die Daten in jedem Programm, das XML unterstützt, mithilfe dieses Schemas gelesen, interpretiert und verarbeitet werden. In der folgenden Abbildung wird z. B. gezeigt, wie Excel und Word die <CAT>-Daten gegen das CAT-Schema überprüfen können.

Schemas können komplex aufgebaut sein. Das Erstellen von Schemas kann leider nicht im Rahmen dieses Artikels erläutert werden (ggf. kennt sich Ihre IT-Abteilung damit aus.) Doch es ist hilfreich, zu wissen, wie ein Schema aussieht. Im folgenden Schema werden die Regeln für die Tag-Kombination <CAT> ... </CAT> definiert.
<xsd:element name="CAT">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="NAME" type="xsd:string"/>
<xsd:element name="BREED" type="xsd:string"/>
<xsd:element name="AGE" type="xsd:positiveInteger"/>
<xsd:element name="ALTERED" type="xsd:boolean"/>
<xsd:element name="DECLAWED" type="xsd:boolean"/>
<xsd:element name="LICENSE" type="xsd:string"/>
<xsd:element name="OWNER" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
Sie müssen nicht alles in diesem Beispiel verstehen. Beachten Sie einfach Folgendes:
- Die Zeilenelemente im Beispielschema werden Deklarationen genannt. Wenn Sie zusätzliche Informationen zu einem Tier benötigen, z. B. die Fellfarbe oder seine Zeichnung, bitten Sie Ihre IT-Abteilung darum, dem Schema eine Deklaration hinzuzufügen. Sie können Ihr XML-System entsprechend den sich wandelnden Geschäftsanforderungen ändern.
- Mit Deklarationen können Sie die Datenstruktur ganz genau steuern. Die Deklaration
<xsd:sequence> bedeutet beispielsweise, dass die Tags, wie <NAME> und <BREED>, in der oben aufgeführten Reihenfolge platziert sein müssen. Mit Deklarationen können außerdem die Arten von Daten gesteuert werden, die Benutzer eingeben können. Im obigen Schema ist z. B. eine positive Zahl als Alter der Katze und ein boolescher Wert (WAHR oder FALSCH) für die Tags ALTERED und DECLAWED erforderlich.
- Wenn die Daten in einer XML-Datei mit den in einem Schema vorgegebenen Regeln konform gehen, werden die Daten als gültig angesehen. Das Überprüfen einer XML-Datendatei bezüglich eines Schemas wird als Validierung oder Überprüfung bezeichnet. Schemas bieten den großen Vorteil, dass sie zum Verhindern beschädigter Daten beitragen können. Außerdem erleichtern sie das Auffinden beschädigter Daten, da XML nicht mehr funktioniert, wenn ein Problem auftritt.
Seitenanfang
Ein kurzer Blick auf Transformationen
Wie zuvor erwähnt, bietet XML leistungsfähige Möglichkeiten zum Verwenden oder Wiederverwenden von Daten. Der zum Wiederverwenden von Daten eingesetzte Mechanismus wird XSLT (Extensible Stylesheet Language Transformation) oder einfach Transformation genannt. Wenn es um Transformationen geht, wird XML richtig interessant. Nachdem Sie beispielsweise eine Datendatei bezüglich eines Schemas überprüft haben, können Sie eine Transformation anwenden, durch die die Daten in eine Marketingbroschüre in Microsoft Office Word
2003 umgewandelt werden, und eine andere Transformation, um einen Umsatzbericht in Office Excel 2007 zu erstellen.
Sie (bzw. Ihre IT-Abteilung) können mithilfe von Transformationen Daten zwischen Backendsystemen, z. B. Datenbanken, austauschen. Nehmen Sie einmal an, dass in Datenbank A die Verkaufsdaten in einer Tabellenstruktur gespeichert sind, mit der die Vertriebsabteilung gerne arbeitet. In Datenbank B werden die Umsatz- und Kostendaten in einer Tabellenstruktur gespeichert, die auf die Buchhaltungsabteilung zugeschnitten ist. Datenbank B kann eine Transformation verwenden, um Daten aus Datenbank A zu akzeptieren und um diese Daten in die richtigen Tabellen zu schreiben.
Ein grundlegendes XML-System besteht aus einer Datendatei, einem Schema und einer Transformation. In der folgenden Abbildung wird gezeigt, wie solche Systeme i. A. funktionieren. Die Datendatei wird bezüglich des Schemas überprüft und dann mithilfe einer Transformation gerendert und auf andere Weise wiedergegeben. In diesem Fall werden die Daten von der Transformation in einer Tabelle auf einer Webseite bereitgestellt.

Das folgende Codebeispiel zeigt eine Möglichkeit, eine Transformation zu schreiben. Dabei werden die <CAT>-Daten in eine Tabelle auf einer Webseite geladen. Dieses Beispiel soll nicht verdeutlichen, wie eine Transformation geschrieben wird, sondern es soll als Beispiel für das Aussehen einer Transformation dienen.
<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Name</TH>
<TH>Breed</TH>
<TH>Age</TH>
<TH>Altered</TH>
<TH>Declawed</TH>
<TH>License</TH>
<TH>Owner</TH>
</TR>
<xsl:for-each select="CAT">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="NAME"/>
</TD>
<TD>
<xsl:value-of select="BREED"/>
</TD>
<TD>
<xsl:value-of select="AGE"/>
</TD>
<TD>
<xsl:value-of select="ALTERED"/>
</TD>
<TD>
<xsl:value-of select="DECLAWED"/>
</TD>
<TD>
<xsl:value-of select="LICENSE"/>
</TD>
<TD>
<xsl:value-of select="OWNER"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>
Dieses Beispiel zeigt, wie ein codierter Transformationstyp aussehen kann. Aber vergessen Sie nicht, dass Sie auch mit einfachen Worten beschreiben können, wie die Daten dargestellt werden sollen. Sie können also einfach Ihrer IT-Abteilung mitteilen, dass Sie die Verkaufsdaten für bestimmte Regionen für die letzten beiden Jahre drucken müssen, und Sie können angeben, wie die gedruckten Daten aussehen sollen. Die IT-Abteilung kann dann eine entsprechende Transformation erstellen (oder ändern).
Was dieses Konzept noch praktischer macht, ist die Tatsache, dass Microsoft und immer mehr andere Anbieter Transformationen für bestimmte Aufgaben erstellen. Wahrscheinlich können Sie in absehbarer Zukunft entweder Transformationen herunterladen, die genau Ihren Anforderungen entsprechen, oder Transformationen, die Sie zu diesem Zweck anpassen können. Daher werden die Kosten für XML im Laufe der Zeit sinken.
Seitenanfang
Ein kurzer Blick auf XML im Microsoft Office System
Microsoft Office 2003 Professional Edition und 2007 Office Release Professional Edition bieten umfassende XML-Unterstützung.
- In Office Excel 2007, Office Word 2007 und Office PowerPoint 2007 wird XML als Standarddateiformat verwendet. Dieses neue Format bietet zahlreiche Vorteile:
- Kleinere Dateigrößen. Das neue Format verwendet ZIP und andere Komprimierungstechnologien, um die Dateigröße im Vergleich zu den in früheren Office-Versionen verwendeten Binärformaten um bis zu 75 Prozent zu reduzieren.
- Einfachere Informationswiederherstellung und mehr Sicherheit. XML ist visuell lesbar, d. h. wenn eine Datei beschädigt wird, können Sie sie in Editor oder einem anderen Textleseprogramm öffnen und zumindest einen Teil der Informationen wiederherstellen. Die neuen Dateien sind auch sicherer, da sie keinen VIA-Code (Visual Basic® für Applikationen) enthalten können. Wenn Sie Vorlagen mithilfe des neuen Formats erstellen, werden ActiveX-Steuerelemente und VBA-Makros in einem separaten, besser geschützten Bereich der Datei gespeichert.
Darüber hinaus können Sie Tools verwenden, z. B. Dokumentinspektor, um persönliche Informationen zu entfernen. Weitere Informationen zum Verwenden von Dokumentinspektor finden Sie in dem Artikel Entfernen von ausgeblendeten Daten und persönlichen Informationen aus Office-Dokumenten.
- Größere Portabilität und Flexibilität. Da XML-Daten in einem Textformat und nicht in einem proprietären Binärformat gespeichert werden, können Ihre Kunden ihre eigenen Schemas definieren und Ihre Daten auf verschiedenste Arten verwenden, ohne Lizenzgebühren bezahlen zu müssen. Weitere Informationen zu den neuen Formaten finden Sie unter Einführung in Open XML-Dateiformate.
- In jedem Office-Programm wird eine andere Sammlung von Tools bereitgestellt. Die Benutzeroberfläche und Vorgänge in Word unterscheiden sich von denen in Excel oder PowerPoint. Dies liegt daran, dass Prozesse, die für Word funktionieren, nicht unbedingt auch in Excel usw. eingesetzt werden können.
- Schemas, Transformationen und Daten anderer Anbieter können in Office-Programmen verwendet werden, solange es sich um wohlgeformtes XML handelt.
- Bei einigen Office-Programmen wird XML im Hintergrund verwendet, während XML in anderen Programmen, z. B. Microsoft Office OneNote™, gar nicht unterstützt wird. Wenn Sie herausfinden möchten, ob ein Office-Programm XML unterstützt, starten Sie am besten die Hilfe für dieses Programm, und suchen Sie nach XML.
So weit, so gut, doch was passiert, wenn Sie XML-Daten ohne ein Schema haben? Die verschiedenen Office-Programme, die XML unterstützen, setzen jeweils andere Methoden ein, damit Sie mit den Daten arbeiten können. Wenn Sie beispielsweise eine XML-Datei in Word ohne ein zugehöriges Schema öffnen, werden die Tags und Daten in Word angezeigt, und Sie können eine Transformation anwenden, wenn eine bereitgestellt wurde (z. B. von der Person, die die Datei erstellt hat, oder von der IT-Abteilung). Sie können die Tags und die Daten in der Datei auf jeden Fall lesen.
Excel hingegen leitet ein Schema ab, wenn Sie eine XML-Datei ohne Schema öffnen. Sie können dann auswählen, ob diese Daten in eine schreibgeschützte Datei geladen oder einer XML-Liste (in Microsoft Office Excel 2003) bzw. einer XML-Tabelle (in Office Excel 2007) zugeordnet werden sollen. Mithilfe der XML-Listen können Sie die Daten sortieren und filtern sowie Berechnungen hinzufügen.
Office Professional 2007 und Microsoft Office 2003 stellen identische Gruppen von XML-Tools bereit. In Office Professional 2007 müssen Sie zunächst die XML-Unterstützung aktivieren. Danach können Sie die Tools von verschiedenen Stellen aus starten. Wenn Sie die Tools gestartet haben, ist ihre Funktionsweise in Microsoft Office 2003 und Office Professional 2007 identisch. In den folgenden Schritten wird beschrieben, wie Sie die XML-Tools für Office Excel 2007 und Office Word 2007 starten.
Hinweis In Microsoft Office Access 2007 werden die XML-Tools standardmäßig aktiviert, d. h., Sie können die ersten Schritte überspringen, wenn Sie Access verwenden.
Aktivieren der XML-Tools in Office Excel 2007 und Office Word 2007
- Klicken Sie in Excel bzw. Word auf die Microsoft Office-Schaltfläche
, und klicken Sie dann je nach geöffnetem Programm auf Excel-Optionen oder Word-Optionen.
- Klicken Sie auf Personalisieren.
- Aktivieren Sie unter Wichtigste Optionen für das Arbeiten mit Anwendungsname das Kontrollkästchen Entwicklerregisterkarte in der Multifunktionsleiste anzeigen, und klicken Sie dann auf OK.
Hinweis Die Multifunktionsleiste ist Bestandteil der Microsoft Office Fluent-Benutzeroberfläche.
Starten der XML-Tools in Office Excel 2007 und Office Word 2007
- Klicken Sie in beiden Programmen auf der Registerkarte Entwicklertools auf einen der verfügbaren Befehle in der Gruppe XML.
Starten der XML-Tools in Office Access 2007
- Klicken Sie auf die Registerkarte Externe Daten.
- Führen Sie eine der folgenden Aktionen aus:
- Klicken Sie in der Gruppe Importieren auf XML-Datei.
- Klicken Sie in der Gruppe
Exportieren auf Weitere und dann auf XML-Datei.
Seitenanfang
Weitere Informationen
Mit den Hyperlinks in den folgenden Abschnitten werden Informationen zum Verwenden von XML in verschiedenen Office-Programmen und zum Schreiben von XML-Code aufgerufen.
Verwenden von XML in 2007 Office Release
Hinweis Die Hyperlinks in diesem Abschnitt unterliegen Änderungen, da das Office-Team neue Inhalte erstellen und veröffentlichen wird.
Einführung in Open XML-Dateiformate
Verwenden von XML in Microsoft Office 2003
Hinweis Einige der Hyperlinks in diesem Abschnitt verweisen auf die Microsoft Office Online-Website, während andere auf MSDN (Microsoft Developer Network) verweisen.
| Onlineschulung |
|
|
Allgemeines
|
|
|
Access
|
|
|
Excel
|
|
|
FrontPage
|
|
|
InfoPath
|
|
|
Visio
|
|
|
Word
|
|
Schreiben von XML-Code
Bücher über XML
Für Anfänger
Für Entwickler und IT-Experten
Seitenanfang