XML für Anfänger

Sie haben möglicherweise schon einmal von XML (Extensible Markup Language) gehört und kennen vielleicht auch schon viele Gründe, warum XML in Ihrer Organisation eingesetzt werden sollte. Aber was genau ist XML? In diesem Artikel werden die Grundlagen zu XML erläutert: was XML ist und wie es funktioniert.

Inhalt dieses Artikels


Ein kurzer Blick auf Bearbeitungen, Markups und Tags

Zum besseren Verständnis von XML sollte man mit dem Bearbeiten von Daten vertraut sein, d. h. dem Hinzufügen von Bemerkungen. Seit Jahrhunderten werden Dokumente erstellt, und seit Jahrhunderten werden diese Dokumente mit Bemerkungen versehen. Lehrer korrigieren beispielsweise ständig Klausuren von Schülern. Sie weisen die Schüler an, Absätze zu verschieben, Sätze deutlicher zu formulieren, Rechtschreibfehler zu korrigieren usw. Indem wir ein Dokument mit Bemerkungen versehen, definieren wir, wie die Informationen im Dokument strukturiert sind, welche Bedeutung sie haben und wie sie optisch dargestellt werden. Das Feature zum Nachverfolgen von Änderungen in Microsoft Office Word ist eine computerisierte Form der Bearbeitung.

Bei der Datenverarbeitung hat sich das Bearbeitungsverfahren, also das Hinzufügen von Bemerkungen, zum "Markup" entwickelt. Als Markup wird der Vorgang bezeichnet, bei dem als Tags (oder Token) bezeichneter Code verwendet wird, um die Struktur, die optische Darstellung und (im Fall von XML) die Bedeutung von Daten zu definieren.

Der für diesen Artikel verwendete HTML-Code ist ein gutes Beispiel für praktisches Computer-Markup. Wenn Sie sich den Code ansehen (indem Sie in Microsoft Internet Explorer mit der rechten Maustaste auf die Seite klicken und dann auf Quelltext anzeigen klicken), finden Sie eine Mischung aus lesbarem Text und HTML-Tags (Hypertext Markup Language), beispielsweise <p> und <h2>. Tags in HTML- und XML-Dokumenten sind leicht daran zu erkennen, dass sie von spitzen Klammern umgeben sind. Im Quellcode für diesen Artikel übernehmen die HTML-Tags eine Vielzahl an Aufgaben, sie definieren z. B. den Anfang und das Ende eines Absatzes (<p> ... </p>) und kennzeichnen den Speicherort der einzelnen Bilder.

Seitenanfang Seitenanfang

Wie entsteht XML?

Sowohl HTML- als auch XML-Dokumente enthalten Daten, die von Tags umgeben sind, aber da hören die Gemeinsamkeiten zwischen den beiden Sprachen auch auf. Bei HTML definieren die Tags die Darstellungsweise der Daten: Die Schlagzeile soll hier angezeigt werden, der Absatz beginnt dort usw. Bei XML definieren die Tags die Struktur und die Bedeutung der Daten, was also genau die Daten sind.

Durch das Beschreiben von Struktur und Bedeutung der Daten können diese Daten auf jede erdenkliche Weise wiederverwendet werden. Wenn Sie beispielsweise einen Block mit Verkaufsdaten haben und jedes Element innerhalb des Blocks klar identifiziert ist, können Sie die benötigten Elemente in einen Verkaufsbericht und die anderen Elemente in eine Abrechnungsdatenbank laden. Anders ausgedrückt können Sie ein System dazu verwenden, Ihre Daten zu generieren und mit XML-Tags zu versehen, um die Daten dann in einem anderen System zu verarbeiten, wobei weder die Hardwareplattform noch das Betriebssystem eine Rolle spielt. Diese Portabilität ist der Grund, warum XML eine der beliebtesten Technologien für den Datenaustausch ist.

Beachten Sie bei der weiteren Vorgehensweise die folgenden Aspekte:

  • Es ist nicht möglich, HTML anstelle von XML zu verwenden. Sie können jedoch XML-Daten mit HTML-Tags umgeben und sie dann auf einer Webseite anzeigen.
  • HTML ist auf eine vordefinierte Gruppe von Tags beschränkt, die von allen Benutzern gemeinsam verwendet wird.
  • Mit XML können Sie jedes beliebige Tag erstellen, das Sie zum Beschreiben der Daten und der Datenstruktur benötigen. Nehmen Sie beispielsweise an, Sie müssen Informationen zu Haustieren speichern und freigeben. Sie können folgenden XML-Code erstellen:

<?xml version="1.0"?>
<CAT>
  <NAME>Izzy</NAME>
  <BREED>Siamese</BREED>
  <AGE>6</AGE>
  <ALTERED>yes</ALTERED>
  <DECLAWED>no</DECLAWED>
  <LICENSE>Izz138bod</LICENSE>
  <OWNER>Colin Wilcox</OWNER>
</CAT>

Sie können also mithilfe von XML-Tags genau erkennen, welche Art von Daten angezeigt werden. Sie wissen z. B., dass sich diese Informationen auf eine Katze beziehen, und auch Name und Alter der Katze lassen sich leicht finden. Die Möglichkeit, Tags zu erstellen, die fast jede Art von Datenstruktur definieren können, macht XML so flexibel.

Doch verwechseln Sie die Tags in diesem Codebeispiel nicht mit den Tags in einer HTML-Datei. Wenn Sie beispielsweise diese XML-Struktur in eine HTML-Datei einfügen und die Datei dann im Browser anzeigen, sieht das Ergebnis in etwa folgendermaßen aus:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

Der Browser ignoriert die XML-Tags und zeigt nur die Daten an.

Seitenanfang Seitenanfang

Ein Wort zu wohlgeformten Daten

Sie haben vielleicht schon einmal gehört, wie ein IT-Experte von "wohlgeformtem" XML gesprochen hat. Eine wohlgeformte XML-Datei geht mit einer Gruppe sehr strenger Regeln konform, denen XML unterliegt. Wenn eine Datei nicht regelkonform ist, funktioniert XML nicht. Im vorherigen Codebeispiel hat beispielsweise jedes öffnende Tag ein schließendes Tag, d. h., in dem Beispiel wird eine der Regeln für wohlgeformtes XML eingehalten. Wenn Sie ein Tag entfernen und versuchen, die Datei in einem Office-Programm zu öffnen, wird eine Fehlermeldung angezeigt, und das Programm verhindert die Verwendung dieser Datei.

Sie müssen nicht unbedingt die Regeln zum Erstellen von wohlgeformtem XML kennen (obwohl sie leicht verständlich sind), aber Sie müssen beachten, dass XML-Daten nur dann in verschiedenen Programmen und Systemen gemeinsam verwendet werden können, wenn die Daten wohlgeformt sind. Wenn Sie eine XML-Datei nicht öffnen können, liegt dies wahrscheinlich daran, dass die Datei nicht wohlgeformt ist.

XML ist außerdem plattformunabhängig, d. h., XML-Daten können in jedem für die Verwendung von XML konzipierten Programm gelesen und verarbeitet werden, wobei weder Hardware noch Betriebssystem eine Rolle spielen. Mit den entsprechenden XML-Tags können Sie z. B. ein Desktopprogramm verwenden, um Daten von einem Standardcomputer zu öffnen und zu verwenden. Und unabhängig davon, wer einen XML-Datenblock erstellt, können dieselben Daten in verschiedenen Microsoft Office 2003- und Microsoft Office Professional 2007-Programmen verwendet werden, z. B. Microsoft Office Access 2007, Microsoft Office Word 2007, Microsoft Office InfoPath 2007 und Microsoft Office Excel 2007. Da XML so gut übertragbar ist, hat es sich zu einer der beliebtesten Technologien für den Datenaustausch zwischen Datenbanken und Benutzerdesktops entwickelt.

In anderen Programmen verwendetes XML

Neben wohlgeformten, mit Tags versehenen Daten verwenden XML-Systeme i. A. noch zwei weitere Komponenten: Schemas und Transformationen. In den folgenden Abschnitten wird erläutert, wie diese zusätzlichen Komponenten funktionieren.

Seitenanfang Seitenanfang

Ein kurzer Blick auf Schemas

Lassen Sie sich nicht vom Begriff "Schema" einschüchtern. Ein Schema ist einfach eine XML-Datei, die die Regeln dazu enthält, was sich in einer XML-Datendatei befinden kann. Schemadateien haben i. A. die Dateinamenerweiterung XSD, während XML-Datendateien die Erweiterung XML verwenden.

Schemas ermöglichen einem Programm, Daten zu überprüfen. Sie bilden das Gerüst für das Strukturieren von Daten, indem sichergestellt wird, dass die Datenstruktur sowohl für die Person, die die Datei erstellt hat, als auch für andere Benutzer Sinn ergibt. Wenn ein Benutzer beispielsweise ungültige Daten eingibt, wie Text in ein Datumsfeld, kann das Programm den Benutzer auffordern, die richtigen Daten einzugeben. Solange die Daten in einer XML-Datei mit den Regeln eines bestimmten Schemas konform gehen, können die Daten in jedem Programm, das XML unterstützt, mithilfe dieses Schemas gelesen, interpretiert und verarbeitet werden. In der folgenden Abbildung wird z. B. gezeigt, wie Excel und Word die <CAT>-Daten gegen das CAT-Schema überprüfen können.

Mithilfe von Schemas können Anwendungen XML-Daten gemeinsam verwenden.

Schemas können komplex aufgebaut sein. Das Erstellen von Schemas kann leider nicht im Rahmen dieses Artikels erläutert werden (ggf. kennt sich Ihre IT-Abteilung damit aus.) Doch es ist hilfreich, zu wissen, wie ein Schema aussieht. Im folgenden Schema werden die Regeln für die Tag-Kombination <CAT> ... </CAT> definiert.


<xsd:element name="CAT">  
  <xsd:complexType>  
    <xsd:sequence>
      <xsd:element name="NAME" type="xsd:string"/>
      <xsd:element name="BREED" type="xsd:string"/>
      <xsd:element name="AGE" type="xsd:positiveInteger"/>
      <xsd:element name="ALTERED" type="xsd:boolean"/>
      <xsd:element name="DECLAWED" type="xsd:boolean"/>
      <xsd:element name="LICENSE" type="xsd:string"/>
      <xsd:element name="OWNER" type="xsd:string"/>        
    </xsd:sequence>
  </xsd:complexType>
</xsd:element>

Sie müssen nicht alles in diesem Beispiel verstehen. Beachten Sie einfach Folgendes:

  • Die Zeilenelemente im Beispielschema werden Deklarationen genannt. Wenn Sie zusätzliche Informationen zu einem Tier benötigen, z. B. die Fellfarbe oder seine Zeichnung, bitten Sie Ihre IT-Abteilung darum, dem Schema eine Deklaration hinzuzufügen. Sie können Ihr XML-System entsprechend den sich wandelnden Geschäftsanforderungen ändern.
  • Mit Deklarationen können Sie die Datenstruktur ganz genau steuern. Die Deklaration <xsd:sequence> bedeutet beispielsweise, dass die Tags, wie <NAME> und <BREED>, in der oben aufgeführten Reihenfolge platziert sein müssen. Mit Deklarationen können außerdem die Arten von Daten gesteuert werden, die Benutzer eingeben können. Im obigen Schema ist z. B. eine positive Zahl als Alter der Katze und ein boolescher Wert (WAHR oder FALSCH) für die Tags ALTERED und DECLAWED erforderlich.
  • Wenn die Daten in einer XML-Datei mit den in einem Schema vorgegebenen Regeln konform gehen, werden die Daten als gültig angesehen. Das Überprüfen einer XML-Datendatei bezüglich eines Schemas wird als Validierung oder Überprüfung bezeichnet. Schemas bieten den großen Vorteil, dass sie zum Verhindern beschädigter Daten beitragen können. Außerdem erleichtern sie das Auffinden beschädigter Daten, da XML nicht mehr funktioniert, wenn ein Problem auftritt.
Seitenanfang Seitenanfang

Ein kurzer Blick auf Transformationen

Wie zuvor erwähnt, bietet XML leistungsfähige Möglichkeiten zum Verwenden oder Wiederverwenden von Daten. Der zum Wiederverwenden von Daten eingesetzte Mechanismus wird XSLT (Extensible Stylesheet Language Transformation) oder einfach Transformation genannt. Wenn es um Transformationen geht, wird XML richtig interessant. Nachdem Sie beispielsweise eine Datendatei bezüglich eines Schemas überprüft haben, können Sie eine Transformation anwenden, durch die die Daten in eine Marketingbroschüre in Microsoft Office Word 2003 umgewandelt werden, und eine andere Transformation, um einen Umsatzbericht in Office Excel 2007 zu erstellen.

Sie (bzw. Ihre IT-Abteilung) können mithilfe von Transformationen Daten zwischen Backendsystemen, z. B. Datenbanken, austauschen. Nehmen Sie einmal an, dass in Datenbank A die Verkaufsdaten in einer Tabellenstruktur gespeichert sind, mit der die Vertriebsabteilung gerne arbeitet. In Datenbank B werden die Umsatz- und Kostendaten in einer Tabellenstruktur gespeichert, die auf die Buchhaltungsabteilung zugeschnitten ist. Datenbank B kann eine Transformation verwenden, um Daten aus Datenbank A zu akzeptieren und um diese Daten in die richtigen Tabellen zu schreiben.

Ein grundlegendes XML-System besteht aus einer Datendatei, einem Schema und einer Transformation. In der folgenden Abbildung wird gezeigt, wie solche Systeme i. A. funktionieren. Die Datendatei wird bezüglich des Schemas überprüft und dann mithilfe einer Transformation gerendert und auf andere Weise wiedergegeben. In diesem Fall werden die Daten von der Transformation in einer Tabelle auf einer Webseite bereitgestellt.

Eine grundlegende XML-Dateistruktur mit einem Schema und einer Transformation

Das folgende Codebeispiel zeigt eine Möglichkeit, eine Transformation zu schreiben. Dabei werden die <CAT>-Daten in eine Tabelle auf einer Webseite geladen. Dieses Beispiel soll nicht verdeutlichen, wie eine Transformation geschrieben wird, sondern es soll als Beispiel für das Aussehen einer Transformation dienen.


<?xml version="1.0"?>
<xsl:stylesheet version="1.0"> 
<TABLE>
  <TR>
    <TH>Name</TH>
    <TH>Breed</TH>
    <TH>Age</TH>
    <TH>Altered</TH>
    <TH>Declawed</TH>    
    <TH>License</TH>
    <TH>Owner</TH>
  </TR>
  <xsl:for-each select="CAT">
  <TR ALIGN="LEFT" VALIGN="TOP">
    <TD>
      <xsl:value-of select="NAME"/>
    </TD>
    <TD>
      <xsl:value-of select="BREED"/>
    </TD>
    <TD>
      <xsl:value-of select="AGE"/>
    </TD>
    <TD>
      <xsl:value-of select="ALTERED"/>
    </TD>
    <TD>
      <xsl:value-of select="DECLAWED"/>
    </TD>
    <TD>
      <xsl:value-of select="LICENSE"/>
    </TD>
    <TD>
      <xsl:value-of select="OWNER"/>
    </TD>
  </TR>
</xsl:for-each>
</TABLE>

Dieses Beispiel zeigt, wie ein codierter Transformationstyp aussehen kann. Aber vergessen Sie nicht, dass Sie auch mit einfachen Worten beschreiben können, wie die Daten dargestellt werden sollen. Sie können also einfach Ihrer IT-Abteilung mitteilen, dass Sie die Verkaufsdaten für bestimmte Regionen für die letzten beiden Jahre drucken müssen, und Sie können angeben, wie die gedruckten Daten aussehen sollen. Die IT-Abteilung kann dann eine entsprechende Transformation erstellen (oder ändern).

Was dieses Konzept noch praktischer macht, ist die Tatsache, dass Microsoft und immer mehr andere Anbieter Transformationen für bestimmte Aufgaben erstellen. Wahrscheinlich können Sie in absehbarer Zukunft entweder Transformationen herunterladen, die genau Ihren Anforderungen entsprechen, oder Transformationen, die Sie zu diesem Zweck anpassen können. Daher werden die Kosten für XML im Laufe der Zeit sinken.

Seitenanfang Seitenanfang

Ein kurzer Blick auf XML im Microsoft Office System

Microsoft Office 2003 Professional Edition und 2007 Office Release Professional Edition bieten umfassende XML-Unterstützung.

  • In Office Excel 2007, Office Word 2007 und Office PowerPoint 2007 wird XML als Standarddateiformat verwendet. Dieses neue Format bietet zahlreiche Vorteile:
    • Kleinere Dateigrößen. Das neue Format verwendet ZIP und andere Komprimierungstechnologien, um die Dateigröße im Vergleich zu den in früheren Office-Versionen verwendeten Binärformaten um bis zu 75 Prozent zu reduzieren.
    • Einfachere Informationswiederherstellung und mehr Sicherheit. XML ist visuell lesbar, d. h. wenn eine Datei beschädigt wird, können Sie sie in Editor oder einem anderen Textleseprogramm öffnen und zumindest einen Teil der Informationen wiederherstellen. Die neuen Dateien sind auch sicherer, da sie keinen VIA-Code (Visual Basic® für Applikationen) enthalten können. Wenn Sie Vorlagen mithilfe des neuen Formats erstellen, werden ActiveX-Steuerelemente und VBA-Makros in einem separaten, besser geschützten Bereich der Datei gespeichert. Darüber hinaus können Sie Tools verwenden, z. B. Dokumentinspektor, um persönliche Informationen zu entfernen. Weitere Informationen zum Verwenden von Dokumentinspektor finden Sie in dem Artikel Entfernen von ausgeblendeten Daten und persönlichen Informationen aus Office-Dokumenten.
    • Größere Portabilität und Flexibilität. Da XML-Daten in einem Textformat und nicht in einem proprietären Binärformat gespeichert werden, können Ihre Kunden ihre eigenen Schemas definieren und Ihre Daten auf verschiedenste Arten verwenden, ohne Lizenzgebühren bezahlen zu müssen. Weitere Informationen zu den neuen Formaten finden Sie unter Einführung in Open XML-Dateiformate.
  • In jedem Office-Programm wird eine andere Sammlung von Tools bereitgestellt. Die Benutzeroberfläche und Vorgänge in Word unterscheiden sich von denen in Excel oder PowerPoint. Dies liegt daran, dass Prozesse, die für Word funktionieren, nicht unbedingt auch in Excel usw. eingesetzt werden können.
  • Schemas, Transformationen und Daten anderer Anbieter können in Office-Programmen verwendet werden, solange es sich um wohlgeformtes XML handelt.
  • Bei einigen Office-Programmen wird XML im Hintergrund verwendet, während XML in anderen Programmen, z. B. Microsoft Office OneNote™, gar nicht unterstützt wird. Wenn Sie herausfinden möchten, ob ein Office-Programm XML unterstützt, starten Sie am besten die Hilfe für dieses Programm, und suchen Sie nach XML.

So weit, so gut, doch was passiert, wenn Sie XML-Daten ohne ein Schema haben? Die verschiedenen Office-Programme, die XML unterstützen, setzen jeweils andere Methoden ein, damit Sie mit den Daten arbeiten können. Wenn Sie beispielsweise eine XML-Datei in Word ohne ein zugehöriges Schema öffnen, werden die Tags und Daten in Word angezeigt, und Sie können eine Transformation anwenden, wenn eine bereitgestellt wurde (z. B. von der Person, die die Datei erstellt hat, oder von der IT-Abteilung). Sie können die Tags und die Daten in der Datei auf jeden Fall lesen.

Excel hingegen leitet ein Schema ab, wenn Sie eine XML-Datei ohne Schema öffnen. Sie können dann auswählen, ob diese Daten in eine schreibgeschützte Datei geladen oder einer XML-Liste (in Microsoft Office Excel 2003) bzw. einer XML-Tabelle (in Office Excel 2007) zugeordnet werden sollen. Mithilfe der XML-Listen können Sie die Daten sortieren und filtern sowie Berechnungen hinzufügen.

Office Professional 2007 und Microsoft Office 2003 stellen identische Gruppen von XML-Tools bereit. In Office Professional 2007 müssen Sie zunächst die XML-Unterstützung aktivieren. Danach können Sie die Tools von verschiedenen Stellen aus starten. Wenn Sie die Tools gestartet haben, ist ihre Funktionsweise in Microsoft Office 2003 und Office Professional 2007 identisch. In den folgenden Schritten wird beschrieben, wie Sie die XML-Tools für Office Excel 2007 und Office Word 2007 starten.

 Hinweis   In Microsoft Office Access 2007 werden die XML-Tools standardmäßig aktiviert, d. h., Sie können die ersten Schritte überspringen, wenn Sie Access verwenden.

Aktivieren der XML-Tools in Office Excel 2007 und Office Word 2007

  1. Klicken Sie in Excel bzw. Word auf die Microsoft Office-Schaltfläche Schaltflächensymbol, und klicken Sie dann je nach geöffnetem Programm auf Excel-Optionen oder Word-Optionen.
  2. Klicken Sie auf Personalisieren.
  3. Aktivieren Sie unter Wichtigste Optionen für das Arbeiten mit Anwendungsname das Kontrollkästchen Entwicklerregisterkarte in der Multifunktionsleiste anzeigen, und klicken Sie dann auf OK.

 Hinweis   Die Multifunktionsleiste ist Bestandteil der Microsoft Office Fluent-Benutzeroberfläche.

Starten der XML-Tools in Office Excel 2007 und Office Word 2007

  • Klicken Sie in beiden Programmen auf der Registerkarte Entwicklertools auf einen der verfügbaren Befehle in der Gruppe XML.

Starten der XML-Tools in Office Access 2007

  1. Klicken Sie auf die Registerkarte Externe Daten.
  2. Führen Sie eine der folgenden Aktionen aus:
    • Klicken Sie in der Gruppe Importieren auf XML-Datei.
    • Klicken Sie in der Gruppe Exportieren auf Weitere und dann auf XML-Datei.
Seitenanfang Seitenanfang

Weitere Informationen

Mit den Hyperlinks in den folgenden Abschnitten werden Informationen zum Verwenden von XML in verschiedenen Office-Programmen und zum Schreiben von XML-Code aufgerufen.

AnzeigenVerwenden von XML in 2007 Office Release

 Hinweis   Die Hyperlinks in diesem Abschnitt unterliegen Änderungen, da das Office-Team neue Inhalte erstellen und veröffentlichen wird.

Einführung in Open XML-Dateiformate

AnzeigenVerwenden von XML in Microsoft Office 2003

AnzeigenSchreiben von XML-Code

AnzeigenBücher über XML

Seitenanfang Seitenanfang
 
 
Zutreffend für:
Excel 2007, PowerPoint 2007, Word 2007