Extensible Markup Language (XML) ist eine Markupsprache, die durch die
XML Working Group des World Wide
Web Consortium (W3C) (World Wide Web Consortium (W3C): Ein Konsortium von kommerziellen Organisationen und Bildungseinrichtungen, das Forschungsaktivitäten zu den unterschiedlichsten Aspekten im Zusammenhang mit dem World Wide Web überwacht und die Entwicklung von Standards in diesem Bereich fördert.) definiert wurde. XML weist Ähnlichkeiten mit HTML (Hypertext Markup Language) (HTML: Die standardmäßig für Dokumente im World Wide Web verwendete Programmiersprache. In HTML wird mithilfe von Tags angegeben, wie Elemente einer Seite (Text oder Grafiken) in Webbrowsern angezeigt werden sollen und wie auf Benutzereingaben reagiert werden soll.) auf, da es sich ebenfalls um eine auf
Tags basierte Sprache handelt, die speziell für das Übermitteln von Informationen im Web entwickelt wurde.
XML unterscheidet sich jedoch von HTML in dem Punkt, dass die verwendeten Tags nicht
vordefiniert sind. Stattdessen gibt die W3C XML-Empfehlungen eine Gruppe von Regeln an, die
befolgt werden müssen, sodass Sie eigene gültige Taggruppen erstellen können.
XML-Regeln
Sie können eigene Tags zur Verwendung in XML-Dokumenten erstellen, wenn Sie die folgenden einfachen Regeln beachten:
- Ein XML-Dokument kann nur ein Stammelement enthalten
Beim Stammelement eines XML-Dokuments handelt es sich um ein einzelnes Element, das den
gesamten als Teil des Dokuments geltenden Inhalt enthält. Das Stammelement ist das
erste Element, das hinter dem Prolog des Dokuments angezeigt wird. Das Stammelement
wird auch als Dokumentelement bezeichnet.
- Alle XML-Elemente müssen Endtags enthalten Obgleich Endtags in bestimmten HTML-Dokumentelementen optional sind, müssen alle Elemente in einem XML-Dokument ein Endtag enthalten.
- Die Namen des Start- und Endtags eines Elements müssen identisch sein Bei XML wird die Groß-/Kleinschreibung beachtet, daher muss der Name eines Endtags exakt mit dem Namen des entsprechenden Starttags übereinstimmen.
- XML-Elemente dürfen nicht überlappen Falls das Starttag eines
Elements innerhalb eines anderen Elements auftritt, muss es innerhalb desselben
Elements enden.
- Alle Attributwerte müssen in Anführungszeichen gesetzt sein
Attributwerte müssen entweder in Hochkommas oder in Anführungszeichen gesetzt sein.
- Die folgenden Zeichen dürfen nicht im Text eines XML-Dokuments verwendet werden: <> & Hierbei handelt es sich um Sonderzeichen, die für XML Parser eine besondere Bedeutung haben. Falls Sie diese Zeichen im Text des XML-Dokuments verwenden müssen, sollten Sie vordefinierte Zeichen oder Entitätsverweise verwenden.
Durch das Befolgen dieser Regeln wird sichergestellt, dass das XML-Dokument
wohlgeformt (Wohl geformtes XML: Ein XML-Dokument, das den Minimalkriterien für ein XML-konformes Dokument entspricht.) ist, d. h., dass es der
XML-Syntax entspricht, die durch die W3C-Empfehlungen vorgegeben ist. Es wird vorausgesetzt, dass
XML-Dokumente über gültigen XML-Code (Gültiges XML: Ein wohl geformtes XML-Dokument, das einem speziellen Satz von Einschränkungen entspricht, der in der Regel in einem XML-Schema definiert ist.) verfügen, wenn sie ein
XML-Schema zum Einschränken des im XML-Dokument enthaltenen Datentyps verwenden.
Struktur von XML-Dokumenten
XML-Dokumente bestehen aus zwei Hauptteilen: einem Prolog und einem
Stammelement. XML-Dokumente können auch Kommentare enthalten.
Prolog
Der erste Abschnitt eines XML-Dokuments wird als Prolog bezeichnet. Der Prolog enthält die
XML-Deklaration, die festlegt, dass es sich bei dem Dokument um ein XML-Dokument handelt. Er enthält auch
Verarbeitungsanweisungen (Verarbeitungsanweisung: Informationen, die in der Einleitung eines XML-Dokuments gespeichert sind. Diese Informationen werden über den XML-Parser an jede Anwendung weitergeleitet, die das XML-Dokument verwendet.), deren
Informationen der XML Parser verwendet, um die Art der Verarbeitung für das Dokument
zu ermitteln. Schließlich enthält der Prolog Schemadeklarationen, mit denen
die XML-Schemas (XML-Schema: Eine formale, in XML geschriebene Spezifikation, die die Struktur eines XML-Dokuments sowie die Elementnamen und umfangreichen Datentypen definiert, deren Elemente in Kombination auftreten können und deren Attribute für jedes Element verfügbar sind.) ermittelt werden, die zur Überprüfung der Gültigkeit des Dokuments verwendet werden. Es folgt ein Beispiel für einen Prolog in einem XML-Dokument:
<?xml version="1.0" encoding="UTF-8"?>
Stammelement
Das Stammelement ist der wichtigste Abschnitt im XML-Dokument. Das Stammelement
enthält die Daten des Dokuments zusammen mit den Informationen, die die
Struktur der Daten beschreiben. Es folgt ein Beispiel für ein Stammelement
in einem XML-Dokument:
<Employees>
...
</Employees>
Informationen im Stammelement werden in zwei Arten von
XML-Konstrukten gespeichert: Elementen und Attributen. Alle in einem
XML-Dokument verwendeten Elemente und Attribute sind innerhalb des Stammelements geschachtelt.
Elemente Elemente sind die wichtigsten Bausteine
eines XML-Dokuments. Mit ihrer Hilfe werden sowohl die Struktur des
XML-Dokuments als auch die darin enthaltenen Daten dargestellt. Elemente
enthalten ein Starttag, Inhalt und ein Endtag. Weil in XML die Groß-/Kleinschreibung beachtet wird,
müssen Starttag und Endtag exakt übereinstimmen. Es folgt ein Beispiel für ein einfaches
Employee-Element, das den Namen eines Mitarbeiters beschreibt.
Das Employee-Element ist im Stammelement
Employees geschachtelt:
<Employees>
<Employee>
<Name>Patricia Doyle</Name>
</Employee>
</Employees>
Elemente
können Text, andere Elemente, Zeichenverweise oder Abschnitte mit Zeichendaten
enthalten. Elemente ohne Inhalt werden als
leere Elemente bezeichnet. Start- und Endtag eines leeren Elements können zu einem Tag
kombiniert werden (siehe folgendes Beispiel):
Attribute Attribute sind XML-Konstrukte, die ein
mit einem bestimmten Element verbundenes Name/Wert-Paar verwenden. Sie
enthalten Informationen zum Inhalt des Elements, der nicht notwendigerweise auch angezeigt wird.
Dieser Inhalt kann stattdessen zum Beschreiben einer bestimmten Eigenschaft des
Elements verwendet werden. Attributwerte sind entweder in Hochkommas oder Anführungszeichen
gesetzt und werden durch ein Gleichheitszeichen vom Namen des Attributs getrennt. Sie sind im
Starttag des Elements enthalten. Es folgt ein Beispiel für ein EmployeeNumber-Attribut, das
mit einem Name-Element verbunden ist:
<Employees>
<Employee>
<Name EmployeeNumber="10101">Patricia Doyle</Name>
</Employee>
</Employees>
Kommentare
XML-Dokumente können auch Kommentare enthalten. Kommentare werden nicht durch den XML Parser verarbeitet, sie stellen jedoch eine
hilfreiche Dokumentation in der XML-Quelle des Dokuments bereit. Kommentare beginnen mit
<!-- und enden mit
-->. Der Text zwischen diesen Zeichen wird vom XML Parser ignoriert. Es folgt
ein Beispiel für einen Kommentar in einem XML-Dokument:
<!-- This XML document contains employee information. -->
<Employees>
<Employee>
<Name EmployeeNumber="10101">Patricia Doyle</Name>
</Employee>
</Employees>