Lenguaje XML

El lenguaje de marcado extensible (XML) es un lenguaje de marcado definido por el XML Working Group (grupo de trabajo sobre XML) del World Wide Web Consortium (W3C) (World Wide Web Consortium (W3C): consorcio de instituciones educativas y comerciales que supervisa la investigación y promociona estándares en todas las áreas relacionadas con World Wide Web.). El lenguaje XML se asemeja al Lenguaje de marcado de hipertexto (HTML) (HTML: lenguaje de marcado estándar utilizado para los documentos del World Wide Web. HTML utiliza etiquetas para indicar cómo deben mostrar los exploradores Web los elementos de página, como texto y gráficos, y cómo deben responder a las acciones del usuario.) en que se trata de un lenguaje basado en etiquetas, diseñado específicamente para proporcionar información en el Web. Pero, a diferencia del lenguaje HTML, las etiquetas que se utilizan en XML utiliza no están predefinidas. En vez de predefinir etiquetas para XML, el W3C especifica un conjunto de reglas que se deben seguir para poder crear un conjunto propio de etiquetas significativas.

MostrarReglas del lenguaje XML

Para crear etiquetas propias dentro de un documento XML hay que seguir una reglas sencillas:

  • Un documento XML sólo puede contener un elemento raíz.     El elemento raíz de un documento XML es un solo elemento que alberga todo el contenido que se considera parte del propio documento. El elemento raíz es el primer elemento que aparece después de la sección de prólogo del documento. También se conoce al elemento raíz como el elemento de documento.
  • Todos los elementos XML deben contener etiquetas finales.    Aunque las etiquetas finales son opcionales en determinados elementos del documento HTML, todos los elementos de un documento XML deben tener una etiqueta final.
  • Los nombres de las etiquetas iniciales y finales del elemento deben ser idénticos.     El lenguaje XML distingue mayúsculas de minúsculas, por lo que el nombre de una etiqueta final debe coincidir exactamente con el nombre de su etiqueta inicial correspondiente.
  • Los elementos XML no pueden superponerse.     Si la etiqueta inicial de un elemento aparece dentro de otro elemento, debe finalizar dentro del mismo elemento contenedor.
  • Todos los valores de atributo deben utilizar comillas.     Los valores de atributo deben estar entre comillas, ya sean sencillas o dobles.
  • Los siguientes caracteres no se pueden utilizar dentro del texto de un documento XML: < > &      Son caracteres especiales que tienen un significado concreto para los analizadores XML. Si necesita utilizar estos caracteres en el texto del documento XML, debería utilizar referencias predefinidas de caracteres o entidades.

El cumplimiento de estas reglas garantiza que el documento XML está bien formado (XML con formato correcto: documento XML que coincide con los criterios mínimos de un documento XML correspondiente.), es decir, que utiliza la sintaxis XML establecida en la recomendación del W3C. Se considera que los documentos XML tienen XML válido (XML válido: documento XML que coincide con los criterios mínimos de un documento XML correspondiente.) si utilizan un esquema XML para delimitar el tipo de datos que se puede utilizar en el documento XML.

MostrarEstructura de los documentos XML

Los documentos XML se componen de dos partes principales: un prólogo y un elemento raíz. También pueden incluir comentarios.

Prólogo

El prólogo es la primera sección de un documento XML. El prólogo contiene la declaración XML, donde se indica que se trata de un documento XML, las instrucciones de procesamiento (instrucciones de procesamiento: información almacenada en el prólogo de un documento XML. Esta información pasa a través del analizador XML hasta cualquier aplicación que utilice el documento XML.), que proporcionan información que los analizadores XML utilizan para determinar el modo de trabajar con el documento y las declaraciones de esquema, que determinan los esquemas XML (esquema XML: especificación formal escrita en XML que define la estructura de un documento XML, incluidos los nombres de elementos y tipos de datos enriquecidos, los elementos que pueden aparecer combinados y los atributos que están disponibles para cada elemento.) que se deben utilizar para verificar si el documento es válido. En el siguiente ejemplo se muestra el prólogo de un documento XML:

<?xml version="1.0" encoding="UTF-8"?>

Elemento raíz

El elemento raíz es la sección principal de un documento XML. El elemento raíz contiene los datos del documento y la información que describe la estructura de los datos. A continuación se muestra un ejemplo de la sección del elemento raíz de un documento XML:

<Employees>
   ...
</Employees>

La información del elemento raíz se almacena en dos tipos de construcciones XML: elementos y atributos. Todos los elementos y los atributos que se utilizan en un documento XML están anidados dentro del elemento raíz.

Elementos    Los elementos son las unidades primarias para la creación de un documento XML. Se utilizan para representar tanto la estructura del documento XML como los datos que contiene. Los elementos contienen una etiqueta inicial, contenido y una etiqueta final. Puesto que el XML distingue mayúsculas de minúsculas, las etiquetas iniciales y finales deben coincidir exactamente. A continuación se muestra un ejemplo de un elemento Employee sencillo que describe el nombre de un empleado. El elemento Employee está anidado dentro de un elemento raíz denominado Employees:

<Employees>
   <Employee>
      <Name>Patricia Doyle</Name>
   </Employee>
</Employees>

Los elementos pueden contener texto, otros elementos, referencias de caracteres o secciones de datos de caracteres. Los elementos que no tienen contenido alguno se denominan elementos vacíos. Las etiquetas iniciales y finales de un elemento vacío se pueden combinar en una sola etiqueta, como se muestra en el siguiente ejemplo:

<Name/>

Atributos    Los atributos son construcciones XML que utilizan un par nombre-valor que se asocia a un elemento concreto. Contienen información sobre el contenido del elemento que no va a mostrarse necesariamente, pero que se utiliza para describir alguna propiedad del elemento. Los valores de atributo están entre comillas simples o dobles, separados del nombre del atributo mediante un signo igual e incluidos en la etiqueta inicial del elemento. En el siguiente ejemplo se muestra un atributo EmployeeNumber asociado a un elemento Employee:

<Employees>
   <Employee>
      <Name EmployeeNumber="10101">Patricia Doyle</Name>
   </Employee>
</Employees>

Comentarios

Los documentos XML también pueden incluir comentarios. El analizador XML no los procesa, pero se utilizan para proporcionar documentación con significado en el origen XML del documento. Los comentarios comienzan con <!-- y finalizan con -->. El analizador XML omite el texto entre estos caracteres. En el siguiente ejemplo se muestra un comentario de un documento XML:

<!-- This XML document contains employee information. -->
<Employees>
   <Employee>
      <Name EmployeeNumber="10101">Patricia Doyle</Name>
   </Employee>
</Employees>
 
 
Corresponde a:
InfoPath 2003