Extensible Markup Language, o sus siglas XML, forma parte de conjunto de lenguajes que hay detrás del diseño y texto de una página web de lo que hoy se dispone de herramientas para hacer en menos de una hora, cada página presenta uno propio, y el xml pertenece a este conjunto.
XML
XML es un metalenguaje que nos permite definir lenguajes de marcado adecuados para usos determinados. Es un subconjunto de SGML (Estándar generalised mark-up lenguaje) simplificado y adaptado para Internet. Es una especificación para diseñar lenguajes de marcado, que permite definir etiquetas personalizadas para descripción y organización de datos. Se trata de algo que usa el lenguaje script.
Su uso no es sólo limitado al diseño de páginas web. También debe tenerse en cuenta que no es una versión mejorada del HTML, de hecho el HTML es una aplicación del SGML por lo tanto, también del XML. Si esa explicación suena complicada, entonces podemos simplificarlo diciendo que, el lenguaje XML proporciona una plataforma para definir elementos para crear un formato y generar un lenguaje de marcado personalizado.
Los lenguajes de marcado son un conjunto de códigos que se aplican en el análisis de datos o la lectura de textos creados en computadores.
Estructura del XML
Los archivos XML, se componen de dos partes:
Prolog:
La parte prolog consiste en metadatos administrativos, como declaración XML, instrucción de procesamiento opcional, declaración de tipo de documento y comentarios.
Body:
Esta parte está compuesta por 2 partes: estructural y de contenido.
En la parte del contenido encontrar:
- Elementos: Pieza lógica del marcado, se representa con una cadena de texto (dato) que va encerrada entre paréntesis.
- Instrucciones: Ordenes específicas para ser utilizadas por la aplicación que procesan.
- Las instrucciones XML: Comienzan por <? y terminan por ?>
- Comentarios: Información que no forma parte del documento. Comienza por <!– y termina por –>
- Declaraciones de tipo: Especifican información acerca del documento.
- Secciones CDATA: Se trata de un conjunto de caracteres que no debe ser interpretado por el procesador.
El diseño del XML está basado en lo simple y fácil, por ello su uso es súper común en el diseño de páginas web. Tan comunes que existen sistemas para ayudar a la definición de lenguaje XML, que no deben confundirse con HTML.
Ventajas del XML
- Es fácil de procesar
- Separa radicalmente el contenido y el formato de presentación
- Diseñado para cualquier lenguaje y alfabeto
- No pertenece a una empresa
- Permite una utilización efectiva en Internet para sus diferentes terminales.
Características del XML
XML es un subconjunto del SGML que posee tres de sus características más importantes:
- Extensibilidad
- Estructura
- Validación
- Basado en texto
- Orientado a los contenidos no presentación
- Las etiquetas se definen para crear documentos, no tiene un significado preestablecido
- No es sustituto del HTML
- No existe visor genérico para el XML
Muchas veces hemos mencionado el HTML pero es necesario hablar un poco sobre el para poder determinar la diferencia entre este y el XML
Que es el HTML
HTML (Hypertext Markup Language) es el lenguaje de marcado de documentos para construir páginas web. Por lo tanto, los comandos de formato utilizados en los contenidos para web se refieren a la estructura del mismo y al diseño que se mostrará en el navegador.
Es decir, los navegadores leen el documento con el formato HTML y lo procesan en la pantalla mediante el examen de los elementos HTML insertados en el documento, que se considera un archivo de texto con la información que se debe publicar.
Por eso, podemos generar un archivo HTML utilizando el Bloc de notas de nuestra computadora, así como también se puede hacer con el XML. Las instrucciones incorporadas se conocen como elementos que muestran la estructura y la presentación del documento en el navegador. Estos elementos se componen de las tags que definen el formato de un texto.
Las tags suelen estar dos veces: tag inicial y tag final. Por ejemplo, para poner el texto en negrita, las etiquetas <strong> se usan al principio y </ strong> al final.
Diferencias del HTML y el XML
Ya sea mencionado mucho que estos no se deben comparar, se hace mucho énfasis en esto, es por ello que para dejarlo claro es mejor explicar estas diferencias:
- El XML es un lenguaje de marcado basado en texto que tiene una estructura de auto-descripción y puede definir efectivamente otro lenguaje de marcado. Por otro lado, el HTML es un lenguaje de mercado predefinido y tiene una capacidad limitada.
- El XML proporciona la estructura lógica del documento, mientras que la estructura del HTML está predefinida, utilizando tags heads e body.
- Cuando se trata de lenguaje, el HTML es insensible a mayúsculas y minúsculas. En cambio, el XML distingue entre mayúsculas y minúsculas, entro otros caracteres, es por ello que su uso cuenta con más facilidad
- El HTML fue diseñado con un énfasis en las características de presentación de los datos. En contraste, el XML es específico de datos.
- El XML no permite ningún error en el código. En contraste, en el HTML, pequeños errores pueden ser descuidados y causar desastres.
- Los espacios en blanco en el XML se utilizan para un fin específico, pues considera todos los caracteres el HTML, en cambio puede ignorar espacios en blanco.
- En XML la sintaxis es de gran importancia. El HTML, por otro lado, no se preocupa mucho por este aspecto.
Habiendo tocado el tema de la sintaxis, ampliemos un poco más este punto.
Sintaxis del XML
Esta representa las normas para la construcción de archivos XML.
Entre estas normas destacan:
- El XML es case-sensitive
- Todo elemento debe tener su respectiva etiqueta de apretura y de cierre, o al menos una etiqueta vacía
- Todo elemento debe contener un elemento que contenga todos los demás ( llama documento raíz)
- Todos los elementos deben estar correctamente anidados
- Todos los valores de los atributos deben estar entre comillas.
¿Cómo abrir archivos XML?
Existen programas como XML Explorer, existen otras 3 formas de abrir archivos XML en tu computadora.
Con el bloc de notas (documento de texto)
Como los archivos XML están codificados con textos simples puedes abrir el Bloc de Notas (en el caso de Windows) o el editor de texto (en Mac), hacer clic en “Archivo” y luego en “Abrir”.
En la parte superior verás la información <? Xml version = “1.0” encoding = “UTF-8”?> revelando que el contenido está en formato XML.
Las tags se utilizan para almacenar fragmentos de datos. Ten en cuenta que algunas etiquetas pueden estar contenidas en otras, creando un “árbol de etiquetas”. Por ejemplo, para crear una etiqueta de heading Tag 2 en negrita, la forma es: <h2> <strong>TÍTULO</ h2>
Utilizando un navegador
Haz clic con el botón derecho en el archivo XML guardado en tu computadora y elige la opción “Abrir con” y a continuación elige tu navegador para abrir el archivo.
En este caso, no puedes editar el documento. En contrapartida podrás ver con más claridad que en el Bloc de Notas, ya que el navegador utiliza varios colores para mostrar el documento en formato de texto.
Con Excel
Como Excel no es el programa ideal para leer este tipo de archivo, primero debes abrir Excel y luego abrir el documento XML.
Una vez hecho esto, haz clic en “archivo”, luego en “abrir”. Excel te mostrará un mensaje cuya primera opción es abrir como una tabla XML. Confirma y el XML se convertirá en una tabla, tomando como base las tags del archivo.