Extensible Markup Language ou XML est un langage permettant le balisage de documents.
A l’origine est le SGML (Standard Generalized Markup Language) qui a été développé par IBM
dans les années 70 et est devenu un standard ISO.
Le principe de base du SGML est de dissocier la structure d’un document de sa présentation.
SGML est efficace, mais complexe, son utilisation a surtout été industrielle et militaire.
Le W3C souhaitait qu’il soit possible de transmettre et traiter du SGML générique sur le Web.
Cette forme simplifiée du SGML est le Extensible Markup Language, qui est devenu une
recommandation du World Wide Web Consortium le 10 février 1998.
Dès le début, l’engouement était au rendez-vous, et depuis une dizaine d’années, des milliers de documents et applications ont été portés en XML.
L’application la plus populaire de XML est le XHTML fortement utilisé sur le Web.
Le principe de XML est d’être un métalangage permettant de baliser un contenu, et donc de décrire
ce contenu.
XML se veut souple d’utilisation: chacun peut créer son propre balisage relatif à des données fort
différentes, des images, du texte, des bases de données, des catalogues, des formules
mathématiques, des données chiffrées,..
Par contre, XML est plus rigoureux que HTML quant au respect des règles syntaxiques; un
document XML doit être bien formé: il contient un ou plusieurs éléments, la balise de chaque
élément est fermée correctement, les éléments sont case sensitive, les attributs ne sont pas vides et
sont entre guillemets.
XML permet le découplage des données et de la présentation, XML n’enferme pas les données dans
un format propriétaire qui les rend peu utilisables sous d’autres formats.
En aucun cas XML n’est à même de transformer les données qu’il contient.
XML ne propose pas de traitement, et il n’est pas possible de créer d’algorithme en XML pour
produire un résultat.