Skip to main content
Cours de localisation de logiciels 3

Formats de fichiers de localisation

6. Fichiers XML (6/8)

6.3 Caractéristiques

Le langage XML permet de représenter de façon structurelle les contenus et les relations en séparant forme et contenu.

Comme pour le langage HTML, la structure XML est constituée de balises mises entre chevrons "< >" et de texte. Une balise ouvrante et une balise fermante forment un élément XML. Ce dernier contient du texte et/ou d'autres éléments. Les balises ont des noms d'attributs et peuvent ainsi contenir des attributs, eux-même composés de nom d'attributs et de valeurs, tous deux librement définissables. Dans un document XML normal, les tags sont fermés et ne se chevauchent pas. Contrairement au langage HTML pour lequel les noms des balises sont prédéfinis, les noms des balises d'un document XML peuvent être personnalisés par l'utilisateur.

UNICODE

L'une des raisons du succès du langage XML dans les domaines de la localisation et de l'internationalisation est le fait que le jeu de caractères Unicode des documents XML peut représenter les caractères de la plupart des langues utilisées aujourd'hui (cf. Savourel, 2005).

Entités

Comme pour le langage HTML, certains caractères appartenant à la syntaxe XML doivent être remplacés par des entités. Par exemple les chevrons ouvrants ("<") doivent être remplacés par "&lt;" et les chevrons fermants (">") par "&gt;". Les caractères étendus peuvent également être remplacés dans un fichier XML. De cette façon, les documents peuvent contenir tout type de caractères même si l'encodage des documents n'est pas compatible avec ces caractères. Par exemple, la lettre grecque oméga (Ω) peut être remplacée par &#x3a9 ou &#937 si le document utilise un encodage qui n'est pas compatible avec l'alphabet grec (cf. Savourel, 2005).

DTD

Tout comme les fichiers HTML, les fichiers XML ont également une DTD (définition de type de document) contenant des informations sur les fonctions et les interdépendances hiérarchiques des balises, de la structure, etc. Toutefois, les balises XML, contrairement aux balises HTML, ne sont pas prédéfinies. Ainsi la DTD décrit le fichier XML en terme de contraintes relatives à la structure. La DTD contient les balises et les attributs possibles pour le document XML et décrit certains éléments qui ne sont pas forcément nécessaires pour établir la structure mais qui peuvent affecter l'interprétation de certains documents. Si la structure d'un document XML correspond au schéma défini au préalable dans la DTD, ce document est considéré comme "valide".

suivant