Skip to main content
Curso de Localización de Software III

Formatos de archivo implicados en la localización

6. Archivos XML (6/8)

6.3 Características

El XML permite la representación estructurada de contenidos y relaciones, separando contenido y forma.

Como en HTML, la estructura XML consiste en etiquetas (encerradas entre signos < >) y texto. Cada elemento XML viene marcado por una etiqueta de apertura y otra de cierre, y puede contener texto u otros elementos. Las etiquetas tienen nombres de atributos y pueden contener además atributos, que, a su vez, están compuestos de nombres de atributo y valores, pudiéndose definir ambos libremente. En un documento XML bien escrito, las etiquetas no se solapan, y todas las etiquetas están cerradas. Al contrario que ocurre en HTML, en que los nombres de todas las etiquetas están predefinidos, en XML se pueden definir etiquetas a placer.

UNICODE

Una de las razones que hacen que XML esté tan extendido en la industria de la localización y la internacionalización es que el juego de caracteres Unicode de los documentos XML puede incluir caracterers en la mayoría de las lenguas utilizadas hoy en día (cf. Savourel, 2005).

Entidades

Como en HTML, en XML algunos de los caracteres que corresponden a la sintaxis XML tienen que ser representados con "secuencias de escape", es decir, ser sustituidos por entidades. Por ejemplo, el signo "menor que" "<" debe representarse "&lt;" y el de "mayor que" ">" con "&gt;". Los caracteres extendidos pueden ser tratados de la misma forma en XML. De esta forma, los documentos XML pueden contener caracteres de cualquier tipo, aun cuando la codificación del documento no sea compatible con ellos. Como ejemplo, la letra griega Omega (Ω) puede sustituirse por &#x3a9 o &#937, si el documento usa una codificación incompatible con el alfabeto griego (cf. Savourel, 2005).

DTD

Como en el caso de los archivos HTML, los archivos XML también tienen una definición del tipo de documento (DTD) que contiene información sobre las funciones y las interdependencias jerárquicas de las etiquetas, la estructura, etc. Sin embargo, en contraste con lo que ocurre con las etiquetas HTML, las de XML no están predefinidas. Por tanto, la DTD describe el archivo XML mediante restricciones de la estructura. Contiene las etiquetas y los atributos permitidos en el documento XML y describe algunas construcciones que no son imprescindibles para establecer la estructura, pero que pueden afectar la interpretación de algunos documentos. Cuando la estructura de un documento XML se corresponde con el esquema DTD definido previamente, el documento XML se considera "válido".

siguiente