Como se explicó en los cursos anteriores de localización de software (véase Curso de Localización de Software III), estos tipos de formatos de archivo contienen texto y etiquetas - los cuales determinan la estructura del texto y el formato (en el caso de HTML). Por lo general, los archivos HTML y XML se localizan usando sistemas de memoria de traducción o herramientas de localización de software. En estos tipos de archivo, los elementos traducibles (en negrilla) se encuentran normalmente en:
- Título del Sitio Web: El título del sitio web se muestra sólo en la barra de título del navegador y es usado por los motores de búsqueda. Aparece en la parte superior de una página HTML o XML. Por ejemplo:
Sólo el texto en negrilla es texto traducible
- Mega-etiquetas con listas de palabras clave: También son usadas por los motores de búsqueda y contienen texto traducible, por ejemplo:
Sólo el texto en negrilla es texto traducible
- En el cuerpo de la página HTML o XML, es posible que el texto incluya un formato interno (p.ej. en negrilla o en cursiva, etc.) que debe ser insertado en la traducción, por ejemplo:
Sólo el texto en negrilla es texto traducible
- Texto en hipervínculos: cuando el destino de un hipervínculo tiene un nombre distinto en el idioma de destino del sitio web, éste debe ser cambiado, por ejemplo:
Sólo el texto en negrilla es texto traducible
- Nombres de archivo y de rutas: A menudo, se tienen que cambiar los nombres de ruta y de archivo en los archivos HTML or XML para que correspondan a los nombres originales (en el caso de que éstos también hayan sidos traducidos). Esto sucede, por ejemplo, en los gráficos o contenidos de los campos emergentes - que aparecen cuando se pasa el ratón sobre ellos (p.ej. los tooltips).
- Campos/cuadros de ingreso y botones: En el caso de los campos/cuadros de ingreso y botones, algunos valores dados deben ser traducidos, pero no todos. Por ejemplo, en el campo de entrada siguiente, tomado del sitio web de eCoLoTrain:
que normalmente se ve así:
Sólo el texto en negrilla es texto traducible
Sólo el valor «Ingresar el término buscado» va a ser traducido. El valor «Text» de INPUT TYPE no debe cambiarse. El mismo campo de ingreso traducido en francés se ve así:
Sólo el texto en negrilla es texto traducible
- Texto en scripts: El texto escrito en el documento por el script es el único texto traducible en los scripts. El texto de los comentarios (señalado por la sequencia de caracteres: "<!--?.-->" no es traducible. Por ejemplo:
Sólo el texto en negrilla es texto traducible.
Al momento de localizar gráficos, es importante saber si el gráfico es culturalmente aceptable o comprensible o si debe ser adaptado; si los colores y el fondo corresponden a la información contenida en el texto; si el texto contenido en los gráficos debe ser traducido. La gráficos de localización más fáciles de usar son aquellos compuestos por varias capas, donde el texto, fondo e imagen son guardados en diferentes capas. Para editar este tipo de archivos se necesitan aplicaciones como PaintShop, Adobe Illustrator o PhotoShop.
Al localizar gráficos animados como Flash, cada gráfico debe ser adaptado individualmente, y el texo, si lo hay, debe ser traducido en archivos de texto separados (también usando sistemas de memoria de traducción.)
Normalmente estos archivos deben volver a ser creados usando un texto traducido como base.