2.2.1 Archivos de código fuente y archivos binarios
Al desarrollar aplicaciones de software, hay más tipos de formatos de archivo implicados en la localización: archivos de código fuente y archivos binarios. Al escribir aplicaciones de software, los programadores usan conjuntos de archivos de código fuente (que contienen código de programación, código fuente y código de recursos, que se compilan a continuación para crear archivos de programa.
Tanto los archivos de código fuente como los binarios son tipos de formatos de archivo implicados en la localización que contienen texto traducible.
Archivos de código fuente:
Estos archivos, también llamados archivos de código de recursos (archivos RC), contienen componentes de la interfaz de usuario (como menús y cuadros de diálogo) y podrían ser:
- Basados en texto: En estos archivos de formato de texto sin formato, el texto traducible suele estar rodeado por código del programa (como especificaciones de cuadros de diálogo, etc.), que no deben cambiarse durante la traducción. Con el fin de traducir archivos de código fuente que consisten en texto sin formato, pueden usarse editores de texto, herramientas de memorias de traducción o una herramienta específicamente creada para la localización de software.
- Basados en HTML/XML: Estos archivos de código fuente basados en HTML o XML pueden editarse o traducirse con un editor de código fuente (herramienta de desarrollo de software utilizado para crear y editar archivos de código fuente), un editor de texto o una herramienta de memorias de traducción, usando un filtro que permita extraer texto traducible y proteger los elementos de código, p.ej. en la mayoría de los editores de los sistemas de MT y herramientas de localización.
Archivos binarios:
Se trata de archivos ejecutables que contienen datos "codificados en formato binario (en secuencias de bytes) con fines de almacenamiento y procesamiento informáticos" (trad. de Wikipedia, 2007). Los archivos binarios se utilizan en los programas de ordenador para "ejecutar" las instrucciones de programa contenidas en ellos. Esto quiere decir que son archivos de programa compilados, y, al contrario que los archivos de código fuente, no pueden ser leídos por los seres humanos. Los archivos binarios sólo pueden traducirse con herramientas de localización de software o de memorias de traducción, que son capaces de extraer elementos localizables del código binario. Son ejemplos de archivos binarios los ejecutables (p.ej. .exe, .dll), los gráficos, los de audio y los comprimidos en formato .zip.
2.2.2 Diferencias estructurales
Respecto a su estructura, los archivos de código fuente y los binarios también se distinguen por su:
- Estructura externa: Hay diferentes posibilidades para identificar y editar la información localizable sin destruir/corromper el formato, p.ej. para extraer los elementos localizables, de forma que el traductor no manipula el código del programa
- Contexto, alcance, conceptos de programación: La información contextual que falte, la información incompleta o las reglas a seguir por los archivos de destino en los archivos de código fuente pueden ser distintos de los de los archivos binarios.
- Comunicación interna: Los elementos como los transferibles, las secuencias de escape y las etiquetas pueden ser distintos en los archivos de código fuente y los binarios.
(adaptado de Esselink 2000, Freigang et. al 2005, Reineke 2005 y Sachse, 2005)