2. Arten von Lokalisierungs-Dateiformaten (2/8)
2.2 Nach Software-Entwicklung
2.2.1 Quellcode-Dateien und Binär-Dateien
Bei der Entwicklung von Software gibt es unterschiedliche Arten von Lokalisierungs-Dateiformaten: Quellcode-Dateien und Binär-Dateien.
Bei der Entwicklung von Anwendungsprogrammen verwenden Programmierer Quellcode-Dateien, (die Programmcode und Resource Code enthalten), die dann zur binären Programmdateien kompiliert werden. Sowohl Quellcode-Dateien als auch Binär-Dateien sind Lokalisierungs-Dateiformate, die übersetzbaren Text enthalten.
Quellcode-Dateien:
Diese Dateien - englisch auch 'resource code files' (RC-Dateien) - enthalten Elemente der Benutzeroberfläche (z.B. Menüs und Dialogfelder) and können folgende Charakteristika aufweisen:
- Text-basiert: In diesen Nur-Text-Dateien ist der zu übersetzende Text normalerweise von Programm-Code umgeben (z.B. Spezifizierung von Dialogfeldern usw.), der beim Übersetzen nicht verändert werden sollte. Zur Übersetzung von Nur-Text-Dateien kann ein Texteditor, ein Translation-Memory-Tool oder ein spezielles Softwarelokalisierungstool eingesetzt werden.
- HTML/XML-basiert: Diese HTML/XML-basierten Quellcode-Dateien übersetzt oder editiert man mit einem Quellcode-Editor (Software-Entwicklungstool zum Erstellen und Editieren von Quellcode-Dateien), mit einem Texteditor oder einem Translation-Memory-Tool unter Verwendung eines geeigneten Filters zum Extrahieren des zu übersetzenden Texts und zum Schutz der Code-Elemente. Diese Filterfunktion gibt es z.B. in den meisten Editoren von TM-Systemen und Lokalisierungstools.
Binär-Dateien:
Binär-Dateien sind ausführbare Programmdateien und enthalten "im Unterschied zu einer reinen Textdatei auch nicht-alphabetische Zeichen. Es kann somit jeder beliebige Bytewert vorkommen. Binärdateien werden im Allgemeinen dazu verwendet, Daten abzuspeichern. (...) Computerprogramme sind ein typisches Beispiel für Binärdateien". Binärdateien werden von Computerprogrammen verwendet, um die enthaltenen Programmbefehle "auszuführen", d.h. sie sind kompilierte Programmdateien und sind im Gegensatz zu Quellcode-Dateien für den Menschen nicht lesbar. Binär-Dateien können nur mit Softwarelokalisierungstools oder solchen TM-Tools übersetzt werden, welche die Möglichkeit bieten, die lokalisierbaren Elemente aus dem binären Code zu extrahieren. Binär-Dateien können z.B. ausführbare Dateien sein (z.B. .exe, .dll) sowie Grafik-Dateien, Audio-Dateien oder gezippte Dateien.
2.2.2 Strukturelle Unterschiede
Strukturell unterscheiden sich Quellcode- und Binär-Dateien auch in:
- Externer Struktur: Unterschiedliche Möglichkeiten zur Identifizierung und zum Editieren lokalisierbarer Information ohne Beschädigung oder Zerstörung des Formats, um z.B. die lokalisierbaren Elemente zu extrahieren, damit der Übersetzer den Programmcode nicht antasten kann.
- Kontext, Anwendungsbereich, Programmierkonzepten: Eventuell fehlende Kontextinformation, unvollständige Information oder unterschiedliche Regeln für Zieldateien in Quellcode-Dateien im Gegensatz zu Binär-Dateien.
- Interner Struktur: Elemente wie Placeables, Escape-Sequenzen und Tags können in Quellcode-Dateien anders sein als in Binär-Dateien.
(Nach Esselink 2000, Freigang et. al 2005, Reineke 2005 and Sachse, 2005)