Skip to main content
Softwarelokalisierungskurs 2

Zeichensätze (5/10)

Die angemessene Darstellung und Verarbeitung der Zielsprache unter Verwendung des entsprechenden Zeichensatzes bzw. Zeichenkodierung ist ebenfalls Grundvoraussetzung für die Lokalisierung sprachlicher Elemente eines Produkts. Dies sollte angesichts der weitverbreiteten Verwendung von UNICODE-Normen kein Problem sein. UNICODE ist eine einheitliche und einzigartige Grundlage für den Umgang mit Zeichensätzen (nahezu) aller Sprachen der Welt. Daher ist die Verwendung von UNICODE-Normen bei der Entwicklung von Software-Produkten allgemein üblich.

Vor UNICODE und nach Einführung von Windows-Betriebssystemen auf dem Markt und deren lokalisierter Versionen für die asiatischen Märkte wurden verschiedene sogenannte Codepages (Zeichenkodierungstabellen) erstellt, um unterschiedliche Zeichensätze für die asiatischen Sprachen verfügbar zu machen. Diese Lösung war nicht gänzlich erfolgreich und wurde besonders problematisch, wenn westliche und asiatische Zeichensätze zusammen in einem Text verwendet wurden (vgl. Schmitz, 2005a:11).

Die folgende Grafik veranschaulicht die Problematik der Verwendung mehrerer Zeichensätze innerhalb desselben Dokuments, wenn nicht alle Zeichensätze unterstützt werden. In unserem Beispiel wird die westliche Codepage (für latein-basierte Sprachen) verwendet. Deutsche Zeichen werden daher im Dialogfeld korrekt angezeigt. Japanische und griechische Zeichensätze werden jedoch nicht von der westlichen Codepage unterstützt. Daher können sie nicht korrekt interpretiert werden und der Computer zeigt sie als Fragezeichen an (vgl. Sachse, 2005:151).

In der folgenden Grafik ist klar zu ersehen, dass UNICODE die fehlende Information für die Dekodierung des japanischen und griechischen Zeichensatzes beinhaltet. In unserem Beispiel unterstützt UNICODE die drei unterschiedlichen Zeichensätze, die zusammen im oben gezeigten Dialogfeld auftreten.