Skip to main content
Cours de localisation de logiciels 2

Jeux de caractères (5/10)

Traiter et représenter correctement la langue cible en utilisant le jeu de caractères ou l'encodage de caractère correspondant est également essentiel pour la localisation des éléments linguistiques d'un produit. Cette étape ne pose aucun problème étant donné que l'utilisation des normes UNICODE est largement répandue. UNICODE est une base uniformisée et unique permettant de traiter les jeux de caractères de (presque) toutes les langues du monde. C'est pourquoi les normes UNICODE sont couramment utilisées pour développer des logiciels.

Avant la création de UNICODE et après le lancement des systèmes d'exploitation Windows sur le marché et la commercialisation de leurs versions localisées sur les marchés asiatiques, il existait différentes pages de codes (tables d'encodage de caractères) créées pour que différents jeux de caractères soient disponibles pour les langues asiatiques. Cette solution, qui n'a pas été une franche réussite, posait nombre de problèmes lorsque les jeux de caractères occidentaux et asiatiques étaient utilisés ensemble dans le même texte (cf. Schmitz, 2005a:11).

L'image suivante illustre le problème survenant lorsque différents jeux de caractères sont utilisés ensemble dans la même source et qu'ils ne sont pas tous compatibles aves les pages de codes. Puisque dans notre exemple c'est la page de code occidentale (pour les langues basées sur le latin) qui est utilisée, les caractères allemands s'affichent correctement dans la boîte de dialogue. Mais les caractères japonais et grecs, qui ne sont pas compatibles avec la page de code occidentale, ne peuvent pas être interprétés correctement. L'ordinateur les représente donc sous forme de points d'interrogation (cf. Sachse, 2005:151).

Sur l'image suivante, vous pouvez clairement voir que UNICODE contient les informations manquantes nécessaires au décodage des jeux de caractères japonais et grecs. Ici, UNICODE est compatible avec trois différents types de jeux de caractères apparaissant ensemble dans la boîte de dialogue ci-dessus.