Skip to main content
Connaissances en TIC 1

Savez-vous ce qu'est l'encodage de caractères ? (7/31)

Oui

Solution

Pour qu'un ordinateur puisse traiter et interpréter des données celles-ci doivent être encodées numériquement. L'encodage de caractères est un ensemble d'instructions ou de données contenues dans un programme informatique. Il peut également être défini comme la mise en correspondance de deux ensembles de caractères. Par exemple, la mise en correspondance de caractères naturels du langage (comme l'alphabet) avec un ensemble d'éléments différents, comme des nombres ou des pulsations électriques.

Puisque les ordinateurs ne peuvent pas travailler directement avec les caractères utilisés dans le système de l'écriture humaine, chaque caractère est lié à une valeur binaire. Cela n'est possible que grâce à l'encodage de caractères. Ainsi, chaque caractère disponible dans l'écriture humaine doit être codé numériquement pour pouvoir être reconnu par un ordinateur. Les caractères sont encodés différemment selon le système d'exploitation, c'est le cas par exemple de Microsoft Windows et Apple Macintosh.

La relation entre un caractère et son encodage est établie par l'attribution à chaque caractère d'une valeur numérique appellée "point de code". Le nombre de points de code disponibles dépend du nombre de bits disponibles. Un ensemble de caractères à 8 bits peut encoder 256 caractères.

Les polices de caractères utilisées pour afficher et imprimer les caractères peuvent constituer une deuxième source de dysfonctionnement. Même si une application est capable d'interpréter un encodage de caractères particulier, elle ne sera peut-être pas capable d'afficher à l'écran un caractère donné, si elle ne trouve pas de police appropriée.

Pourquoi cette information est-elle importante pour les traducteurs et les professeurs de traduction ?

Les deux problèmes soulevés impliquent qu'un fichier créé par une personne pourrait être inintelligible pour son destinataire, même si celui-ci est capable de lire le langage utilisé. Comme des documents sont échangés entre différents pays en vue d'être lus et retravaillés sur différents types d'ordinateurs fonctionnant avec différents logiciels, des problèmes peuvent survenir. Ces problèmes touchent en particulier les professionnels des métiers des langues. Un texte rédigé totalement ou partiellement dans une langue comme l'anglais qui utilise l'alphabet latin sans signes diacritiques peut poser des problèmes relatifs à l'encodage des caractères. Un texte anglais traitant d'un sujet mathématique peut contenir des lettres grecques. De plus, le signe de la livre anglaise (£) n'est pas présent dans tous les systèmes d'encodage.

suivant