Dictionnaire de caractères accentués

Question

pan

14 Mar 2009 à 09:25

Bonjour,
Je viens de réinjecter dans un forum une ancienne base de donnée dont le contenu était encodé en UTF8.

Mon actuel forum étant en iso les caractères accentués sont donc mal affichés.
Si je passe mon forum actuel en UTF8 les caractères accentués issus de la base de donnée sont ok mais c'est le forum qui ne s'affiche plus correctement...

Je voudrais donc remplacer dans ma base de donnée, tous les caractères accentués par des caractères normaux.

Je cherche donc une sorte de dictionnaire dans lequel je pourrais trouver la correspondance des caractères par exemple :

Ã© = é, Ã = à etc...

Avez vous quelque info à me fournir ?
Merci

fvsch

14 Mar 2009 à 19:57

Bonjour,

Il vaut mieux utiliser des outils de conversion qui permettent de passer d'UTF-8 à ISO-8859-1 (avec des pertes, vu que les deux encodages sont très loin d'être équivalents). Il y en a peut-être qui s'intègrent directement à ton SGBD, ou bien éventuellement il faut travailler sur des exports au format texte (fichier .sql par exemple).

Il n'existe pas de «dictionnaire» qui listerait les correspondances entre UTF-8 et ISO-8859-1 parce que:
1. Il existe des dizaines (centaines?) de milliers de caractères en unicode, et donc en UTF-8; à l'inverse, il n'y en a qu'un nombre limité (140 ou quelque chose comme ça) en ISO-8859-1.
2. «Ã©» est le résultat de l'affichage comme ISO-8859-1 d'un caractère «é» codé en UTF-8. D'autres caractères peuvent donner des résultats non affichables, car les valeurs utilisées ne correspondront pas à valeurs utilisées par ISO-8859-1 pour des caractères affichables.
3. Pour être exacte, la conversion doit traiter les valeurs numériques directement, et doit «rejeter» un certain nombre de caractères UTF-8 inexistants en ISO-8859-1 (en les supprimant ou les remplaçant par un caractère donné, tel qu'un point d'interrogation par exemple).

(En passant: passer d'UTF-8 à ISO-8859-1, faut vraiment aimer prendre l'évolution de l'informatique à rebours. Arf.)

Sujet clos