Aller, on avance on avance :
Après un bon mois de recherche voici ce qu'il en ressort :
L'embarqué, le Chinois et l'unicode sont pas très copains:
- L'embarqué parceque les fonts chinoises en unicode sont hyper lourdes (plusieurs megas (3-7 Mo))
- Les Chinois car ils ont leur propre façon de classifier les symboles donc .. pas d'Unicode.
Il préfère utiliser la norme GB quelque chose (ex GB2312) ou le Big5 (suivant qu'on est a HongKong/Taiwan ou en Chine).
Et là bonheur, on se rend compte que la norme GB2312 embarque le minimum de l'indispensable des caractères chinois ( "seulement"
~9000 symboles ).
Donc c'est super me direz vous ... oui mais ça se corse quand vous savez que vous devez gérer plusieurs types de fonts ( Indiennes, chinoise, japonaise, arabe ...) et l'unicode c'est vachement pratique.
La différence entre l'unicode et les deux normes citées précédemment (GB2312 et Big5), c'est que les symboles sont pas identifiés de la même façon !!!
Attention on ne parle pas du moyen de les coder : UTF8-UTF16-UCS2 .... non, on parle de la correspondance entre un identifiant et le symbole associé.
ensuite y'a pleins de références sur ces sujets à ces différents endroits :
http://en.wikipedia.org/wiki/GB2312
http://fr.wikipedia.org/wiki/Big5
Sachant qu'il n'y a pas de relation mathématique entre les identifiants unicode et GB2312, ceux que ça intéresse seront peut être ravis d'apprendre qu'il existe un pont entre les deux :
http://cpansearch.perl.org/src/GUS/Unicode-UTF8simple-1.06/gb2312.txt
Ce fichier donne en première colonne l'id GB2312 puis l'id unicode et enfin le pinyin correspondant.
Et là c'est la fête
, vous avez un concept de base pour afficher ce que vous voulez :
1) Un transcripteur Unicode qui fonctionnera pour tous ce que vous téléchargerez qui permet de gérer les fonts en fonction de la norme unicode.
2) Un traducteur (GB2312, par exemple) qui vous permet de filtrer les données lorsque c'est nécessaire avant de les fournir au transcripteur.
3) Récupérer toutes les fonts que vous voulez si vous avez le traducteur type de font unicode .. C'est gagné !!
Tout ce blabla n'intéresse pas grand monde ... et c'est normal .. mais bon ça fait de la collecte d'informations et ça peut donner quand même un coup de pouce sait on jamais
Modifié par SuperBebert (09 Feb 2009 - 09:26)