Pages :
(reprise du message précédent)

Salut Julien,

Je n'ai pas trop l'impression de me contredire ... au pire, je suis pas assez précis. Dis moi si effectivement tu persistes à croire en mes contre-sens.

>>> "basé en europe"
Mis à part l'arabe donc, ce ne sont que des langues européennes. Je sais qu'historiquement ca a été le cas ... et que peu d'efforts a été fait pour internationaliser les normes. Unicode étant par exemple moins "global" que UTF-8-general.

>>> Norme iso.
Dans le contexte, et avec le lien juste au dessus, il s'agit bien de l'iso-8859-1 pour le web. Je ne parle évidement pas de ISO 14000 sur l'environnement, ni de ISO Lux pour les fenêtres.
Cependant, merci de m'indiquer que je manquais de précisions.

>>> il est faux de dire de tout caractère est codé sur 2 octets
Là, je crois que c'est une erreur de lecture. J'indique explicitement que UTF-8 est codé sur au minimum 2 octets, et qu'il peut y en avoir 2,3,5 voir plus. Je manque de précision, mais là, tu me fais dire ce que je ne dis pas ^^. (cela dit, c'est pas grave, tu apportes encore plus de précision encore une fois)


Ces précisions ayant été apportées, penses que la modification que je propose (à savoir, rajouter une ligne de META sur le site de doc McFly) soit une solution à son problème ?

kéké
PS : j'essayerais de passer Magdales en Japonnais... juste pour voir ^^
http://forum.alsacreations.com/topic-18-59257-1-jeu-web-Magdales-internationalise.html
Julien Royer a écrit :
Hello,

Désolé keke, mais ton message contient un grand nombre de contresens.

ISO n'est pas une norme mais un organisme de normalisation qui produit un ensemble de normes très variées (loin d'être limitées aux encodages).


Ah bon? Je croyais que c'était une extension de fichier moi... Smiley boulet
@keke: Je ne vois pas en quoi cela résout le problème de mcfly Smiley decu
keke, je ne cherche pas à te montrer que tu as tort, mais à te pousser à t'intéresser plus précisément aux questions d'encodage car tu sembles mélanger plusieurs notions et donc potentiellement induire en erreur les lecteurs de ce sujet.
keke a écrit :
>>> "basé en europe"
Mis à part l'arabe donc, ce ne sont que des langues européennes. Je sais qu'historiquement ca a été le cas ... et que peu d'efforts a été fait pour internationaliser les normes.

Il y a aussi ISO 8859-8 pour l'hébreu et ISO 8859-11 pour le thaï. Mais, comme je l'ai dit précédemment, je suis d'accord sur le fait que ces encodages ne suffisent pas pour une utilisation dans un cadre international.
keke a écrit :
Unicode étant par exemple moins "global" que UTF-8-general.

- UTF-8-général n'est pas un encodage mais un "interclassement" (notion liée aux bases de données).
- Comparer Unicode et UTF-8, cela a autant de sens que de comparer une voiture et une roue. Unicode définit un jeu de caractère et UTF-8 un encodage basé sur ce jeu de caractères. UTF-8 permet de coder tous les caractères Unicode.
keke a écrit :
>>> il est faux de dire de tout caractère est codé sur 2 octets
Là, je crois que c'est une erreur de lecture. J'indique explicitement que UTF-8 est codé sur au minimum 2 octets, et qu'il peut y en avoir 2,3,5 voir plus. Je manque de précision, mais là, tu me fais dire ce que je ne dis pas ^^. (cela dit, c'est pas grave, tu apportes encore plus de précision encore une fois)

Non, justement, comme je l'ai dit, UTF-8 permet de coder certains caractères (les "caractères ASCII") sur un seul octet.
Modifié par Julien Royer (16 Dec 2011 - 13:39)
Bon je vous répond !
En faites, c'est pour les fichiers langues d'un CMS de ma création.
Le problème, c'est que dans certaines langues (Russe, japonais, arabe), impossible d'afficher, même si c'est en UTF-8.
De même, certaines langues ne s'affiche pas dans N++ (japonais notamment)
Sur ce site, j'essaye de refaire en php le "Unicode values" mais j'arrive pas à le faire, je sais pas quel code faut prendre !
doc mcfly a écrit :
Le problème, c'est que dans certaines langues (Russe, japonais, arabe), impossible d'afficher, même si c'est en UTF-8.

Tu peux tout à fait encoder des caractères russes, japonais ou arabe en UTF-8, et les afficher en front-end. (Bien sûr il faut que le système d'exploitation client ait des fontes capables d'afficher ces caractères, ce qui est généralement le cas sur les versions récentes de Windows, Mac OS et Linux, mais pas forcément le cas sur un Windows XP français ou américain.) Si tu n'arrives pas à stocker ou restituer ces caractères en UTF-8, alors il y a un bug ou un mauvais paramètre quelque part dans la chaine de traitement des données.

doc mcfly a écrit :
Sur ce site, j'essaye de refaire en php le "Unicode values" mais j'arrive pas à le faire

Il y a une spécification Unicode si tu veux une information exhaustive.
Mais si tu veux juste convertir des caractères en entité HTML avec valeurs numériques Unicode -- ce qui en soit est probablement une bêtise ou un aveu d'échec mais passons -- il y a sans doute des fonctions PHP natives qui font ça, ou à défaut des classes existantes que tu peux réutiliser. Comme on dit dans ces cas là: RTFM et STFW. Smiley cligne
Modifié par fvsch (16 Apr 2012 - 10:29)
OK, merci Smiley cligne !
EDIT : j'ai trouvé une solution barbare pour convertir. Dans un formulaire encodé en iso, j'utilise la fonction htmlentities. J'exploite donc un bug.
Modifié par doc mcfly (16 Apr 2012 - 19:48)
Pages :