Bonjour,

Comme il ne s'agit pas vraiment d'un problème technique, je ne sais si j'ai bien fait de poster ici, peut-être que j'aurais du poster au bar... Que l'on me fouette si je me suis trompé. Smiley smile

Alors voilà : j'aurais besoin d'articles de référence pour prouver que l'utilisation d'entités n'est pas nécessaire (sauf €, œ, Œ) avec l'encodage latin1 dans le cas de mise-en-page de newsletters.

Ou alors c'est moi qui me trompe et il y a des problèmes particuliers aux newsletters que je ne connais pas... Smiley rolleyes
Smiley sm <-- Patidou

Le bon salon était « Encodage et internationalisation ». Smiley lol


Sinon, sur la question des encodages et des entités : j'ai eu des profs persuadés qu'il fallait absolument mettre des entités pour les caractères spéciaux des pages web. J'ai vaguement tenté de leur expliquer le concept d'encodage, de jeu de caractères, de déclaration de l'encodage, etc., mais ils ne m'ont pas cru sur parole (tout au plus ai-je semé le doute dans leur esprit).

Pour ce qui est du Web donc, on peut se passer de toutes les entités caractères, si on utilise l'UTF-8. En Latin1, certains caractères du français sont manquants (ceux que tu indiques), mais ils seront présents en latin9 (iso-8859-15). Pour des textes en français, et mis à part quelques caractères typographiques (espace insécable, tiret cadratin et demi-cadratin, points de suspension), on pourra donc utiliser le latin9 directement.

Tout ça est valable pour les sites web.

Pour l'e-mail, c'est une autre paire de manche. Il faut s'assurer :
- que le client mail ou le script utilisé encodent bien le texte dans un encodage précis ;
- que le client mail ou le script utilisé déclare bien l'encodage utilisé dans les en-têtes du mail ;
- que la personne qui reçoit le mail aura un outil capable d'interpréter l'encodage en question.

Pour un mail encodé et déclaré correctement en latin1 ou latin9, on ne devrait pas trop avoir de soucis avec les clients mails habituels. Par contre, il me semble qu'on n'est jamais à l'abri avec les webmail, qui sont eux-même des pages web avec leur propre encodage... pas toujours évident à gérer.

Mais il me semble qu'utiliser du latin1 (iso-8859-1) ou du latin9 (iso-8859-15) devrait être assez sûr. J'ai des doutes par contre sur l'affichage des courriels en UTF-8 sur certains webmails.
Florent V. a écrit :
Smiley sm <-- Patidou

Le bon salon était « Encodage et internationalisation ». Smiley lol


Oh oui continue grand fou. Smiley confused Smiley ravi En fait, j'ai fait exprès de me tromper. Smiley lol

Bon, plus sérieusement...

Florent V. a écrit :
(...)
Tout ça est valable pour les sites web.

Pour l'e-mail, c'est une autre paire de manche. Il faut s'assurer :
- que le client mail ou le script utilisé encodent bien le texte dans un encodage précis ;
- que le client mail ou le script utilisé déclare bien l'encodage utilisé dans les en-têtes du mail ;
- que la personne qui reçoit le mail aura un outil capable d'interpréter l'encodage en question.

Pour un mail encodé et déclaré correctement en latin1 ou latin9, on ne devrait pas trop avoir de soucis avec les clients mails habituels. Par contre, il me semble qu'on n'est jamais à l'abri avec les webmail, qui sont eux-même des pages web avec leur propre encodage... pas toujours évident à gérer.

Mais il me semble qu'utiliser du latin1 (iso-8859-1) ou du latin9 (iso-8859-15) devrait être assez sûr. J'ai des doutes par contre sur l'affichage des courriels en UTF-8 sur certains webmails.


Effectivement, UTF8 déconne dans hotmail (en mode webmail) mais pas dans gmail. Pour ce qui est de mon cas, je n'ai malheureusement aucun pouvoir sur l'encodage des mise-en-page. Nous avons des gabarits html fournis par des graphistes externes (en mode tableaux Smiley bawling ) que nous remplissons avec les annonces des nouveaux articles disponibles sur le site. Ces newsletters sont de plus envoyées avec un programme maison donc je ne peux vraiment pas y toucher. Ça fait déjà un petit temps que je travaille sans entités mais maintenant je suis obligé de les utiliser, alors je voulais les convaincre du contraire...

Mais ça semble mal barré... Smiley decu
Patidou a écrit :
Mais ça semble mal barré... Smiley decu

Peux-tu envoyer un mail via cet outil à un compte mail géré avec un logiciel type Thunderbird ? Avec ce dernier, il est possible d'afficher les en-têtes complets du mail reçu, ce qui permet de savoir si l'encodage est déclaré ou pas.

Si l'encodage est déclaré en iso-8859-1 ou iso-8859-15, ça devrait être jouable de ne pas utiliser d'entités pour les caractères non-ASCII compris dans ces jeux de caractères.

S'il n'est pas déclaré explicitement, il me semble effectivement plus sage d'utiliser les entités.
Moi pour l'envoi des mails au format HTML, j'encode *tous* les caractères non-US-ASCII... Tellement eu de problème avec les jeux de caractère, avec ça même les mails mélangeant chinois et caractères louches s'affichent bien sous hotmail Smiley smile
Florent V. a écrit :

Peux-tu envoyer un mail via cet outil à un compte mail géré avec un logiciel type Thunderbird ? Avec ce dernier, il est possible d'afficher les en-têtes complets du mail reçu, ce qui permet de savoir si l'encodage est déclaré ou pas.

Si l'encodage est déclaré en iso-8859-1 ou iso-8859-15, ça devrait être jouable de ne pas utiliser d'entités pour les caractères non-ASCII compris dans ces jeux de caractères.

S'il n'est pas déclaré explicitement, il me semble effectivement plus sage d'utiliser les entités.


L'encodage est bien spécifié, pas de problème. Smiley cligne
bonjour ,

a écrit :

Florent V. a écrit
Sinon, sur la question des encodages et des entités : j'ai eu des profs persuadés qu'il fallait absolument mettre des entités pour les caractères spéciaux des pages web. J'ai vaguement tenté de leur expliquer le concept d'encodage, de jeu de caractères, de déclaration de l'encodage, etc., mais ils ne m'ont pas cru sur parole (tout au plus ai-je semé le doute dans leur esprit).


je profite de ce post qui tombe a pic concernant certain problèmes (?) d'encodage, et notamment lors de l'utilisation de l'encodage en iso-8859-1 pour les caractères latin , persuadé également de pouvoir l'utiliser ... écrivant avec plein de caractères accentués ....

mais lors de sauvegarde ou de transfert de fichier , je me suis retrouvé avec tous ces caractères ré-écrit dans une langue barbare .... j'ai perdu un temps fou à
les réécrire un par un et cette fois en UTF-8 et des entities appropriées ...

Est-ce du à une mauvaise manip de ma part lors des transferts !?
Modifié par kzone (26 Jan 2007 - 11:08)