Salut à tous,

j'ai codé tous mon site en utf-8 sans jamais avoir de souci. Par contre, je viens de me rendre compte que tidy (validateur pour firefox) n'apprécie pas du tout le caractères spécial & (pour mes URL avec du GET) et ne couine plus quand je mets &?

Doit on malré tous les coder en & malgré utf-8?

Merki d'avance
Bonjour,

Malgré UTF-8, certains caractères doivent toujours être échappés :

<
>
&
"

On peut ajouter ' et l'espace insécable (mais alors avec des entités numériques, respectivement & #39; et & #160;, de préférence).
Modifié par ThomasLinard (06 Jul 2006 - 10:56)
ThomasLinard a écrit :
Bonjour,

Malgré UTF-8, certains caractères doivent toujours être échappés :

<
>
&
"

On peut ajouter ' et l'espace insécable (mais alors avec des entités numériques, respectivement & #39; et & #160;, de préférence).


Oui mais pourquoi, utf-8 est censé pouvoir encoder n'importe quel caractère ?
< et > pour pas qu'ils soient pris comme balises HTML
& pour ne pas qu'il soit pris comme une entité
" dans la valeur des attributs pour pas chambouler la délimitation normale de ceux-ci.
ThomasLinard a écrit :
Malgré UTF-8, certains caractères doivent toujours être échappés :
<
>
&
"
On peut ajouter ' et l'espace insécable (mais alors avec des entités numériques, respectivement & #39; et & #160;, de préférence).

QuentinC a écrit :
< et > pour pas qu'ils soient pris comme balises HTML
& pour ne pas qu'il soit pris comme une entité
" dans la valeur des attributs pour pas chambouler la délimitation normale de ceux-ci.

Je comprends bien ce qu'avance Quentin. Pour le reste, je me pose quelques questions :
– Faut-il échapper « " » (guillemets droits anglais) en dehors des valeurs d'attributs ? Je n'y vois pas d'obligation technique, et les validateurs ne bronchent pas.
– Faut-il échapper « ' » (que je ne sais plus comment ça s'appelle mais qui techniquement n'est pas l'apostrophe) ? Là encore, je ne suis pas sûr de l'utilité de la chose.
– quid du remplacement de l'espace insécable par une entité ? Pour ma part, il m'arrive d'utiliser des espaces insécables (0x09) directement dans certaines pages, sans que cela cause de problème.

Des éclaircissements là-dessus ?
a écrit :
– Faut-il échapper « " » (guillemets droits anglais) en dehors des valeurs d'attributs ? Je n'y vois pas d'obligation technique, et les validateurs ne bronchent
pas.

Non, ce n'est pas nécessaire.

a écrit :

– Faut-il échapper « ' » (que je ne sais plus comment ça s'appelle mais qui techniquement n'est pas l'apostrophe) ? Là encore, je ne suis pas sûr de l'utilité
de la chose.

Si tu parles de l'apostrophe typographique #146 en windows1252, non, il n'est pas nécessaire de l'échapper en utf8. Par conter, il faut le faire en iso-8859-1(5)

a écrit :

– quid du remplacement de l'espace insécable par une entité ? Pour ma part, il m'arrive d'utiliser des espaces insécables (0x09) directement dans certaines
pages, sans que cela cause de problème.

Non, ce n'est pas obligatoire, autant en iso-8859-1(5) qu'en utf8. On utilise souvent « &nbsp; » car c'est plus simple à entrer que Alt+0160.