Pages :
Madrileno a écrit :
En fait avec UTF-8 il faut encoder les accents en html.

Non, absolument pas.

C'est en ASCII qu'il faut écrire les caractères accentués sous la forme d'entités HTML (entités caractères ou entités numériques). De même, en ISO-8859-1 il faudra utiliser des entités HTML pour tous les caractères n'appartenant pas à ce jeu de caractères (voir le tableau pour les caractères qui font partie de ISO-8859-1 et qu'il n'est donc pas nécessaire d'écrire sous la forme d'entités HTML). Enfin, en UTF-8 il n'y a pour ainsi dire aucun caractère absent du jeu de caractères, donc les seuls caractères que l'on aura à écrire sous la forme d'entités HTML sont les suivants: <, >, & et parfois ' et " (dans les valeurs d'attributs).

À retenir: il y a des cas techniques précis où il peut être nécessaire d'écrire des caractères dits «spéciaux» (lettres accentuées, symboles typographiques, alphabets non latins, idéogrammes, etc.) sous la forme d'entités HTML. Mais en général on peut se passer de ce mécanisme, utiliser UTF-8 et utiliser les caractères eux-mêmes.

Pour information, début 2010 Google annonçait que d'après leurs données, UTF-8 était utilisé pour près de la moitié des pages web (et l'ascension est impressionnante):
http://googleblog.blogspot.com/2010/01/unicode-nearing-50-of-web.html

Edit: ah ben en fait Victor avait déjà corrigé. Je laisse mon message pour les rares infos supplémentaires qu'il contient.
Modifié par Florent V. (07 Sep 2010 - 17:48)
Tiens, pendant que j'y pense: xhtml5 ne reconnaît que les entités de base; les autres sont à encoder numériquement si vraiment il faut les utiliser (&#0160; au lieu de &nbsp; par exemple).

AMHA c'est à cause de l'absence de DTD. Smiley smile
Modifié par Patidou (08 Sep 2010 - 10:32)
Pages :