5568 sujets

Sémantique web et HTML

Pages :
Bonjour,

Est-il necessaire de coder les caractères à accents, ou le charset suffit-il pour que tous les navigateurs puisse les lire, y compris navigateur braille ou oral.

merci Smiley smile
Tout dépend quel jeu de caractère tu utilises. Si c'est iso aucun problème, pas besoin de coder les accents, si c'est UTF-8 idem mais il faut prendre soin de sauvegarder ton document en UTF-8, c'est au niveau de ton éditeur que ca se fait ici.
Tu peux même mettre "-15" à la place de "-1", tu ajouteras ainsi le signe "euro" €
Modifié le 24 Oct 2004 - 20:10
ElMoustiko, je sais que tu utilises (voire préfères) le iso-8859-15 aux autres charset.

Pourquoi ne pas utiliser le UTF-8 ?
Modifié le 24 Oct 2004 - 21:41
Pour une raison plus stupide qu'autre chose :
Je n'arrive pas à sauver en UTF-8 avec mon éditeur (Ultra Edit). C'est possible mais en faisant une conversion de format, alors un peu la flemme de le faire à chaque fois ;) Si tu sais comment sauver en UTF-8 avec Ultra Edit, je suis à l'ecoute !

Par ailleur, l'iso est tout à fait adapté pour l'europe et plus particulièrement la France ;)
Nan je ne sais pas comment faire ça, simplement parce que code tous mes sites sur MacOsX avec l'éditeur standard vendu avec, qui fait ça très bien.

Bien sûr, pas de coloration de syntaxe, pas de ceci, de cela, mais c'est pas grave du tout :-)
Pour compléter, une ressource pratique: A Simple Character Entity Chart: Browser support table recense le support des entités numériques pour les caractères ISO 8859-1, dans les anciens navigateurs (Opera 7.x, Firefox, Mozilla, Safari n'y figurent donc pas).

Les caractères à problème sont principalement les lettres grecques et les symboles mathématiques, ainsi que les espaces spécifiques du type & ensp;

Les navigateurs à problèmes sont principalement IE3 et NS4.x
Personnellement je fais systématiquement mes sites en UTF-8, pour cela j'utilise la fonctionnalité intégrée à Dreamweaver.

PS : non, je ne suis pas fou, DreamWeaver je ne l'utilise pas en mode WYSIWYG Smiley cligne
Dans la mesure ou un site n'utilise pas de caractères "exotique" (Arabe, Asiatique, hebreux, cyrillic...) il est totalement inutile d'utiliser un encodage UTF-8... les ISO font très bien l'affaire !
Côté évolutivité, j'en suis moins sûr... il faut rappeller que UTF-8 est l'encodage "préféré" des documents XML, et c'est celui attendu par défaut par les parseurs.
Ah bon... note que c'est totalement subjectif ce que tu dit car un document XML correctement formé exige que l'encodage du document soit déclaré ! Libre à toi de préféré l'UTF-8 à l'ISO, mais aucun des deux n'est meilleur qu'un autre

Je dit juste qu'utilisé de L'UTF-8 pour des texte en caractère latin reviens à vouloir utiliser un bazooka pour ecraser une fourmis : ça marche, mais c'est un peu disproportionné !
- a écrit :
ça marche, mais c'est un peu disproportionné !

<blague mod="on">
C'est clair que si on était américain, on ne verrait pas le problème ;-)
</blague>

Sinon, c'est plus "simple" d'utiliser l'UTF-8; car c'est international, donc au lieu de s'amuser à jongler entre les charset windows, iso, ceci cela, l'UTF-8 fait l'affaire. J'ai lu dans un article que "l'UTF-8 aurait du apparaître en premier", ça nous aurait évité bien des ennuis.

Je ne vois pas comment ce post pourrait tourner en troll (ya pas de raison, on est des gens civilisés ;-)), mais de mon petit avis personnel, l'UTF-8 est une meilleure solution. Libre à vous de choisir ce qu'il vous plaît.
Modifié le 25 Oct 2004 - 22:35
"" a écrit :
Sinon, c'est plus "simple" d'utiliser l'UTF-8;

Ce sera plus simple le jour ou l'integralité des éditeur de texte pourront enregistrer à ce format... ce qui est encore loin d'être le cas. Idem pour la lecture !

C'est sur que l'encodage UTF-8 à un grand avantage, c'est qu'il permet d'ecrire toutes les langues du monde avec un seul encodage (y'a vraiment beacoup de site qui sont a la fois en anglais en hebreux et en japonais ?)... pour le reste, c'est vraiment très subjectif !

"" a écrit :
Autre avantage de l'UTF-8 : pas besoin de prologue XML, donc pas de passage de IE en mode Quirks

C'est totalement faux ! On peut se passer de prologue XML dans tout document XHTML quelque soit l'encodage... il suffit de spécifier correctement la balise META Content-Type !
Modifié le 25 Oct 2004 - 14:40
Jep a écrit :
Ah bon... note que c'est totalement subjectif ce que tu dit car un document XML correctement formé exige que l'encodage du document soit déclaré !


Désolé mais en tant que modérateur, tu pourrais au moins vérifier les propos que tu avances afin que ce sujet reste sérieux et ne tourne pas au troll.

http://www.w3.org/TR/xhtml1/#strict a écrit :
An XML declaration is not required in all XML documents; however XHTML document authors are strongly encouraged to use XML declarations in all their documents. Such a declaration is required when the character encoding of the document is other than the default UTF-8 or UTF-16 and no encoding was determined by a higher-level protocol.

Les emphases sont de moi.

Il est clair qu'une déclaration XML n'est donc pas obligatoire dans le cas d'une site XHTML en UTF-8. Elle l'est par contre pour tout autre charset si l'on souhaite respecter la conformité XML.
Disons que c'est un tout petit peu délicat que cela : le prologue xml est effectivement optionnel en XHTML si l'encodage est UTF-8 ou UTF-16 ou quelque-soit l'encodage si celui-ci est spécifié au niveau serveur dans l'en-tête HTTP Content-Type

Mais si l'encodage n'est présent qu'au niveau HTTP et qu'il est absent du document... il est perdu en cas d'enregistrement de celui-ci par exemple. Le W3C recommande donc en fait (en HTML comme en XHTML) de :
- spécifier l'encodage au niveau HTTP
- et de le répéter dans le document, éventuellement avec le prologue XML et systématiquement avec la meta appropriée.

Voir http://blog-and-blues.org/weblog/2004/08/16/275-encodage-caracteres-xhtml pour les détails.
Mon cher Anubis... avant de m'engueuler, j'apprécirai que tu lises correctement ce que j'ai ecrit :

"Jep" a écrit :
C'est totalement faux ! On peut se passer de prologue XML dans tout document XHTML quelque soit l'encodage... il suffit de spécifier correctement la balise META Content-Type !


Donc, on est bien d'accord, la déclaration de l'entète XML n'est pas obligatoire avec les document XHTML

"Jep" a écrit :
un document XML correctement formé exige que l'encodage du document soit déclaré !

La aussi, c'est vrai (on parle de XML, pas de XHTML) !

Mais je te l'accorde, je suis allé un peu vite en besogne sur ce point. La norme XML 1.0 dit clairement que tout les parseur doivent pouvoir lire un document encodé en UTF-8 ou en UTF-16 par defaut (c-à-d si on oublie de déclarer l'encodage... ce qui est toléré dans ce cas uniquement, c'est vrai)

En effet :
"le W3C" a écrit :
In the absence of external character encoding information (such as MIME headers), parsed entities which are stored in an encoding other than UTF-8 or UTF-16 MUST begin with a text declaration containing an encoding declaration


Et pour régler définitivement la question :
> http://www.w3c.org/TR/2004/REC-xml-20040204/
Modifié le 26 Oct 2004 - 09:39
Jep a écrit :
On peut se passer de prologue XML dans tout document XHTML quelque soit l'encodage... il suffit de spécifier correctement la balise META Content-Type !


Non.

Comme j'essayais de l'expliquer ci-dessus, ce n'est pas la balise META qui autorise à se passer de prologue XML. C'est la présence d'un EN-TETE HTTP qui y autorise, quelque-soit l'encodage. Ce que la spécification sous-entend par "when the character encoding of the document is other than the default UTF-8 or UTF-16 and no encoding was determined by a higher-level protocol."

La balise meta répond à une autre problématique, celle de la présence de l'information d'encodage dans le document lorsque celui-ci n'est plus sur le serveur...
Laurent Denis a écrit :
ce n'est pas la balise META qui autorise à se passer de prologue XML. C'est la présence d'un EN-TETE HTTP qui y autorise, quelque-soit l'encodage...


Ok... j'ai compris... ça explique aussi cette remarque de la norme XML :
le w3c a écrit :
In the absence of external character encoding information (such as MIME headers)
Pages :