Pages :
Bonjour.
Je découvre le CSS et l'XHTML.
Que deviennent les caractères   é ĉ ... etc. ?
Peut-on désormais écrire : "J'ai été" ou faut-il toujours écrire "J'ai été" ?
Sous NotePad++, quand j'utilise Tidy, il me rétablit les caractères accentués en les écrivant tels quels, mais il refuse par exemple l'apostrophe en le remplaçant par ' et   par   ; je comprends bien évidemment la nouvelle notation, mais pourquoi semble-t-elle obligatoire ?
[Mille excuses si je me suis trompé de forum : c'est mon premier message ! Smiley rolleyes ]
Hermann a écrit :
Pour répondre le plus brièvement, il faut écrire J'ai ét&eacute.

Pour répondre un peu moins brièvement, on peut très bien écrire « j'ai été » dans le code, du moment que :
1 – on configure son éditeur pour enregistrer avec un encodage des caractères précis (en général ISO-8859-1 ou UTF-8) ;
2 – on indique dans la page web l'encodage utilisé dans le document.

Cf le salon « encodage et internationalisation ».
IL n'est pas nécessaire d'écrire les caractères spéciaux au moyen des entités tant que ceux-ci existent dans l'encodage utilisé.
Ainsi, é n'est nécessaire QUE si tu codes en us-ascii. Ainsi, dans les encodages courants (iso-8859-1(5), utf8), le caractére é existe, il n'est donc pas nécessaire d'avoir recours à é, surtout que cela diminue la lisibilité du code.
Pour des raisons de commodité, on garde quand même certaiens entitéts même si elles ne seraient pas nécessaire : par exemple  , l'espace insécable n'étant pas disponible facilement sur le clavier (il faut déjà taper la combinaison de touches Alt+0160 pour l'obtenir).
Par contre, pour les caractères n'existant pas dans l'encodage considéré, les entités sont OBLIGATOIRES. Par exemple, le signe euro en iso-8859-1, trop ancien pour comporter ce caractère dans son jeu.
Bjr,
Ok merci pour l'info mais alors je me demande pourquoi Dreamweaver met un avertissement chaque fois qu'il trouve un caractère accentué ou autre dans le code.
Merci beaucoup pour ces informations et la rapidité de vos réponses à tous ! Smiley smile
QuentinC a écrit :
Pour les caractères n'existant pas dans l'encodage considéré, les entités sont OBLIGATOIRES. Par exemple, le signe euro en iso-8859-1, trop ancien pour comporter ce caractère dans son jeu.

Donc, si j'ai bien compris, avec l'encodage 'iso-8859-15', on peut taper le symbole de l'euro tel quel ( ) ? Smiley confus
Modifié par Piteur (01 Jun 2006 - 13:57)
Hermann a écrit :
Pourquoi Dreamweaver met un avertissement chaque fois qu'il trouve un caractère accentué ou autre dans le code.

A ce que j'ai compris à travers mes lectures récentes, Dreamweaver n'est plus une référence en matière de codage... Je l'ai pas mal utilisé, mais je me prends au jeu du CSS et, en effet, DW ne me paraît pas plus maniable que le bon NotPad++ en la matière (plutôt moins d'ailleurs, même s'il rend de fiers services pour la gestion des liens Smiley confused )

A quand un logiciel qui, simple éditeur de texte, mémorise des enchaînements d'actions comme sait si bien le faire DW (quel gain de temps !) ? Smiley biggrin
Piteur a écrit :
Merci beaucoup pour ces informations et la rapidité de vos réponses à tous ! Smiley smile

Donc, si j'ai bien compris, avec l'encodage 'iso-8859-15', on peut taper le symbole de l'euro tel quel ( ) ? Smiley confus


Non, c'est l'inverse. Quand l'encodage a été crée, le signe € n'existait pas/peu...

//EDIT : Oulah dans les vapes moi!
excuse moi j'avais lu 1 au lieu de 15
Modifié par Ent De Kryte (02 Jun 2006 - 17:14)
Ent De Kryte a écrit :
Non, c'est l'inverse. Quand l'encodage a été crée, le signe € n'existait pas/peu...

Aïe aïe aïe ; je suis un peu perdu : l'encodage iso-8859-15 n'est-il pas celui qui a ajouté le caractère € à l'encodage iso-8859-1 ? Smiley murf
Piteur a écrit :
Aïe aïe aïe ; je suis un peu perdu : l'encodage iso-8859-15 n'est-il pas celui qui a ajouté le caractère € à l'encodage iso-8859-1 ? Smiley murf

Il me semble que si. Il rajoute le signe € (qui nécessitait auparavant une entité du type €) et le signe œ (œ), qui n'étaient pas dans iso-8859-1, le premier pour des raisons logiques (il n'existait pas à l'époque), et le deuxième à cause d'une histoire assez étrange…

http://fr.wikipedia.org/wiki/ISO_8859-15

Pour ma part, j'ai résolu le problème : full UTF-8 systématiquement.
mpop a écrit :
ISO_8859-15

Deux confirmations :
1/ http://openweb.eu.org/articles/jeux_caracteres/ : y est bien intégré
2/ le livre de Raphaël Goetter (Eyrolles Ed.) préconise l'entête de page : <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-15" />
Alors question (que je ne m'étais pas posée jusqu'ici !!! Smiley confused ) : pourquoi plutôt l'UTF-8 ?
>>> Et dans ce cas, faut-il écrire : <meta http-equiv="Content-type" content="text/html; charset=UTF-8" /> ? Smiley murf

Cela dit, ce n'est pas tout ! Smiley lol 2d problème :
Dans NotePad++, j'ai une option "encodage", qui me propose entre autres :
- ANSI
- UTF-8.
Donc, je ne vois pas d'encodage du type iso-8859-15 ! Est-ce une sous-catégorie d'ANSI ? (j'ai regardé dans PSPad, il n'y a pas de mention d'iso-8859-15 non plus !)

Sur Wikipedia, j'ai trouvé l'information suivante :
a écrit :
L'ANSI, acronyme de American National Standards Institute est un organisme privé de normalisation américain sans but lucratif. Il est le représentant des États-Unis à l'ISO (Organisation internationale de normalisation), tout comme l'AFNOR représente la France.

On doit à l'ANSI, l'ASCII, le SCSI, l'ATA et, la normalisation du langage C.

Les caractères ASCII sont souvent appelés ANSI quand ils contiennent des couleurs ou des attributs graphiques, tel le gras ou le soulignage. Ainsi l'organisme est souvent confondu avec cette norme de caractères.

Donc, si je comprends bien, « ISO kif kif ANSI » ?

Pardon pour ces questions peut-être béotiennes, mais mieux vaut partir sur un bon pied quand on se lance dans le grand bain, non ? Smiley ohwell
Modifié par Piteur (02 Jun 2006 - 12:16)
Administrateur
Piteur a écrit :
2/ le livre de Raphaël Goetter (Eyrolles Ed.) préconise l'entête de page : <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-15" />
Alors question (que je ne m'étais pas posée jusqu'ici !!! Smiley confused ) : pourquoi plutôt l'UTF-8 ?

Ah bon, je préconise ça moi ? Smiley smile
En fait, rien ne s'oppose vraiment à l'emploi de l'utf-8 qui n'a que des avantages.
Il faut cependant que le logiciel d'édition HTML et le serveur soient bien en phase, sinon cela provoque des caractères spéciaux à la place de tous les accents.
Raphael a écrit :
Ah bon, je préconise ça moi ?

Voir les exemples p.43 ou p.224 ! Smiley biggrin
Je n'aurais pas dû le dire ? Smiley lol

(euh, pendant que j'éditais mon message précédent, Raphaël y a répondu ! Smiley eek Merci de ne pas y oublier les autres questions ! Smiley ravi )
Modifié par Piteur (01 Jun 2006 - 19:47)
Raphael a écrit :
Il faut cependant que le logiciel d'édition HTML et le serveur soient bien en phase, sinon cela provoque des caractères spéciaux à la place de tous les accents.
Voilà qui ne semble pas véritablement un avantage... Non ? Smiley confus
Piteur a écrit :
Voilà qui ne semble pas véritablement un avantage... Non ? Smiley confus

Pour le serveur web, il suffit qu'il ne déclare pas par défaut un jeu de caractères à travers les en-têtes HTTP, et de mettre cette déclaration dans la page (balise meta). Ou alors, on configure le serveur pour avoir de l'UTF-8 déclaré par défaut (mais dans ce cas, pas de mélanges possibles : tout doit être en UTF-8).

Quels sont les avantages de l'UTF-8 ? Un nombre énorme de caractères disponibles, ce qui permet d'avoir un document avec plusieurs langues/alphabets différents.

En latin1 (iso-8859-1) ou latin9 (iso-8859-15), on a en gros 190 caractères disponibles, car les caractères sont encodés sur un octet. Exemples : la tabulation est le caractère 09 et la lettre A (majuscule) est le caractère 40.
Regarde le deuxième tableau sur la page wikipédia :
http://fr.wikipedia.org/wiki/ISO_8859-15

En UTF-8, le caractère peut être encodé sur un octet (c'est le cas pour toutes les lettres de l'anglais, en majuscules et minuscules… c'est à dire, en gros, le jeu de caractères ASCII), ou sur deux octets (les lettres accentuées du français, par exemple), voire sur trois ou quatre octets (chinois, certains caractères japonais, etc.).

Pour ma part, j'utilise souvent l'UTF-8 car il y a des caractères de typographie française qui n'existent pas en latin1 et latin9, comme les tirets cadratins et demi-cadratins, par exemple. Et puis j'aime bien l'idée de pouvoir citer de l'arabe ou du japonais sans être obligé de créer une page spécifique pour ça, tout en arabe ou tout en japonais.

Note : je ne sais pas comment c'est sous windows ou OS X, mais mon système d'exploitation est en UTF-8…
a écrit :

Ok merci pour l'info mais alors je me demande pourquoi Dreamweaver met un avertissement chaque fois qu'il trouve un caractère accentué ou autre dans le
code.

Parce qu'il est con ... et vieux ... c'est tout.

a écrit :

Donc, si j'ai bien compris, avec l'encodage 'iso-8859-15', on peut taper le symbole de l'euro tel quel ( € ) ?

Attention cependant sous windows : il le code de manière erronnée.
En fait, windows ne supporte ni l'iso-8859-1, ni le -15, mais utilise à la place un encodage spécifique nommé windows1252. IL reprend 224 des 256 caractères de l'iso, mais les caractères 0x80 (128) à 0x99 (159) diffèrent, et il se trouve que le signe euro est dans cet intervalle. Voir openweb à ce sujet un article nommé "caractères illégaux en XHTML" ou quelque chose s'en rapprochant.

Quant à l'utf8, j'aimerais bien voir une fois pour toute une liste des avantages qu'il possède par rapport aux iso, expliqués de manière claire et concise. Pour l'instant, je ne suis pas du tout convaincu de son utilité lorsqu'on utilise uniquement les langues européennes.
Modifié par QuentinC (01 Jun 2006 - 21:57)
mpop a écrit :
Pour ma part, j'utilise souvent l'UTF-8 car il y a des caractères de typographie française qui n'existent pas en latin1 et latin9, comme les tirets cadratins et demi-cadratins, par exemple.
OK, ça, c'est vrai : il faut passer par "&#150;" et par "&#151;" en iso-8859-15 pour obtenir les tirets demi-cadratin et cadratin. Smiley ohwell
Modifié par Piteur (02 Jun 2006 - 12:52)
a écrit :

OK, ça, c'est vrai : il faut passer par "&#150;" et par "&#151;" en iso-8859-15 pour obtenir les tirets demi-cadratin et cadratin.

Quelle erreur ! Tu ferais référence aux caractères qui sont justement illégaux. IL vaut mieux utiliser l'entité nommée, &ldash; si je me souviens bien.
QuentinC a écrit :
IL vaut mieux utiliser l'entité nommée, &ldash; si je me souviens bien.

&ndash; <!-- tiret demi-cadratin (incises, énumérations) -->
&mdash; <!-- tiret cadratin (dialogues) -->


Sinon, pour le problème avec Windows, il me semble que ça ne concerne que le système lui-même, et en particulier les noms des fichiers. Mais comme sur le web on évite les noms de fichiers avec caractères spéciaux, ça ne pose pas trop de problèmes.

On peut avoir des problèmes (document enregistré en windows1252) lorsqu'on utilise le bloc-notes ou notepad, par exemple. Il suffit d'utiliser un éditeur de texte correct, de le configurer pour l'encodage souhaité (latin1, latin9 ou utf-8, par exemple), et plus de problème.
Si jamais, le notepad est capable d'enregistrer en utf8.

Mais j'ai jamais compris à quoi servaient ces différentes tailles de tirets ...
Pour moi, que ce soit :
- – —
ça change rien... si quelqu'un peut m'expliquer à quoi ils servent ?

C'est comme le symbole numéro 164 : ¤
il sert à quoi ?
Pages :