5568 sujets

Sémantique web et HTML

Salut à tous !

Je voudrais vous faire part d'un probleme que je rencontre.
Sur une page d'un site que je développe,
http://www.manuserve.com/main.php?goto=book2
le xhtml n'est pas valide
Lien vers le validateur

Il trouve l'erreur suivante
"non SGML character number 146"
Erreur répétée de nombreuses fois.
Apparement il dit que c'est illégal d'utiliser des apostropes, des accents .. bref tout caractere non compris entre a et z.
Je trouve ça super bizarre ! Sur les autre pages j'utilise des caracteres en iso, et j'ai pas du tout cette erreur...

Quelqu'un a t-il une idée ?
Cette erreur revient périodiquement sur le forum, et la cause est souvent la même : saisie dans un traitement de texte, notamment word sous windows, puis copier-coller.

Certains logiciels de traitement de texte ont malheureusement pris la mauvaise habitude de remplacer l'apostrophe normale par une apostrophe dite typographique ou arrondie. Ce n'est donc pas une vraie apostrophe mais un autre caractère qui lui ressemble.
Or il se trouve qu'il fait partie des caractères illégaux listés dans l'article d'openweb mentionné ci-dessus. Ce caractère n'est pas interdit, mais il faut l'encoder correctement dans le document, c'est-à-dire en utilisant une entité HTML &xxxx; dont tu trouveras aussi le nom dans l'article, ou alors passer à l'utf8 qui permet la saisie directe de ce caractère.

En fait, on connaît essentiellement 3 types d'apostrophes.

Premièrement, l'apostrophe normale ou apostrophe droite. C'est celle que tout le monde utilise normalement.

Ensuite, il existe deux apostrophe typographiques ou apostrophes courbées, l'une ouvrante et l'autre fermante. Elles permettent de marquer un passage de texte au même titre que les guillemets.

Et comme je l'ai dit tout à l'heure, certains traitements de texte ont pris la fâcheuse habitude de remplacer l'apostrophe droite par l'apostrophe courbée fermante, simplement parce qu'elle est courbée, et que « ça fait plus joli ».

Pour que tu puisses faire la différence (j'espère que la police utilisée sur le forum le permettra), voici côte à côte ces trois apostrophes, d'abord la droite, l'ouvrante et la fermante, puis la paire de guillemets saxons pour montrer l'analogie entre simple quote et double quote]. Typographiquement elles ont une signification différente mais je n'y connais rien là-dessus.

' ‘ ’ “ ”
D'accord, je vous remercie.
J'avais pourtant essayé avec la fonction recherche mais il me sembait n'avoir rien vu à ce propos.
Il me reste à trouver un moyen en php de contourner ça....
Merci à vous.
En php, str_replace devrait faire l'affaire.
Pour obtenir explicitement le caractère 146, utiliser la combinaison Alt+0146 avec le pavé numérique
QuentinC a écrit :
Ce n'est donc pas une vraie apostrophe mais un autre caractère qui lui ressemble.

À vrai dire, non. Ce que tu appelles une « vraie apostrophe » est surtout l'apostrophe droite popularisée par l'informatique (et les limitations des claviers). Pour citer wikipédia :
a écrit :
L’apostrophe a la forme d'une virgule placée en hauteur. Elle est donc nécessairement courbe ou inclinée (selon les polices de caractères). En raison des lacunes typographiques historiques des claviers de machines à écrire puis de ceux des ordinateurs, elle est cependant maintenant, de manière fautive, très souvent tracée comme une barre verticale droite, signe qui ne devrait être employé qu'en informatique.

Mais bon, ça ne m'empêche pas d'utiliser le signe informatique (barre verticale droite) pour mes apostrophes... d'autant plus que l'usage en est maintenant presque standardisé, tandis que l'apostrophe typographique a un dessin souvent assez mauvais dans les différentes polices que nous utilisons couramment.

QuentinC a écrit :
Typographiquement elles ont une signification différente mais je n'y connais rien là-dessus.

À ma connaissance, on n'utilise pas l'apostrophe typographique (penchée à droite) et l'apostrophe culbutée (penchée à gauche) pour encadrer des citations.

Pour les citations, on utilise en typographie française :
- les guillemets français « et » pour un premier niveau de citation, ou pour marquer toute mise à distance (ironie, nuance) ;
- les guillemets anglais et pour un hypothétique deuxième niveau de citation.

Les usages peuvent varier, mais c'est l'usage recommandé.
Modifié par mpop (24 Oct 2006 - 21:55)
JE n'ai pas parlé de citation mais de passage de texte.
C'était volontairement plus évasif parce que je suis tout à fait d'accord sur le fait qu'on utilise pas les simple quote pour les citations. Je n'en connais vraiment pas du tout l'utilité, mais elles en ont (ou en avaient) forcément une... sinon elles n'existeraient pas. Je ne l'ai personnellement jamais rencontré dans un texte.
Par contre, tu m'apprends quelque chose en ce qui concerne l'apostrophe droite, je ne savais pas que c'était à cause des machines à écrire et de l'informatique qu'elle s'est progressivement décourbée. Merci pour le lien wikipedia.