5568 sujets

Sémantique web et HTML

Je me souviens d'un petit articles (mais je ne plus le lien) à propos des tag <em>, <strong>, <i> et <b> expliquant que <em> et <strong> ne recouvrent pas l'ensemble des cas pour lesquels l'italique ou le gras étaient communément utilisés.

C'est particulièrement vrai pour les <i> puisque <em> correspond (si je ne me trompe pas) à l'empahse et pas, par exemple, à la citation ou à d'autre cas ou la typographie habituelle utilise de l'italique.

La plupart de ces cas sont cependant couverts par d'autres tags, mais il en est un ou deux pour lesquel je ne connais aucun tag:
- Les mots ou expressions d'origine étrangère ou argotique sont souvent mit en italique pour signaler leur origine "autre". un tag permet-il de spécifier la nature de tel mots et espressions?
- Parfois, les expression et dictons populaires sont aussi mit en italique dans un texte. Ce n'est pas plus communs que ca, mais ca me fait me demander si il existe un tag pour ce genre de choses...

Au passage, tant qu'on parle de <i> et <em>, j'utilise habituellement un <em> pour démarquer les titres d'une oeuvre (flim, livre,...) dans un texte, un autre tag (<cite>?) serait il plus approprié?
Administrateur
thierry a écrit :
http://lab.spip.net/spikini/EmVersusI

Oui enfin c'est bien beau de dire que <strong> et <em> n'ont aucun sens pour nous... mais il se trouve que <b> et <i> n'ont aucun sens pour les non-voyants.

Rien n'empêche de forcer <strong> à s'afficher en gras par exemple pour satisfaire tout le monde (strong {font-weight:bold}, ce qui fera :
- un élément gras pour les navigateurs graphiques
- un élément compréhensible pour les non voyants
Bonjour,

(Oups, désolé, fausse manoeuvre pour la réponse précédente).

En typo, l'italique est utilisé pour dél;imiter au sein d'un texte les titres d'oeuvre, les citations, les mots étrangers ou appartenant à un lexique particulier.

Au niveau phonétique, ce signalement ne se traduit pas par une insistance sonore.

La balise <i> est pour moi parfaitement sémantique, et son emploi me semble justifié dans ce cas:

<i>Pierre et Jean</i> de Maupassant
=
<ceci est un titre d'oeuvre>Pierre et Jean</ceci est un titre d'oeuvre> de Maupassant.

Un lien intéressant:

http://lab.spip.net/spikini/EmVersusI
a écrit :
Oui enfin c'est bien beau de dire que <strong> et <em> n'ont aucun sens pour nous... mais il se trouve que <b> et <i> n'ont aucun sens pour les non-voyants.


Bonjour,

Précisément, c'est une question que je (me) pose concernant l'italique. A-t-il ou non un sens pour les non-voyants. Comment peut-il ne pas en avoir alors que son emploi est codifié en typographie depuis des siècles?
ba c'est assez simple je pense :

soit il existe une balise spécifique pour signifier qu'un terme ou une phrase est de l'argot et dans ce cas tu l'utilises Smiley smile

soit tu fabriques toi même le style que tu souhaites appliquer. Exemple :

<span class="argot">Ouèvazycommentkilétropgravemortellecem</span>

et CSS

.argot {
font-style:italic;
}


Je t'aurais bien mis une classe .sms mais Raphaël i veu pô Smiley biggrin
Modifié le 08 Nov 2004 - 15:48
Administrateur
thierry a écrit :
Oui enfin c'est bien beau de dire que <strong> et <em> n'ont aucun sens pour nous... mais il se trouve que <b> et <i> n'ont aucun sens pour les non-voyants.


Bonjour,

Précisément, c'est une question que je (me) pose concernant l'italique. A-t-il ou non un sens pour les non-voyants. Comment peut-il ne pas en avoir alors que son emploi est codifié en typographie depuis des siècles?
"italique" signifie "texte penché".
Comment peux-tu, en tant qu'aveugle, te représenter un "texte penché" ?
Un "texte important", oui. Mais pas un "texte en italique".

Pour aller plus loin : ok son emploi est codifié en typographie depuis des siècles. Mais la typographie c'est quoi ? C'est la manière dont est composé un texte (qualité des caractères, de la mise en page)... est-ce que ce genre de préoccupations de mises en pages ont un réel sens pour des non voyants ?
thierry a écrit :


<i>Pierre et Jean</i> de Maupassant
=
<ceci est un titre d'oeuvre>Pierre et Jean</ceci est un titre d'oeuvre> de Maupassant.



ce raisonnement est plutôt bancal car si on a bien <ceci est un titre d'oeuvre> ==><i>

on n'a pas <i>==><ceci est un titre d'oeuvre>

puisque aussi bien on aurrait <i> --><exemple de language sms formellement interdit sur ce forum re Smiley biggrin >
a écrit :
"italique" signifie "texte penché".
Comment peux-tu, en tant qu'aveugle, te représenter un "texte penché" ?
Un "texte important", oui. Mais pas un "texte en italique".


Oui, mais je ne peux pas concevoir que les aveugles ne sachent pas que <i> = (selon le cas) "texte important", "titre d'oeuvre", "mot de jargon", etc., en dehors de toute référence à l'aspect de l'italique. En toute bonne foi, je n'en sais rien.

D'un autre côté, la balise <em> ne me semble pas convenir, puisqu'il n"y a pas d'insistance phonétique pour les titres d'oeuvres, mots de jargon, etc.

Une classe CSS, alors ?
Administrateur
thierry a écrit :
Une classe CSS, alors ?

Oui, voir le post de clb56 un peu plus haut.
Il me faudrait donc utiliser des <span> plutôt qu'autre chose.

A moins que.

Quel serait la justesse de l'emploi d'une balise <i> avec une classe sémantique expliquant le pourquoi de l'enrichissement typographiqe. Genre <i class="titre"> ou <i class="argot">?

Ici la balise <i> signifie donc 'enrichissement typographique' et la classe en donne la cause. Mais est-ce que ca servira aux aveugles ou autres navigateurs sémantiques?

Quant à l'article de Spiplab, il n'a que peu à voir avec la question qui me préocupe ici. L'article ne considère en effet que l'utilisation "typographique" de l'italique (ou du gras) et ses conventions d'utilisations. La question qui m'interesse revient à l'inverse à se demander quel tag utiliser sans tenir compte des habitude typographique.

Pour moi l'erreur d'Arno* est de considéré la question sous la forme "quel markup utiliser pour rendre compte d'un texte en italique". Pour conclure qu'un markup sémantique ne correspond pas à l'utilisation "graphique" de l'italique. La question est viciée à mon sens, puisque le markup devrait décrire les données du document, le rendu visuel étant géré par le CSS.

J'imagine les heures perdues pour en arriver à cette conclusion: pour obtenir graphiquement de l'italique, le meilleur tag est <i>, un tag qui, de fait, correspond à une volonté d' 'enrichissement typographique' et ne décrit en rien les données.
Modifié le 08 Nov 2004 - 17:07
Administrateur
Personnellement (et c'est uniquement personnel), par manque de balisage approprié, je préfère utiliser une balise générique comme span plutôt qu'une balise dont le rôle n'est pas fait pour ça.

En structurant en <i class="argot">ton texte</i>, tu signifies "mon texte est balisé comme étant italique". Non seulement tu ne dis pas que ton texte est une structure de la forme "argot" (puisque cette balise n'existe pas), mais en plus, tu appliques un balisage qui correspond à autre chose.

Je ne sais pas si je me fait bien comprendre en fait ! Smiley fou
LapinLove404 a écrit :

Quel serait la justesse de l'emploi d'une balise <i> avec une classe sémantique expliquant le pourquoi de l'enrichissement typographiqe. Genre <i class="titre"> ou <i class="argot">?


Non on ne peut pas raisonner ainsi L'enrichissement typographique c'est la classe qui le donne (ou pour le dire mieux c'est une propriété de style appliquée via une classe qui le donne)

ce qui rend compte du pourquoi c'est justement la balise elle même. Pourquoi ? Parce que c'est exactement le rôle et la signification d'une balise. Le fait que le langage html soit pauvre à cet égard n'y change rien.

S'il n'y a pas de balise signifiante alors on prend une balise neutre soit span.

le jeu d'un point de vue sémantique est de se poser la question de la signification du choix que l'on fait et de voir s'il existe une balise pouvant exprimer ce choix (comme jeu de l'esprit je trouve ça plutôt agréable)
On devrait créer plusieurs classes, alors:

- une classe pour les titres d'oeuvre
- une classe pour les mots et expressions étrangères
- une classe pour les mots appartenant à un jargon (argot, termes de domaines spécialisés)
- une classe pour les mots mis en évidence (ou alors <em>)
- etc.

PS. Je ne comprends pas l'argument:

a écrit :
ce raisonnement est plutôt bancal car si on a bien <ceci est un titre d'oeuvre> ==><i>

on n'a pas <i>==><ceci est un titre d'oeuvre>

puisque aussi bien on aurrait <i> --><exemple de language sms formellement interdit sur ce forum>


Les conventions concernant l'emploi de l'italique sont (je crois) pluriséculaires. De telles conventions sont connues de tous, même, je suppose, des non-voyants, et ne doivent donc pas être explicitées (sauf à supposer un lecteur totalement ignare). Donc, selon le contexte, <i> = "titre d'oeuvre", "mot/expression étranger(e)", "mot de jargon", etc. Utiliser <i> pour signifier "exemple de language sms formellement interdit sur ce forum" est un emploi arbitraire d'une signalétique conventionnelle.
Il me semble que vous oubliez une chose: une information sur le sens du texte qui est difficile à gérer au niveau que vous appelez "sémantique"... peut très simplement être incluse explicitement dans le contenu:
"Dans ce qui suit, les termes placés entre guillemets relèvent de l'argot etc."
Remplacez guillemets par le signe qui vous conviendra, de sorte qu'il soit accessible dans tous les cas de figure.

Pour ce qui est de l'exploitation d'une métadonnée "ceci est de l'argot" en HTML... disons que cela dépasse totalement ses capacités.
thierry a écrit :

Les conventions concernant l'emploi de l'italique sont (je crois) pluriséculaires. [...] et ne doivent donc pas être explicitées (sauf à supposer un lecteur totalement ignare).


Personelement, je vois deux problèmes à cette remarque:
- D'abord c'est purement élitiste de considéré que ne pas savoir ce que signifie l'italique c'est être ignare. Personelement, je ne suis pas sur de connaitre m'ensemble des normes pluriséculaires de l'utilisation de l'italique.
- Encore une fois, on part de la forme (l'enrichissement typographique italique) pour penser le contenu (une citation, un titre,...).

Sinon, je crois que des tags:
- pour les titres d'oeuvre
- pour les mots et expressions étrangères
- pour les mots appartenant à un jargon (argot, termes de domaines spécialisés)
[...]
Serait la 'bonne' solution mais visiblement, toutes ces tags n'existent pas. <em> signifie bien une mise en évidence (emphase) mais pour le reste...
<cite> est il un tag valide pour les titre d'oeuvre?

Laurent Denis a écrit :

Il me semble que vous oubliez une chose: une information sur le sens du texte qui est difficile à gérer au niveau que vous appelez "sémantique"... peut très simplement être incluse explicitement dans le contenu:

Oui, bien sur.
Notes quand même que là, on en revient à la mise en forme de ces élèments. Les :after et :before en CSS sufiraient par exemple à placer les guillemets, et afficher un texte en italique n'est pas un problème.
Et puis surtout, je me vois mal fournir au lecteurs de mon blog, par exemple, une liste des règle de syntaxe et mise en page propre à mon blog :-D

Et visiblement oui, l'argot dépasse effectivement les capacités du HTML, je voulais juste m'assurer que c'etait le cas. A la rigeur, ce n'est pas grave, mais jje regrette quand même qu'il n'y ai rien pour signaler les mots de langue étrangère par exemple...
Pas d'élitisme là-dedans. Je souhaite simplement remarquer que les principaux emplois de l'italique sont codifiés depuis très longtemps (liste sans prétention exhaustive):

- titres d'oeuvre
- mots et locutions étranger(e)s
- mots de vocabulaires spécialisés
- citations
- mots sur lequel on veut attirer l'attention du lecteur (termes nouveaux)
- mots exprimés une intonation particulière dans des dialogues (= emphase)

À part cela, l'italique a des usage plus particuliers dans les romans (expression des pensées des personnages, signalement de récits alternés, etc.).

Enfin, bon, les personnes qui lisent couramment ont sans doute observé des milliers de ces usages, et sont donc parfaitement à même d'identifier le statut d'un mot ou d'une expression italisé(e) en fonction de son contexte. Pour cela, il suffit de savoir lire et de lire.

Il n'est pas nécessaire pour cela de savoir dresser une liste de ces usages. Dans la plupart de ceux sus-cités, le sens de l'emploi l'italique est en fait grosso modo le même:
= "attention, ce mot/cette locution ne fait pas partie du vocabulaire courant"
= "attention, ce mot/cette locution est une pièce rapportée"

... Et c'est généralement le contexte (=le texte autour du mot/locution italisé(e)) qui fourni les informations complémentaires. Si ça marche pour l'imprimé, pourquoi cela serait-il insuffisant pour le web?

Le besoin d'identifer les divers usages de l'italique , qui se traduirait alors par autant de classes, ne relève-t-il pas de la classite aiguë, découverte par le Dr Zeldman, et que nous a fait découvrir le Dr Goetter:

a écrit :
La Classite aigüe :
La classite est une admiration exacerbée des Classes CSS, proche de la dévotion. Un rapprochement religieux est à envisager selon certaines thèses.

Symptômes : La classite se manifeste par une utilisation à outrance des propriétés "class" sur chaque balise rencontrée. Ce besoin d'identifier chaque élément par une classe (souvent répétée) témoigne d'un soudain manque de confiance en soi provoqué par une connaissance évasive des sélecteurs CSS et leur héritage parent-enfant.


in Maladies exotiques des CSS ?

Quant aux personnes non-voyantes, si elles ne peuvent pas nécessairement se représenter graphiquement l'italique, ça ne doit pas pour autant les empêcher d'identifier correctement sa fonction.

a écrit :
mais jje regrette quand même qu'il n'y ai rien pour signaler les mots de langue étrangère par exemple...


Les "mots étrangers", me semble-t-il, sont assez efficacement identifés à la lecture (combinaisons de lettres inhabituelles ou inexistantes dans la langue du lecteur, composants du mots inexistants dans la langue du lecteur, etc.

Là encore, comme le bon Monsieur Jourdain pouvait faire de la prose sans savoir qu'il faisait de la prose, il n'est pas nécessaire de conceptualiser pour identifier, et des connaissances en lexicologie, lexicographie et étymologie ne sont habituellement nullement nécessaires pour identifer comme étranger un mot étranger, sans oublier, encore, l'information qui peut être fournie par le contexte.
LapinLove404 a écrit :

- Les mots ou expressions d'origine étrangère ou argotique sont souvent mit en italique pour signaler leur origine "autre". un tag permet-il de spécifier la nature de tel mots et espressions?


Pourquoi pas :

<em lang="de">Apfel saft, bitte !</em>


Ou bien :

<cite lang="es">La noces los gatos son grise !</cite>


Ou encore :

<q lang="it">Piano ! Piano !</q>


http://www.w3.org/TR/html4/struct/dirlang.html#adef-lang

Celà ne couvre pas l'argot, mais pour les expressions de langues étrangères...

Que pensez vous de ceci ?


<i lang="fr-ca">Swing la bacaisse dans l'fond d'la boîte à bois!</i>


a écrit :

HTML 4.01 Specification

8.1.1 Language codes

Two-letter primary codes are reserved for [ISO639] language abbreviations.
Any two-letter subcode is understood to be a [ISO3166] country code.

Modifié le 09 Nov 2004 - 08:19
thierry a écrit :
On devrait créer plusieurs classes, alors:

- une classe pour les titres d'oeuvre
- une classe pour les mots et expressions étrangères
- une classe pour les mots appartenant à un jargon (argot, termes de domaines spécialisés)
- une classe pour les mots mis en évidence (ou alors <em>)
- etc.


oui tout à fait, de la même manière que si tu trouvais une balise <ceci est de l'argot> il te faudrait ensuite trouver la balise <ceci est une expression étrangère> etc...

Je ne sais pas si l'utilisation de l'italic correspond à une convention pluriséculaire fermement établie. Mais même dans ce cas elle n'en resterait pas moins polysémique et nécessiterait donc quelque spécification.

pour le sms Smiley biggrin ce n'est peut être pas une langue étrangère mais son exotisme l'en rapproche (je blague)
Modifié le 09 Nov 2004 - 08:39
Perso, je troube la solution de stephan la plus élégante :-D

Sinon, je dois m'être mal exprimé sur un point: je sais bien que l'italique a un usage "codifié" depuis belles lurettes et que la pluparts des lecteurs reconaitrons sa raison d'être à la lecture. Après tout <em> et <cite> (donc c'est bien ca pour les titres?) s'affichent déjà tous les deux en italique par défaut si je ne me trompe.

Ce que je voulais ce n'est pas un tag qui rend l'italique, c'est juste un tag qui ne m'obligerait pas à utiliser un élèment de mise en forme dans la description de mes données.

Un tantinet plus royaliste que le roi peut-être, mais bon, C'est juste que blanacer des <em> à gauche à droite sans être sur qu'il n'y a pas de meilleur altérnative ca finissait par m'énerver :-D