Hello à toutes et à tous.
J’ai publié un article que je soumets (en résumé) ici à votre sagacité.
Son objet ?
L’utilisation des balises dites « sémantiques » et des balises typographiques pour « parler » à la fois avec les moteurs de recherche et les lecteurs internautes.
Je précise quels sont les types de balises HTML et leur raison d’exister :
- Les balises d'indications (ces fameuses balises dites « sémantiques ») : abbr, blockquote, strong etc.
- Les balises de fonctions : a, div, form etc.
- Les balises de structure : Hn, p, ul, table, etc
- Les balises typographiques : b, i, tt
Prenons ce texte
http://pix.nofrag.com/9/6/3/e61b8c69030525564241444be1a4d.png
et son code :
L'intention de l'auteur est de faire mémoriser par le lecteur 5 mots :
« rédacteur Web » « mammifère » « obsédé textuel »
Ce dernier retiendra donc qu'un rédacteur Web est un mammifère obsédé textuel.
Mais ce marquage pose 2 problèmes :
1. Les moteurs de recherche ne saisissent ni l'humour, ni le second degré. Comment lui indiquer les mots qu'il doit retenir ?
D'autant plus que dans la famille des balises d'indication n'existe pas.
2. « Homo textus » utilise la balise pour le passage en italique car c'est une convention que de mettre en italique un terme d'une autre langue.
Or, cette balise est une balise d'indication pour dire au moteur que c'est un mot important. Comment lui dire ne pas le relever ?
L'auteur va jouer au « jeu des 4 familles » et va composer son texte pour que celui-ci soit retenu par le lecteur ET le moteur :
1. Dans la famille balises d'indications, je veux le (em et le strong
2. Dans la famille des balises typographiques, le (b et le i)
Il va définir un style de police normal pour les 2 balises d'indication :
Puis, reprendre son marquage :
L'aspect visuel sera exactement le même, mais le robot retiendra de ce texte :
« rédacteur web » « écrit des textes » « ordinateur »
L'objectif est atteint.
Je parle ensuite de raffinements techniques mais c'est un détail.
Quand j'ai travaillé à préparation de l'article je me suis posé la question du long-terme. Et bien sûr, c'est dans la perspective d'HTML 5 que l'enjeu se situe.
À la lecture de ce paragraphe (sur la page du W3C, « HTML 5 differences from HTML 4 ») :
j'ai été conforté dans l'idée que structurer ces textes pour remplir ce double objectif que d'être bien compris par l'internaute et par les moteurs de recherche était pertinent.
Certains sont dubitatifs.
Et vous ?
PS : l'intégralité de l'article sur trouve à cette adresse, -http://www.hiseo.fr/optimisations/html-un-langage-descriptif/
Modifié par Sventovit (01 Jul 2008 - 14:10)
J’ai publié un article que je soumets (en résumé) ici à votre sagacité.
Son objet ?
L’utilisation des balises dites « sémantiques » et des balises typographiques pour « parler » à la fois avec les moteurs de recherche et les lecteurs internautes.
Je précise quels sont les types de balises HTML et leur raison d’exister :
- Les balises d'indications (ces fameuses balises dites « sémantiques ») : abbr, blockquote, strong etc.
- Les balises de fonctions : a, div, form etc.
- Les balises de structure : Hn, p, ul, table, etc
- Les balises typographiques : b, i, tt
Prenons ce texte
http://pix.nofrag.com/9/6/3/e61b8c69030525564241444be1a4d.png
et son code :
<h1>Le rédacteur Web</h1>
<p><strong>Le rédacteur Web</strong> (<em>Homo textus</em>) est
un <strong>mammifère</strong> omnivore de l'ordre des hominidés,
qui écrit des textes devant son ordinateur en se signalant par
des volutes de fumée qui s'échappent du foyer de sa pipe.<br />
Le rédacteur Web est considéré, à raison, comme un <strong>
obsédé textuel</strong>.</p>
L'intention de l'auteur est de faire mémoriser par le lecteur 5 mots :
« rédacteur Web » « mammifère » « obsédé textuel »
Ce dernier retiendra donc qu'un rédacteur Web est un mammifère obsédé textuel.
Mais ce marquage pose 2 problèmes :
1. Les moteurs de recherche ne saisissent ni l'humour, ni le second degré. Comment lui indiquer les mots qu'il doit retenir ?
D'autant plus que dans la famille des balises d'indication n'existe pas.
2. « Homo textus » utilise la balise pour le passage en italique car c'est une convention que de mettre en italique un terme d'une autre langue.
Or, cette balise est une balise d'indication pour dire au moteur que c'est un mot important. Comment lui dire ne pas le relever ?
L'auteur va jouer au « jeu des 4 familles » et va composer son texte pour que celui-ci soit retenu par le lecteur ET le moteur :
1. Dans la famille balises d'indications, je veux le (em et le strong
2. Dans la famille des balises typographiques, le (b et le i)
Il va définir un style de police normal pour les 2 balises d'indication :
1. strong {font-weight:normal}
2. em {font-style:normal}
Puis, reprendre son marquage :
<h1>Le rédacteur Web</h1>
<p><strong><b>Le rédacteur Web</b></strong> (<i>Homo textus</i>)
est un <b>mammifère</b> omnivore de l'ordre des hominidés,
qui <strong>écrit des textes</strong> devant son <strong>
ordinateur</strong> en se signalant par des volutes de fumée
qui s'échappent du foyer de sa pipe.<br />
Le rédacteur Web est considéré, à raison, comme un <b>
obsédé textuel</b>.</p>
L'aspect visuel sera exactement le même, mais le robot retiendra de ce texte :
« rédacteur web » « écrit des textes » « ordinateur »
L'objectif est atteint.
Je parle ensuite de raffinements techniques mais c'est un détail.
Quand j'ai travaillé à préparation de l'article je me suis posé la question du long-terme. Et bien sûr, c'est dans la perspective d'HTML 5 que l'enjeu se situe.
À la lecture de ce paragraphe (sur la page du W3C, « HTML 5 differences from HTML 4 ») :
a écrit :
The b element now represents a span of text to be stylistically offset from the normal prose without conveying any extra importance, such as key words in a document abstract, product names in a review, or other spans of text whose typical typographic presentation is emboldened.
j'ai été conforté dans l'idée que structurer ces textes pour remplir ce double objectif que d'être bien compris par l'internaute et par les moteurs de recherche était pertinent.
Certains sont dubitatifs.
Et vous ?
PS : l'intégralité de l'article sur trouve à cette adresse, -http://www.hiseo.fr/optimisations/html-un-langage-descriptif/
Modifié par Sventovit (01 Jul 2008 - 14:10)