5568 sujets

Sémantique web et HTML

Bonjour à tous!
Il m'est venu cette question lorsque je regarde le code de mon site et que je vois tout plein de balises meta.
Sont elles toutes réellement utiles?
Par exemple 'revisit after' est aujourd'hui plutôt obsolète puisque google calcul les fréquences de mises à jours du site en question.

Le Dublin Core est-ce réellement intéressant? C'est très souvent du copier coller pour certaines balises meta, et elles sont les mêmes pour toutes les pages!

Sur chaque page créée il n'y a que ces balises meta que je prend le temps de personnaliser :

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" >
<meta name="Content-Language" content="fr">
<meta name="Description" content=".">
<meta name="Keywords" content=",">
<meta name="DC.Title" content="copie exacte du titre de la page">
<meta name="DC.Description" content="idem pour la description.">
<meta name="DC.Keywords" content="rebelotte pour les mots clefs">


Et voici celles qui sont présentes sur chaque page (en plus de celles ci-dessus) et qui ne changent jamais!
<meta name="DC.Content-Type" content="text/html; charset=iso-8859-1"> 
<meta name="DC.Content-Language" content="fr"> 
<meta name="DC.Subject" content="mmorpg 2d"> 
<meta name="DC.Copyright" content=""> 
<meta name="DC.Author" content=""> 
<meta name="DC.Publisher" content=""> 
<meta name="DC.Identifier-Url" content="je met toujours ladresse de la racine du site"> 
<meta name="DC.Reply-To" content="tjrs le mm email"> 
<link rel="shortcut icon" href="http://www.collapse-of-time.net/images/favicon.ico" type="image/x-icon"> 
<link rel="icon" href="http://www.collapse-of-time.net/images/favicon.ico" type="image/x-icon"> 
<meta name="Subject" content="mmorpg 2d"> 
<meta name="Copyright" content=""> 
<meta name="Author" content=""> 
<meta name="Publisher" content=""> 
<meta name="Identifier-Url" content=""> 
<meta name="Reply-To" content=""> 
<meta name="Revisit-After" content="1 day"> 
<meta name="Robots" content="all"> 
<meta name="Rating" content="general"> 
<meta name="Distribution" content="global"> 
<meta name="Geography" content="France"> 
<meta name="Category" content="games"> 
<meta name="google-site-verification" content="e4b5Jo83ZWLJtojjPRhLmZEmNjQV0dI-c8gcEVxbDSw"> 
<meta name="y_key" content="18e2245c31fc336a">


Donc ma question est la suivante :
Parmis les balises qui ne sont que toujours du copier coller, lesquelles pourraient être inutiles? Techniquement elles le sont toutes, mais ca me déprime de voir 40 lignes de meta sur mes pages quand je regarde le code source (ca fait moche Smiley ohwell )

Merci pour vos réactions!
Il faudrait plutôt poser la question: y a-t-il des META utiles?
Dans l'absolu, on peut se passer de toutes les balises META.

<meta name="Content-Language" content="fr">

Normalement pour celle-ci, il faut utiliser http-equiv, pas name. Il s'agit de l'en-tête HTTP Content-Language, donc on utilise une http-equiv.

Pour revisit-after, dans l'article indiqué par Hermann il y a une section dont le titre est «META Revisit ou Revisit-After (inutile, mythe du Web)».

Pour le reste je te laisse lire l'article, qui est très bien. Smiley smile
Modifié par Florent V. (03 Jul 2010 - 21:38)
Hermann a écrit :
Bonjour,
n'oublie pas de jeter un œil aux articles/tuto présents sur Alsa (ou ailleurs)

Il n'est pas précisé dans cet article d'Alsa que préfixer les valeurs de @name par DC ne suffit pas à dire qu'il s'agit bien de Dublin Core. Le préfixe DC doit être associé à un espace de nom. Oui, même si on fait du HTML sans XML ni RDF (ni RDFa).

Par exemple :
<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />
<meta name="DC.Title" content="copie exacte du titre de la page"> 
<meta name="DC.Description" content="idem pour la description.">

Enfin, ça c'est la théorie. En pratique, les valeurs de @name avec DublinCore sont très rarement consultées et, quand elles le sont, la déclaration de l'espace de nom n'est presque jamais prise en compte.

C'est un peu comme le :
<meta http-equiv="Content-Style-Type" content="text/css" />

Mais bon, entre puristes, on se comprend.
pierredureau a écrit :

Il n'est pas précisé dans cet article d'Alsa que préfixer les valeurs de @name par DC ne suffit pas à dire qu'il s'agit bien de Dublin Core. Le préfixe DC doit être associé à un espace de nom. Oui, même si on fait du HTML sans XML ni RDF (ni RDFa).

Mieux vaut dans ce cas t'adresser directement à l'auteur du tuto (Florent V. qui a répondu dans ce topic) Smiley cligne
Re,

Merci pierre pour la précision.

Concrètement, vu que dans l'article j'écris que ça sert à rien, je ne me vais pas m'amuser à y détailler l'utilisation exactement correcte du Dublin Core dans les balises META. Donc je ne pense pas changer l'article sur ce point. Smiley smile
Deus Ex Machina a écrit :

Donc ma question est la suivante :
Parmis les balises qui ne sont que toujours du copier coller, lesquelles pourraient être inutiles?
Merci pour vos réactions!



<link rel="shortcut icon" href="http://www.collapse-of-time.net/images/favicon.ico" type="image/x-icon">  C'est toujours mieux avec un Favicon
 
<meta name="Copyright" content="">  Pas vraiment d'utilité

<meta name="Author" content="">  Pas vraiment d'utilité
 
<meta name="Identifier-Url" content="">  Tu peux t'en servir pour aider Google

<meta name="Robots" content="all">  Tu peux t'en servir pour aider les petits robots Google [smile]

<meta name="Category" content="games">  Pas vraiment d'utilité

<meta name="google-site-verification" content="e4b5Jo83ZWLJtojjPRhLmZEmNjQV0dI-c8gcEVxbDSw">  Google Webmaster ... si tu l'utilises, à conserver



Le reste tu peux zapper c'est clair.

Ps : Balise Keyword ne sert plus à grand chose non plus ... du moins ça ne sert à rien de la bourrer de mots clés Smiley cligne
Modifié par yank (17 Jul 2010 - 01:16)
Bonjour,

J'ai une autre question : dans le contenu qu'on indique dans certaines balises <meta> telles que Content ou Keywords (ainsi que la balise title), est-il utile/nécessaire de traduire les lettres accentuées (é,à,ù...) par leur code html (é etc.) ?
Que pensez-vous également de la pertinence des balises meta name "identifier-url" ou "reply-to" où l'on peut (ré)indiquer l'url et l'e-mail de contact, qui sont généralement présents ailleurs dans le texte du site?

Merci pour votre(vos) réponse(s) et pour cet article utile. Je viens déjà de dégraisser un peu mes en-têtes.
Baila a écrit :
J'ai une autre question : dans le contenu qu'on indique dans certaines balises <meta> telles que Content ou Keywords (ainsi que la balise title), est-il utile/nécessaire de traduire les lettres accentuées (é,à,ù...) par leur code html (é etc.) ?

Non, pas plus que dans tout autre contenu des pages du site.

Baila a écrit :
Que pensez-vous également de la pertinence des balises meta name "identifier-url" ou "reply-to" où l'on peut (ré)indiquer l'url et l'e-mail de contact, qui sont généralement présents ailleurs dans le texte du site?

Je ne savais pas qu'elles existent. (D'ailleurs elles n'existent peut être pas... il y a quantité de META fictives ou obsolètes depuis dix ans ou plus; voir l'article de référence indiqué plus haut.)
Je ne les ai jamais vu exploitées par un outil d'indexation. Si tu trouves une documentation de Google ou Yahoo ou Bing qui dit qu'ils utilisent ces meta et de quelle manière, et si par ailleurs leur utilisation t'intéresse, eh bien tu peux les utiliser. Sinon, aucun intérêt.
Merci pour votre réponse. J'avais lu votre article, bien sûr, mais celles-là n'étaient pas citées.
Voici ce que je viens de glaner à ce sujet :

<meta name="identifier-url" content="http://www.monsiteweb.com">
"ne doit être repris que sur la page d'accueil" et sert "aux robots à reconnaître l'url générale du site"
Alors question : est-ce qu'ils ont besoin de ça + est-ce qu'ils ne peuvent le trouver autrement?

<meta name="reply-to" CONTENT="info@monsiteweb.com">
"Cette balise permet de spécifier l'adresse e-mail principale du site"
Apparemment elle ne sert… qu'aux spammers. Gloups.

Au cas où, voici une page qui détaille une série de balises meta (origine, évolution, (in)utilité voire nocivité):
http://www.webmarketingnow.com/tips/meta-tags-uncovered.html



Pour les codes de caractères en html, je les utilise dans le body "parce que mon prof d'html l'a dit" (mais c'était il y a presque 10 ans), et aussi parce que je testais les premières versions de mon site il y a 5 ou 6 ans entre autres sur un mac avec IE (5?), lequel transformait en purée les lettres accentuées non codées (mais le problème venait peut-être du charset que j'utilisais à l'époque). Cela dit, ici même, votre code est <title>Existe t-il des &lt;meta&gt; inutiles? - Alsacr&eacute;ations</title>. Est-ce une précaution?
Et re-question : ne pas utiliser les codes html pour les lettres accentuées ? Est-ce résolu par le choix du "charset"?

Si vous avez la patience (mais je continue à chercher dans tous les cas)....
Baila a écrit :
<meta name="identifier-url" content="http://www.monsiteweb.com">
"ne doit être repris que sur la page d'accueil" et sert "aux robots à reconnaître l'url générale du site"
Alors question : est-ce qu'ils ont besoin de ça + est-ce qu'ils ne peuvent le trouver autrement?

Tu viens de lire «sert aux robots...» sur une page de site web. Petite question: qu'est-ce qui te prouve que c'est réellement utilisé par les moteurs de recherche? Il ne faut pas croire tout ce qu'on lit, surtout dans ce domaine. En faisant des recherches pour écrire l'article sur les balises META que tu as lues, j'ai croisé un nombre incroyable d'informations contradictoires et d'informations sans sources vérifiables. Donc: méfiance, et ne pas se jeter sur une balise META donnée parce qu'on a lu quelque part (ou même sur cent articles non sourcés...) que c'est utile pour X ou Y. Smiley cligne

En l'occurrence je n'ai jamais croisé identifier-url jusque là. Une recherche ne me donne rien de concluant. Je pense que tu peux l'oublier et dormir tranquille.

Et non, les outils d'indexation des moteurs de recherche (dits «robots d'indexation») n'ont pas besoin de cette information pour trouver la page d'accueil ou la «racine» d'un site, ou identifier que des pages appartiennent à un même site (même si la notion de «site» au niveau d'un moteur de recherche n'est pas si évidente que ça).

Baila a écrit :
Pour les codes de caractères en html, je les utilise dans le body "parce que mon prof d'html l'a dit" (mais c'était il y a presque 10 ans), et aussi parce que je testais les premières versions de mon site il y a 5 ou 6 ans entre autres sur un mac avec IE (5?), lequel transformait en purée les lettres accentuées non codées (mais le problème venait peut-être du charset que j'utilisais à l'époque).

Le prof de HTML d'il y a 10 ans avait déjà tort. En 2000, il y avait peut-être encore sur le marché quelques très vieux navigateurs qui géraient mal les codages de caractères, et UTF-8, publié en 1993, était encore assez récent. Mais le prof aurait pu enseigner l'utilisation de ISO-8859-1, publié en 1985, bien supporté il y a 10 ans, et suffisant pour les documents en plusieurs langues européennes dont le français.
Pour le problème avec IE Mac, c'est sans doute que le codage des caractères n'avait pas été déclaré correctement. Si tu n'avais pas appris à le faire à l'époque, c'est plus que probable. Smiley cligne

Baila a écrit :
Cela dit, ici même, votre code est <title>Existe t-il des <meta> inutiles? - Alsacréations</title>. Est-ce une précaution?

Les < et > sont nécessaires pour afficher < et > sans qu'ils soient interprétés comme délimitant une balise HTML. Le é n'est pas nécessaire et pourrait être un simple é. Je ne sais pas au juste pourquoi il est utilisé, n'ayant pas codé moi-même le système de forum utilisé ici.

Baila a écrit :
Et re-question : ne pas utiliser les codes html pour les lettres accentuées ? Est-ce résolu par le choix du "charset"?

Si le codage de caractères en question comprend les signes que tu veux écrire, tu n'as pas besoin de les «échapper» sous la forme d'une entité caractère.

Par exemple, si je suis en ISO-8859-1, je peux écire "é" ou "À" directement, mais je dois écrire "& euro;" pour le symbole de l'Euro, et "& mdash;" pour un tiret (cadratin).
Par contre, si je suis en UTF-8, je peux écrire "é", "À", "€" et "—" directement.
(Note: j'ai rajouté des espaces dans les entités HTML ci-dessus, apparemment le forum ne transforme pas les & en &amp; ou fait des traitements bizarres des données.)

Je t'invite à lire Notions de base sur les codages de caractères à ce sujet.
Modifié par Florent V. (08 Aug 2010 - 01:51)