5546 sujets

Sémantique web et HTML

Pages :
Bonjour,

J'ai lu ce brillant article: http://www.alsacreations.com/article/lire/628-balises-meta.html
J'aimerais des retours quant aux évolutions depuis (l'article a déjà 3 ans)

-les meta keywords, utiles, pas utiles?
-les dublin core qui les utilisent, pourquoi?
-les meta robots, no follow, etc, j'ai pas compris l'intérêt même si j'ai saisi la définition

Un peu de lumière me ferait du bien. Smiley cligne
Modifié par jmlapam (08 Dec 2011 - 01:22)
Salut,
jmlapam a écrit :
-les meta robots, no follow, etc, j'ai pas compris l'intérêt même si j'ai saisi la définition

Demander aux robots de ne pas indexer la page (noindex) ou de ne pas suivre les liens présents sur celle-ci (nofollow).
C'est par exemple utilisé sur WordPress si tu demande aux moteurs de ne pas indexer ton site — parce qu'il manque encore du contenu, ou autres raisons — dans les réglages de «Vie privée» (bizarre comme terme, au passage).
@Patidou: merci du lien je le bookmarke mais quel intérêt pour les dublin core, je capte pas?
@audrajsb: merci de ces explications, je comprends mieux donc en gros si je suis en train de construire un site je mets un nofollow c'est cela?
Et pour les keywords, c'est un peu selon où tu vas.

La majorité vont te dire "ça ne sert plus à rien depuis des années" et d'autres estiment que ça a un intérêt (infime) pour les moteurs de recherche.

Moi je suis partagé, je n'en met jamais, mais quand je vois un site comme YouTube en mettre, j'ai tendance à me dire qu'il doit y avoir un intérêt quelque part ?

noindex/nofollow, pour bloquer les moteurs comme expliqué au dessus, ça sert quand même assez souvent normalement (et rel="canonical" tout autant).
Ouaip. Et c'est quand même assez utile, sauf si on utilise les valeurs par défaut (cf l'article que tu cites dans ton premier post).
[edit : je parle de la méta robots]

Pour DC, tu peux consulter l'article Wikipédia sur cette norme, qui est assez complet. En clair, c'est une tentative de standardisation des méta-données qui n'est pas réservée aux pages web.
En théorie, c'est pas mal (voir aussi le lien de Patidou). Dans la pratique, ce n'est quasiment utilisé que sur des sites web documentaires pour la plupart universitaires et scientifiques : corpus numérisés, catalogues types TEL, revues scientifiques et autres serveurs de prépublication type arXiv.
Modifié par audrasjb (06 Dec 2011 - 12:38)
merci Kenor et Audrajsb, je vais lire un peu, le souci c'est l'abondance de documentations qui se contredisent totalement. Smiley mur
Modifié par jmlapam (06 Dec 2011 - 12:47)
Salut,
audrasjb a écrit :
C'est par exemple utilisé sur WordPress si tu demande aux moteurs de ne pas indexer ton site — parce qu'il manque encore du contenu, ou autres raisons — dans les réglages de «Vie privée» (bizarre comme terme, au passage).

Dotclear propose également un paramétrage similaire.

En plus des instructions index / noindex et follow / nofollow, il y a également :
* archive / noarchive, pour faire archiver ou non la page Web (en vue, par exemple, d'alimenter le cache des moteurs de recherche) ;
* noodp, pour ne pas utiliser la description du site Web telle que fournie par Dmoz ;
* noydir, pour ne pas utiliser la description du site Web telle que fournie par l'annuaire de Yahoo! ;
* all : revient à écrire index, follow, archive (valeurs par défaut) ;
* none : revient à écrire noindex, nofollow, noarchive.

Bref, la méta robots permet de gérer plus finement le référencement d'une page Web que le fichier robots.txt.
@patidou: je comprends mieux maintenant en revanche je me pose la question de leur importance côté référencement.

@Victor: all sert à rien en fait puisque valeurs par défaut.
Pourquoi ne pas utiliser la description? C'est dans quel cas?
jmlapam a écrit :
@Victor: all sert à rien en fait puisque valeurs par défaut.

C'est ce que j'ai donnée à entendre, non ? Smiley cligne
jmlapam a écrit :
Pourquoi ne pas utiliser la description? C'est dans quel cas?

La méta description est utile, dans le sens où son contenu est repris par les moteurs de recherche dans leurs résultats, juste après l'indication du contenu de l'élément title, s'il est jugé pertinent. Cela dit, certains moteurs de recherche peuvent utiliser la description fournie par un annuaire, ce qui est le cas de Google et de Yahoo!, qui, respectivement, reprennent celle fournie par Dmoz et l'annuaire Yahoo!, d'où les instructions noodp et noydir si l'on estiment que Dmoz et l'annuaire Yahoo! ne fournissent pas une description pertinente.
jmlapam a écrit :

@audrajsb: merci de ces explications, je comprends mieux donc en gros si je suis en train de construire un site je mets un nofollow c'est cela?


Si tu construis ton site tu le fais en local ou sur un serveur privée non accessible (protégé par un mot de passe par exemple). En revanche tu peux préparer ton nom de domaine final en mettant une page temporaire avec un peu de contenu en rapport avec ton site et en la faisant indexer par les moteurs. L'idée étant de donner un peu d'ancienneté à ton nom de domaine et lui permettre d'être indexé le jour même ou tu mettra ton site en ligne.

Un petit récapitulatif de quelques meta utiles :

- robots : peut recevoir les paramètres noindex (demande aux robots de ne pas indexer la page), nofollow (demande aux robots de ne pas suivre les liens présents dans la page). Tu peux utiliser ça sur la page de connexion à ton interface d'administration par exemple. Ou sur une page que tu ne souhaites pas faire indexer (pages d'erreurs, pages contenant du contenu dupliqué depuis un autre site, etc). Pour archive / noarchive, il faudrait faire des tests mais il me semble que les moteurs n'y prêtent pas attention.

- description : une courte description textuelle du contenu de la page (ou du site). Les moteurs l'utilisent dans les résultats de recherche, quand ils affichent ton site, le texte de description est celui de cette meta.

- keyword : plus utilisé par les moteurs de recherche depuis des années mais elle peut parfois servir. Par exemple sur mon site vitrine, elle est utilisé par le moteur de recherche interne de mon CMS. Je pourrais choisir de ne pas l'afficher dans le code source mais pour moi c'est pratique car cela me permet de facilement repérer les erreurs de recherche depuis le front-end. Certains CMS utilisent la même technique. Elle peut être aussi utilisé par certains services comme des annuaires ou des régies publicitaires, mais uniquement si ta page ne contient pas de contenu textuel pertinent (Adsense l'utilise parfois).

- charset : obligatoire, permet de définir le jeu de caractères. Elle doit être placée avant tout texte, c'est à dire, avant la balise <title> (risque d'erreur sous certains navigateurs si elle est placée après).

jmlapam a écrit :

Meta meta quoi?


Meta cagoule. Smiley lol
Modifié par jb_gfx (06 Dec 2011 - 18:49)
jmlapam a écrit :
-les meta keywords, utiles, pas utiles?

Toujours aussi inutile.
EDIT: voir aussi la réponse de jb_gfx. Pour être plus précis: c'est inutile pour les moteurs de recherche généralistes, mais si tu as connaissance d'un usage bien précis et documenté, et si les outils que tu utilises font appel à cette information, bah tu peux les utiliser.

Analogie à deux francs:
Est-ce que tout un chacun devrait sortir dans la rue et jeter des balles en l'air? -> Euh, non, pas vraiment.
Je suis jongleur et je veux faire un spectacle de rue en lançant des balles en l'air pour gagner un peu d'argent. -> OK vas-y.

jmlapam a écrit :
-les dublin core qui les utilisent, pourquoi?

Je ne connais pas le sujet en détail mais à ma connaissance ça n'a pas montré une utilité particulière. Si tu n'es pas dans une démarche du type «j'utilise tel type de métadonnée parce que tel outil utilise ces métadonnées de telle manière et ça m'intéresse», laisse tomber.
Par ailleurs il me semble plus intéressant aujourd'hui de regarder du côté des microformats et de microdata, et des usages par les principaux moteurs de recherche généralistes ou certains moteurs spécialisés.

jmlapam a écrit :
-les meta robots, no follow, etc, j'ai pas compris l'intérêt même si j'ai saisi la définition

Bah si tu veux pas que tes pages soient indexées, tu peux utiliser <meta name="robots" content="noindex"> par exemple. Et si tu veux que tes pages soient indexées, tu mets rien.
Modifié par fvsch (06 Dec 2011 - 19:12)
jmlapam a écrit :
le souci c'est l'abondance de documentations qui se contredisent totalement. Smiley mur

C'est effectivement un souci. Les contradictions s'expliquent ainsi:

1. C'est pas une science exacte. Certains écrivent avec autorité (genre moi), en se documentant avec des sources plus anciennes (genre moi aussi), sans forcément se poser de questions sur la justesse de l'information trouvée dans ces sources (genre pas moi, mais je juge un peu au doigt mouillé parfois).

2. Certains estiment que tant que l'inutilité absolue d'une métadonnée n'est pas prouvée, elle est utile et on peut écrire que c'est utile. Pour ma part j'estime que tant que des usages concrets de la métadonnée par des User Agents contemporains ne sont pas recensés et démontrés, la métadonnée est inutile. En gros il y a une forte tendance «I want to believe» comme chez les fans d'ufologie.

3. Certains ont intérêt à entretenir la confusion. En particulier, de nombreux prestataires en référencement (pardon, en SEO) vont vendre des prestations de rédaction de liste de mots clés optimisées pour chaque page. Donc ils ne vont pas dire ouvertement qu'il y a 99,9% de chances pour que les META keywords soient ignorés par tous les moteurs de recherche. Smiley lol

kenor a écrit :
mais quand je vois un site comme YouTube en mettre

... je me dis que même chez YouTube/Google on fait des trucs bête des fois.
Modifié par fvsch (06 Dec 2011 - 19:07)
Jb_gfx a très bien résumé les aspects purement techniques Smiley smile
Florent a écrit :
[a propos des D.C.] Je ne connais pas le sujet en détail mais à ma connaissance ça n'a pas montré une utilité particulière. Si tu n'es pas dans une démarche du type «j'utilise tel type de métadonnée parce que tel outil utilise ces métadonnées de telle manière et ça m'intéresse», laisse tomber.

Tout à fait : ce n'est généralement utilisé que pour des cas assez particuliers, mentionnés plus haut. Ceci-dit, tout dépend du site en question. Si vous êtes amenés à travailler pour des sites de laboratoires ou d'universités recensant des publications scientifiques, c'est intéressant, voire indispensable. Dans le cas de ton site personnel, jmlapam, tu peux laisser ces méta-données de côté pour l'instant.
Florent a écrit :
Par ailleurs il me semble plus intéressant aujourd'hui de regarder du côté des microformats et de microdata, et des usages par les principaux moteurs de recherche généralistes ou certains moteurs spécialisés.

Clairement. Même si leur bénéfice en terme de référencement n'est encore pas complètement établi sur le terrain (mais ça commence…), il est important de garder un œil là-dessus, voire même de commencer à expérimenter puisque ça ne coûte pas grand chose (en performances, etc.), au moins pour des projets perso.
fvsch a écrit :
Pour ma part j'estime que tant que des usages concrets de la métadonnée par des User Agents contemporains ne sont pas recensés et démontrés, la métadonnée est inutile. En gros il y a une forte tendance «I want to believe» comme chez les fans d'ufologie.
[…]
Certains ont intérêt à entretenir la confusion. En particulier, de nombreux prestataires en référencement (pardon, en SEO) vont vendre des prestations de rédaction de liste de mots clés optimisées pour chaque page. Donc ils ne vont pas dire ouvertement qu'il y a 99,9% de chances pour que les META keywords soient ignorés par tous les moteurs de recherche. Smiley lol

Clairement. Il y a un paquet de gens qui font leur beurre sur les croyances et les fantasmes, et ce n'est pas propre au web… Citons par exemple certains «pros du SEO» qui ont un discours typique du genre : «Professeur Machintruc, diplômé de Bidule, vous assure un référencement dans les 8 jours, sur 15 mots-clés que nous définirons ensemble, satisfait ou remboursé». Ça rappelle pas mal les petits billets des gourous dans les boîtes aux lettres, et ça surfe sur le même modèle Smiley smile
fvsch a écrit :
... je me dis que même chez YouTube/Google on fait des trucs bête des fois.

Bon j'arrête de citer constamment Florent et je me permets un simple petit +1.
Modifié par audrasjb (06 Dec 2011 - 20:46)
Administrateur
audrasjb a écrit :
Pour DC, tu peux consulter l'article Wikipédia sur cette norme, qui est assez complet. En clair, c'est une tentative de standardisation des méta-données qui n'est pas réservée aux pages web.
En théorie, c'est pas mal (voir aussi le lien de Patidou). Dans la pratique, ce n'est quasiment utilisé que sur des sites web documentaires pour la plupart universitaires et scientifiques : corpus numérisés, catalogues types TEL, revues scientifiques et autres serveurs de prépublication type arXiv.

Et plus généralement toute structure tellement énorme qu'elle a du mal à gérer la masse de document qu'elle produit. Administration, musée, multinationale, etc
Du moment que l'information (enfin les méta-information) existent dans leur immense base de données, autant les joindre à la page web produite.
Ça peut être un industriel du médicament qui est légalement forcé de versionner, sourcer, etc à l'extrême l'information qu'il publie (pour les autorisations de mise sur le marché mais là on rejoint le scientifique ou pour les notices en 140 langues avec 0 erreur(s) acceptée(s)) et c'est autant pour un intranet que pour le net.
Bonsoir,

Grand merci à tous.
Dans l'ordre d'apparition:

-@Victor: "s'il est jugé pertinent." c'est cette notion qui me paraît floue pour l'instant, il y a bien des critères pour une meta description pertinente non ?

-@jb_gfx: oui c'est un peu idiot ce que j'ai dit, effectivement en plus en général je wampe...
Merci je capte mieux l'intérêt du nofollow, c'est vrai que c'est logique, on a pas envie que les visiteurs tombent sur une page d'erreur la première en premier. Merci du point technique. Smiley biggrin . J'aime bien <meta>, les combinaisons pour un jeu de mot sont quasi infinies.

- @fvsch: les francs sérieusement? C'est une vieille analogie alors...
Oui, pour les microformats et microdata je me documente en ce moment dessus.
fvsch a écrit :
I want to believe
Comment faire quand la vérité est ailleurs?

- @audrajsb: nan c'est pas pour mon site perso, il ne me sert qu'à faire ma promotion perso et surtout à tester tout ce que j'apprends tout comme mon portfolio d'ailleurs. Je vais devoir créer 4 sites bientôt et là c'est pas du portfolio. Smiley lol
J'aime pas wikipedia, même si je leur souhaite de s'en sortir. Je l'utilise que pour faire des liens depuis mon blog pour les bio d'acteurs, etc... Je trouve que l'information y est globalement très peu Smiley censored

Il me semble qu'il y a des Dublin Core sur Alsacreations, non? Moi rien que le nom cela me fait fuir : "DC".
Hello.
Ma modeste contribution :
audrasjb a écrit :
Clairement. Même si leur bénéfice en terme de référencement n'est encore pas complètement établi sur le terrain (mais ça commence…), il est important de garder un œil là-dessus, voire même de commencer à expérimenter puisque ça ne coûte pas grand chose (en performances, etc.), au moins pour des projets perso.
Je ne suis pas sûr non plus qu'il y a une réelle valeur ajoutée en terme de positionnement. Par contre en terme de visibilité dans les SERP, via les rich snippets, ça peux faire la différence.
jmlapam a écrit :
@Victor: "s'il est jugé pertinent." c'est cette notion qui me paraît floue pour l'instant, il y a bien des critères pour une meta description pertinente non ?

Par exemple, la présence, dans la description, d'un ou de plusieurs des mots composant la requête.
Victor BRITO a écrit :

Par exemple, la présence, dans la description, d'un ou de plusieurs des mots composant la requête.

De quelle requête ? Smiley help
Pages :