5568 sujets

Sémantique web et HTML

Administrateur
Dites donc, ça doit être le sujet d'information qui a été le plus diffusé aujourd'hui... j'ai dû l'apprendre par une 15aine de sources différentes, c'est phénoménal !
Mettez un simple:
a[rel=nofollow]:after {
content: " (no follow) ";
background-color: red !important;
color: #000 !important;
}


... dans votre CSS utilisateur, ou dans la CSS browser de votre navigateur, et promenez-vous sur diverses solutions de blog commerciales, ou même sur des blogs DotClear. Vous verrez que l'application massive a commencé.

Dites, une petite question en passant, comme ça : mettre un "rel="nofollow" sur les liens de vos commentaires, ou de telle ou telle partie de votre site, dites-moi un peu ce que ça vous fait dire, exactement ?
- Où est-ce défini ?
- Par qui est-ce défini ?
- A qui cela servira-t-il ? A vous ? Aux moteurs de recherche ? aux solutions de blog ?
- Quelqu'un a-t-il réfléchi aux dérives potentielles ? A la possibilité désormais offerte de vendre des "vrais" liens et de donner gratuitement par défaut des liens sans valeur d'indexation ?

Tiens, Raphael, un truc pour rentabiliser ce forum :
- les liens en signatures en "nofollow" par défaut
- une petite case à cocher dans son profil pour activer l'option "true-link" des signatures... moyennant cash, bien-sûr.
(Le lien précédent est évidemment un spam visant à m'attirer un max de pagemachin)
Modifié le 21 Jan 2005 - 08:14
Administrateur
Laurent Denis a écrit :

Tiens, Raphael, un truc pour rentabiliser ce forum :
- les liens en signatures en "nofollow" par défaut
- une petite case à cocher dans son profil pour activer l'option "true-link" des signatures... moyennant cash, bien-sûr.
(Le lien précédent est évidemment un spam visant à m'attirer un max de pagemachin)

C'est vrai que ça marcherait peut-être Smiley ravi
Mais bon, pour le principe : bof.

EDIT : quoique Smiley cligne en fait le lien reste tout à fait cliquable si les visiteurs sont curieux et veulent suivre les sites en signature. Il n'y aurait que google qui ne les suivrait pas.
> - Où est-ce défini ?

Pour l'instant pas vraiment correctement. Mais bon, c'est quelque chose qui vient d'être annoncé, on peut tout de même attendre un peu avant de commencer à raler parce qu'il n'y a pas de référence fixe.
Il y a bien d'autres choses "non définies" qu'on utilise. En particulier les méta.
Ton blog a par exemple un <link rel="author" , un <link rel="help", un <meta name="icbm"

> - Par qui est-ce défini ?

Par les moteurs de recherche ? c'est gênant ?
Il y a bien un <meta name="robots" qui est définit de manière aussi floue (pas de spécification vraiment fixe, des variantes suivant les implémentations) et qui est définit de manière globale par les moteurs de recherche.
Tu as adhéré au premier, ça ne me parait pas bloquant (surtout que le role et l'implémentation sont similaires).


> - A qui cela servira-t-il ? A vous ? Aux moteurs de recherche ? aux
> solutions de blog ?

Ca me sert (j'espère) à moi, dans l'avenir. Parce que même si c'est très loin d'être une certitude il est possible que ça freine pas mal le spam des blogs et wiki.
Ca sert aussi aux moteurs de recherche (même si pour le coup j'ai peur que l'influence dans les moteurs soit très négligeable parce qu'il y aura toujours un moyen technique pour abuser des algos de tris)

> - Quelqu'un a-t-il réfléchi aux dérives potentielles ? A la possibilité
> désormais offerte de vendre des "vrais" liens et de donner gratuitement
> par défaut des liens sans valeur d'indexation ?

Les gens ont *déjà* la possibilité de vendre des liens, de dire "toi je te met dans mon annuaire parce que tu me payes (ou me rend un service), sinon je ne t'y met pas". Ca se fait déjà pour des choses tout à fait commerciales (kelkoo est un exemple), ou pour des choses plus classiques (réduction de prix si l'utilisateur met un lien visible vers le service utilisé, échanges de lien donc paiement par le fait de mettre un lien, ...)
Ca offre potentiellement un degré plus fin de gestion mais ça n'offre aucune nouvelle possibilité ou nouveau risque de dérive.


Moi ce qui me gêne en ce moment c'est que la plupart (pas toi par exemple) de ceux que je vois raler contre ce nofollow en disant qu'il est inutile/stupide/dangereux sont des référenceurs ou des gens qui cherchent à faire de la promotion via Web.
Peut être parce qu'ils ont une bonne vue des moteurs de recherche, mais aussi peut être (oui, je sais, je suis parano) parce qu'ils se rendent compte que si ce nofollow est connu il risque d'être utilisé et que les algos de PR risquent de vraiment mesurer la popularité et pas le nombre de liens insérés (et ça c'est gênant pour eux).
Je suis réellement déçu de voir des blogueurs foncer tête baissée et "patcher" leurs commentaires à coup de rel="nofollow" qui ne veulent strictement rien dire. Il me tarde de voir les conséquences, car conséquences il y aura.
Modifié le 21 Jan 2005 - 20:59
@Stephan : lesquelles ? pourquoi ? C'est une belle affirmation tout de même pour quelqu'un qui ne donne aucune explication. D'où vient t-elle ?

Quant au fait de ne rien vouloir dire, il me semble que le terme en lui même est clair, non ? je ne comprend pas bien la remarque en fait.
Ganf a écrit :

@Stephan : lesquelles ? pourquoi ? ... D'où vient t-elle ?

hum... Smiley hum Tu réponds très bien à tes propres questions :
Ganf a écrit :

Je ne suis pas vraiment d'accord. Peu importe si le monopole est justifié ou pas. Le problème c'est ce que ça va impliquer au niveau des dérives (potentielles ou réelles).
Même si le monopole est justifié, le fait est qu'il peut entrainer des problèmes. C'est le monopole (ou ce qu'on en fait) qui est la source des problèmes, pas le fait que ce monopole est juste (ou injuste).

Source : Blog & Blues

Tiens : "rel=nofollow", dollars et dernière couche

Ganf a écrit :

Quant au fait de ne rien vouloir dire, il me semble que le terme en lui même est clair, non ?

Justement non ! Ça dit simplement "nofollow".
Ça ne renseigne en rien sur la ressource. Ne pas suivre, un point c'est tout.

Comme quoi l'article de Tim Berner Lee n'aura servi à rien. Smiley decu
Modifié le 11 Feb 2005 - 12:14
Ganf a écrit :
> - Où est-ce défini ?

Pour l'instant pas vraiment correctement. Mais bon, c'est quelque chose qui vient d'être annoncé, on peut tout de même attendre un peu avant de commencer à raler parce qu'il n'y a pas de référence fixe.


Je ne vois rien dans l'annonce faite par Google et ses partenaires qui indique qu'il s'agit d'un "WD", qu'il a appel à commentaires, qu'il y aura tests, modifications éventuelles, élaboration d'un profil correctement documenté, ne posant pas de problèmes d'incompatibilité avec d'autres profils (XFN par exemple), etc.

Ce que je vois, en revanche, c'est la pratique habituelle de Google : Faites ce qu'on vous dit sans chercher à comprendre: Google s'oocupe du reste

Ganf a écrit :

Il y a bien d'autres choses "non définies" qu'on utilise. En particulier les méta.
Ton blog a par exemple un <link rel="author" , un <link rel="help", un <meta name="icbm"


Les liens "help", etc sont clairement documentés dans HTML4.01, et leur nature est bien précisée ("interpération conventionnelle des valeurs d'attributs suivante", si ma mémoire est bonne).

Le rôle de <meta name="icbm" est également bien défini par GeoUrl.

Ganf a écrit :

> - Par qui est-ce défini ?

Par les moteurs de recherche ? c'est gênant ?


Non, bien sûr. Cela n'a rien de gênant en soi. Ce qui est gênant, c'est la méthode qu'ils ont adopté pour le définir, et le flou de cette définition.

Ganf a écrit :

Il y a bien un <meta name="robots" qui est définit de manière aussi floue (pas de spécification vraiment fixe, des variantes suivant les implémentations) et qui est définit de manière globale par les moteurs de recherche.
Tu as adhéré au premier, ça ne me parait pas bloquant (surtout que le role et l'implémentation sont similaires).


Le "Standard for robots exclusion" ( http://www.robotstxt.org/wc/norobots.html ) a le mérite de préciser clairement sa nature:

a écrit :
This document represents a consensus on 30 June 1994 on the robots mailing list (robots-request@nexor.co.uk)...
It is not an official standard backed by a standards body, or owned by any commercial organisation. It is not enforced by anybody, and there no guarantee that all current and future robots will use it. Consider it a common facility the majority of robot authors offer the WWW community to protect WWW server against unwanted accesses by their robots.


J'aurais aimé lire un disclaimer de ce type de la part de Google.

Ganf a écrit :
Ca me sert (j'espère) à moi, dans l'avenir. Parce que même si c'est très loin d'être une certitude il est possible que ça freine pas mal le spam des blogs et wiki.


C'est en effet très loin d'être une certitude, et je n'ai trouvé aucune argumentation convaincante ni dans un sens ni dans l'autre. Comme toi, j'espère que ça aura au moins cet effet positif.

Ah... Je manque de temps pour répondre à la suite... Désolé.
Modifié le 22 Jan 2005 - 07:50
Ok, je vois mieux ton manque de spec. Je suis d'accord que c'est un problème (surtout pour savoir si les valeurs multiples sont autorisées) mais ça ne me parait pas bloquant.
Pour les détails techniques il suffira que quelqu'un fasse quelques tests et pour un spec précise il ne me semble pas hors de portée qu'on arrive à l'obtenir.
Il faut bien voir qu'on en est juste à la première annonce officielle. Un peu comme si on avait dit "bon, on va implémenter un robots.txt qui ...". Comme toi je préfèrerai que tout soit dit mais il y a plein de choses qui ne sont pas écrite de manière formelle et que j'utilise dans mes pages Web. Les méta courants en font parti.
Et justement, l'exemple que j'ai choisi pour le help est volontaire. Il n'est justement pas définit dans les specs HTML ni ailleurs. Le passage dit juste
a écrit :
This specification does not define a set of legal meta data properties. The meaning of a property and the set of legal values for that property should be defined in a reference lexicon called a profile. For example, a profile designed to help search engines index documents might define properties such as "author", "copyright", "keywords", etc.
a écrit :
This specification does not define a set of legal meta data properties. The meaning of a property and the set of legal values for that property should be defined in a reference lexicon called a profile. For example, a profile designed to help search engines index documents might define properties such as "author", "copyright", "keywords", etc.

Les seuls qui sont définits sont keywords et description, et ils le sont de manière largement aussi floue que ce nofollow (dans une partie de note non normative, avec pour toute description un simple exemple, sans vraiment d'explication sur le traitement)
Bref, tu as raison sur le manque de spec, mais je ne vois pas ça ici comme quelque chose de bloquant au point de jeter l'idée.
En tous cas, la spé HTML 4.01 spécifie bien qu'on peut inventer des types de liens à mettre dans les attributs rel et rev. Ce qui est conseillé par contre est d'utiliser un profil pour ça, ce qui n'est apparement pas le cas...
HoPHP a écrit :

Et dire que notre admin adoré s'y est mis ! Smiley rude Smiley pleure Smiley rale Smiley fulmine Smiley censored

(...)

Pourquoi, pourquoi ??



Pour des prunes: il est spammé à mort.

En revanche, moi pas mis de "nomachin", moi pas spammé.

Dans les deux cas, la présence ou l'absence de "nofollow" ne change rien au spam. Et n'y changera rien à terme. Sauf en empirant les choses, les spammeurs étant incités à étendre le champ de leurs cibles pour mantenir leur profit marginal.

Il est probable qu'on voit se multiplier les spam de trackbacks et autres zones publiques jusquee-là relativement épargnées. On verra de même se multiplier les spam de solutions de publication moins connues, comme DotClear ou plusieurs solutions de wiki. Et on verra surtout se multiplier les petits malins faisant de l'auto-spam, comme http://gnu.open-mirror.com/ (regardez les liens en bas de page).
Modifié le 11 Feb 2005 - 10:34
Administrateur
Laurent Denis a écrit :

Pour des prunes: il est spammé à mort.

Ouaip, c'est le moins qu'on puisse dire.
J'en suis arrivé à interdire les trackback sur le blog. C'est pas la solution la plus élégante (Laurent m'en a proposé une que je n'ai pas encore pris le temps de disséquer), mais elle a eu le mérite de stopper net ce genre d'hostilités.
Mais donc, pourquoi un "nofollow" ? Tu ne réponds pas vraiment à la question, non ?

@+, HoPHP