5139 sujets

Le Bar du forum

Pages :
Bonjour

Vu cet article sur abondance, Ca m'étonne, qu'en penser ?

a écrit :
Les moteurs de recherche prennent-ils en compte les feuilles de style ? (février 2005)


Réponse :

A l'heure actuelle, il semblerait que les moteurs de recherche, dans leur immense majorité (Google compris) ne prennent pas en compte les feuilles de style (CSS). Ceci est important car, dans les algorithmes de pertinence des moteurs, le fait, par exemple, qu'un mot soit en gras (balises B ou STRONG) donne plus de poids pour ce terme à la page qui le contient. Si le "gras" est indiqué dans la feuille de style (qu'elle soit interne ou externe à la page HTML), cette notion sera perdue pour le moteur qui prendra le mot sans mise en exergue. N'oubliez pas d'en tenir compte lors de la création de votre site !


Question 81
Modifié par Felipe (07 Nov 2005 - 21:31)
Bonjour,
Ce serait vraiment curieux si les moteurs utilisaient les fds.
Par contre pour strong et em, j'imagine que là oui, les moteurs en tiennent compte.
Administrateur
Bonjour,

il me semblait que les moteurs ne se laissaient pas abuser par les display: none; ou le texte écrit de la même couleur que le fond? Smiley confuse
S'ils lisent pas le(s) CSS, j'ai quelques "applications" de référencement qui me viennent à l'esprit Smiley haha (EDIT: ça serait plus Web 0.3 que Web 2.0 par contre Smiley biggrin )
Modifié par Felipe (07 Nov 2005 - 21:36)
Administrateur
Les moteurs de recherche s'intéressent au contenu (texte, images) à la structure ("sémantique" des balises), et non à leur mise en forme (CSS) qui ne leur apporte aucune information... surtout si elle se trouve dans un fichier séparé de ce contenu.

Si google "lit" un document, il devrait se limiter à la page HTML. Je ne pense pas qu'il fasse le lien avec les fichiers externes (javascript, CSS, etc).

Vous imaginez vraiment qu'il va s'amuser à repérer les <div id="toto"> du HTML et vérifier dans la feuille CSS si #toto est associé à une déclaration "display none" ?
Si la mise en forme se trouve directement dans la page HTML, je veux bien le concevoir, mais dans une feuille séparée, ça va lui faire un boulot monstrueux.

Cela me semblerait quand-même étonnant.

PS : en y réfléchissant bien, il pourrait même être néfaste que Google prenne en compte défavorablement et systématiquement les CSS comme "display none" ou "visibility hidden" : en effet, beaucoup de fonctions comme les menus déroulants sont basés sur ce principe et seraient alors discrédités.
Modifié par Raphael (07 Nov 2005 - 23:41)
Modérateur
Salut,

Que faut-il en déduire? Que ceux qui se sont fait blacklistés pour cause de texte blanc sur fond blanc l'avaient fait en html? Que ce n'est qu'une rumeur?

En tout cas, les effets peuvent être néfastes dans un cas comme dans l'autre... Smiley sweatdrop
Effectivement les moteurs ne prennent pas en compte les feuille de style et il demeure facile de masquer du contenu. Google affirme travailler sur la question, mais rien n'est fait actuellement.
je confirme...
Google ne s'intérésse qu'à la sémantique.
"Dans le temps" avant la séparation contenu/mise en forme, Google déduisait (et déduit toujours) des balises de mise en forme la sémantique. Plus le temps passe moins ça sera la cas Smiley smile
Modifié par Roger (08 Nov 2005 - 16:00)
sebastien billard a écrit :
Effectivement les moteurs ne prennent pas en compte les feuille de style et il demeure facile de masquer du contenu. Google affirme travailler sur la question, mais rien n'est fait actuellement.

Pour ce cas précis ils ont actionné le spamreport et blacklistage (par des humains). Smiley cligne
Roger a écrit :
je confirme...
Google ne s'intérésse qu'à la sémantique.
"Dans le temps" avant la séparation contenu/mise en forme, Google déduisait (et déduit toujours) des balises de mise en forme la sémantique. Plus le temps passe moins ça sera le cas Smiley smile


Comment peux-tu être sûr de ça ?
Administrateur
QuentinC a écrit :
Comment peux-tu être sûr de ça ?
De façon générale, je trouve également que de nombreuses affirmations et infirmations sont faites autour de Google alors qu'on ne connaît rien de son processus de fonctionnement.
Bref, à moins qu'il n'y ait eu des expérimentations poussées, je pense qu'on parle un peu dans le vide.
Allez je mets mon grain de sel.

Personnellement je suis convaincu de la possibilité qu'à Google d'exploiter les styles CSS. Il le fait essentiellement pour détecter la triche tel que Felipe l'a expliqué, et même sur des cas plus complexe probablement.
C'est très récent, cela faisait partie des objectifs affichés de la mise à jour d'algorithme Jagger2 (je ne fais que suivre les infos distillées par matt cutts).

La mise à jour Jagger3 est maintenant stabilisé sur le DC 66.102.9.104. J'ai suivi attentivement ce DC sur des requêtes concurrentielles pour lesquelles de nombreux acteurs cherchaient un bon positionnement quitte à proposer des contenus cachés.
Sauf erreur de ma part, les contenus cachés fondés sur des styles ont disparus. Sont restés les cas de styles positionnés par javascript (c'est d'ailleurs édifiant de naviguer sans javascript) ou des redirections.
Xavier a écrit :

Sauf erreur de ma part, les contenus cachés fondés sur des styles ont disparus.

Ceux que je connais sont toujours là, ce qui permet donc de dire que ce n'est pas automatique/systématique.
Bonjour,

Je serais fort étonné qu'un acteur du Net qui souhaiterait éliminer les arnaques, et on peut supposer que Google pourrait se trouver dans ce cas, n'aille pas fouiller les feuilles de style comme il détecte les "font-size="-1"", et de plus c'est facile à faire !!!
Administrateur
jcm a écrit :
Bonjour,

Je serais fort étonné qu'un acteur du Net qui souhaiterait éliminer les arnaques, et on peut supposer que Google pourrait se trouver dans ce cas, n'aille pas fouiller les feuilles de style comme il détecte les "font-size="-1"", et de plus c'est facile à faire !!!

Hmm, lorsque le "font-size" est directement imbriqué dans le HTML, c'est facile en effet.
Mais sur une feuille séparée, cela demande un double travail :
- systématiquement vérifier à la fois le document de contenu (ce qui est important dans les recherches) et le document de mise en forme (en théorie pratiquement inutile pour google puisque n'apportant pas de contenu)
- systématiquement avoir un système qui fait la relation entre chaque élément HTML, classe et id et les sélecteurs CSS associés de la feuille CSS.

L'ensemble représente un travail considérable et multiplie le temps alloué à chaque page web.
La question est : jusqu'à quel point cela reste important (économiquement) pour Google ?
Administrateur
Un tel système existe, ça s'appelle un moteur de rendu Smiley lol comme Gecko pour Mozilla/FF/Galeon, c'est sous licence GPL mais effectivement le temps que cela prendrait pour euuhh "plus de 8 milliards de pages explorées" est assez Smiley biggol !
Mais je crois que leur moteur syntaxique est déjà assez compliqué comme ça en rapprochant les mots proches dans une phrase et des milliers de liens+texte Smiley lol
a écrit :
Mais sur une feuille séparée, cela demande un double travail
Oui je crois que vous avez raison. Je viens de regarder mes fichiers log, et jamais le googlebot ne demande de fichier.css. (j'ai observé une page spécifique, ayant une css spécifique lors qu passage du bot).
J'en conclu que la disparition observée de certaines pages proposant des contenus cachés est soit liée à d'autres facteurs, soit intègre un processus manuel.
spamreport peut etre ? surveillance humaine de forums ou sont généralement dénoncés ces abus ? ..
eh eh on peut utiliser

position:absolute;
margin-left:-6000px;

ou de texte #FFFFFE sur fond #FFFFFF

Ca m'étonnerait que Google capte quelque chose Smiley lol
Modifié par Noisequik (10 Nov 2005 - 02:10)
Administrateur
Laurent Denis a écrit :
Bonjour,

Google ne tient effectivement pas compte des styles CSS et n'exploite que le flux HTML.

A-t-on des sources de cette affirmation ? Cela permettrait de résoudre une fois pour toute ce genre de sujet.
Pages :