5177 sujets

Le Bar du forum

upload/4635-forum.png

Comment est-ce possible? J'ai jeté un coup d'œil rapide mais je n'ai pas vu de code spécial au niveau html, pas de RDFa non plus. Smiley confus
Administrateur
Bonjour,

j'imagine qu'ils comptent le nombre de lignes dans le tableau (moins les entêtes et bas de tableau).
Ou le nombre de tr.row1 + tr.row2
Avec la masse de données qu'a Google sur l'intégralité des sites visibles dans le monde, le reste de l'algo est pas super compliqué. (pour tous les "forums", en partant des PR les plus élevés, trouver les catégories ou le flux RSS des derniers sujets, trouver la colonne qui mène à la 1ère page de chaque sujet - elle existe toujours avant la seconde page! et n'est pas liée depuis le flux RSS - et pas celle avec des nombres qui elle mène à la dernière page, dans la table éliminer les <tr> avec que des <th> ou des colspan élevés et éliminer aussi les derniers <tr> s'ils ressemblent pas aux précédents, compter. Et gérer les pages suivantes qui se rajoutent une fois qu'on atteint un certain nombre et qu'apparaissent des liens vers page 2, 3, ... + suivant)

Faudrait voir si ce sont les mêmes noms de classe qu'avait choisi dew quand il a créé ce forum. Il l'a créé il y a fort longtemps aux glorieux (hum) débuts de phpBB ou presque ... Il est pas très répandu contrairement à phpBB, vanilla, IPB ni avec autant de trafic qu'un MD (doctissimo, HFr, ...) donc soit l'algo de Google prend pas mal de cas particuliers en compte soit il y a une part d'analyse humaine du code des pages? Mais y a peut-être pas besoin après tout.
Administrateur
S'il y a une erreur dans leur calcul pour un site donné, ils sont quasiment certains d'avoir un retour par un utilisateur ou le webmaster, la vie est facile Smiley lol

Et plus généralement pour l'extraction de données:
Quand Google prendra en compte les micro-formats d'ici 2 ans, y aura plein de trucs supplémentaires Smiley smile
Ça leur servira en premier pour les comparateurs de prix et la pub (poooognon) mais aussi à extraire avec moins d'erreur des infos telles que des dates, des classements, des noms, des adresses, ...
Yahoo et Bing les ont pas attendu d'ailleurs.
Google a beaucoup à manger sur le forum alsacréations, ce me semble. Le mot "forum" que l'on trouve un peu partout, les noms des classes ("author", "posts", ...), les lignes de tableaux, etc.

Même s'il ne prend pas encore officiellement en compte les microformats, je serais surpris qu'il n'aille pas regarder à quoi ressemblent les classes et autres id des éléments. Et avec la masse de données qu'ils accumulent, ils ont de quoi s'amuser à faire des statistiques, des corrélations,... et les utiliser.
Bonsoir,

Merci pour toutes ces indications. Smiley jap

Je viens de faire un test sur un forum punbb (celui de dotclear) et là ça fonctionne aussi. Faut dire que punbb a aussi un très bon code html par défaut. Smiley cligne

upload/4635-forum2.png

Sur un autre utilisant les tableaux imbriqués : que dalle, les standards c'est bon mangez-en. Smiley smile
Modifié par Patidou (26 Jul 2009 - 23:59)