Bonjour,

Je souhaiterai bloquer, à l'aide du robots.txt, les urls de mon site qui se termine par ?format=pdf .
Savez comment dois je procéder pour le Disallow ?
Merci par avance
Modifié par dreadstock (20 Jan 2011 - 16:55)
A ma connaissance le robots.txt ne prends pas l'asterisk, les moteurs ne les prennent pas en compte. (sauf sur le user-agent)

Solution :

envoyer une entête http : X-Robots-Tag: noindex,nofollow,noarchive

ou

passer par de l'url rewriting et faire un disallow sur le "repertoire" pdf.
Modifié par rs459 (20 Jan 2011 - 12:57)
Cette solution est trop technique pour moi, c'est d'ailleurs pour cela que j'ai choisi un cms comme joomla. Mais merci
Une autre solution ?

Pour info : j'ai mis ca Disallow: /*.pdf$ dans mon robots txt pour bloquer les fichiers avec l'extensions pdf. ca a marché.
Je vais essayer pour le cas cité ci-dessus de faire ca : Disallow: /*?format=pdf
?
Modifié par dreadstock (20 Jan 2011 - 16:27)
Youpi,

j'avais pas vu, mais dans webmastertool, on peut tester comment réagit le robot google en fonction de ce que l'on met dans robots.txt.
J'ai fait le test avec Disallow: /*?format=pdf$ il bloque bien mes urls avec ce format, sans gêner les autres types d'url.

merci resolu
Autant pour moi je pensais que seul le googlebot-image prenait l'asterisk.

Par contre je pense (à vérifier, ca change tellement vite) que Yahoo et bing, ne respectent pas cette syntaxe.