5176 sujets

Le Bar du forum

Bonjour comme je pense que ce n'est pas spécifiquement lié au standard je le met là.
Pour mon site perso je voudrais empecher les robots des moteurs de recherche de réferencer mes pages. Je pensais qu'en ne mettant pas de spécification meta pour les robots cela suffisait mais je me retrouve référencé chez google (heureusement pour une seule de mes pages).

Ma question est simple si quelqu'un pouvait me fournir une ligne de code a mettre ou simplement un lien permettant de détourner les robots je lui en serait reconnaissant.
Modifié par gilles6975 (26 May 2005 - 19:10)
Il faut créer un fichier texte simple nommé "robots.txt" que tu places à la racine de ton site. Le fichier contient les instructions permettant de "cacher" tout ou partie de ton site.

Tout est très bien expliqué ici : http://www.webrankinfo.com/outils/robots/faq_15_112.htm

Je te fais un extrait utile :

a écrit :
Pour interdire l'indexation de tout votre site à tous les robots (ceux qui respectent le standard d'exclusion des robots), mettez ceci dans votre fichier robots.txt :
User-agent: *
Disallow: /
Si vous préférez, il est possible d'utiliser des balises META à l'intérieur de vos documents HTML.

Modifié par LunaWeb (13 May 2005 - 16:36)
Administrateur
LunaWeb a écrit :
Tout est très bien expliqué ici : Smiley url http://www.webrankinfo.com/outils/robots/faq_15_112.htm[/url]

Attention à l'écriture des URL.
C'est pourtant très simple Smiley smile

gilles6975 a écrit :
Bonjour comme je pense que ce n'est pas spécifiquement lié au standard
C'est le moins qu'on puisse dire Smiley lol
Modifié par Raphael (13 May 2005 - 16:37)
Je viens de regarder le lien, c'est exactement ce qu'il me fallait. Je vais utliser le fichier robots.txt mais aussi les balises meta car comme je le disais seule une de mes pages est referencée ce qui me laisse a penser que le robot est arrivé la par hasard !

Pour ce que ca interresse le lien plus haut est parfait !
Un petit feed back !

J'ai utilisé la technique de robot.txt en specifiant que je ne voulais pas être referencé. J'ai aussi rajouter (en priorité) le "no index no follow" sur les pages qui avaient deja été prises au piege par google.


Résultat, 10 jours plus tard mon site a completement disparu de google et j'en suis à la fois content et surpris. Les robots quand on leur parle de facon standardisée réagisse finalement très correctement.


Merci pour le lien, je recomande encore une fois.


Edition : cela me fait aussi penser que je dois être chez un hebergeur qui fait tourner les robots. En effet, ce delai de à peine 10 jours est quand même court pour un site qui ne spécifiait aucune balise pour les robots. A moins que part defaut le robot google repasse sur chaque site en moins de 10 jours. Mais là je serais étonné.
Modifié par gilles6975 (26 May 2005 - 19:16)