Je suis débutant dans ce qui est de l'url; rewriting et du fichier robots.txt et page d'erreur 404.

J'ai un problème qui a, je crois, un lien entre le fichier robot et la page d'erreur.

Mon problême est que dans mon site web, j'ai un dossier avec 24 autres site web (régionales) administrer par d'autres personnes.

J'ai mon fichier d'erreur qui m'envoit par courriel le lien des adresse brisées mais il m'envoit aussi le lien de ceux des régionales donc, photo et lien brisés me sont envoyé , résultat, je recoit 300 courriel par jour pour des erreurs qui ne sont pas sous ma responsabilité.

Comment règler ce problème?
J'ai mis ce matin un disallow sur le dossier qui contient ces régionales en espérant que ca va arranger les choses....

Autre problême, les anciennes pages de mon site web sont encore vu sous google.

Mon ancien site était en thml et le nouveau, en php.
Les nouveau fichier portent aussi de nouveaux nom.
Est-ce que google finira par oublier ces vieilles page web ou est-ce qu'il y a un moyen de lui faire oublier?

Car, encore là, les vieille page, images, document, etc.. de l'ancien site sont encore trouvé sur google et les personnes qui cherchent ces pages se retrouvent...dans ma boite de courriel Smiley lol

Alors voilà, merci beaucoup!
Administrateur
Bonjour,

je vois plus un problème avec le courrier qu'avec ton site web. Quelle idée de demander à se faire inonder de mail! Smiley lol Pêle-mêle, je proposerais de:
- recevoir ces mails dans un dossier séparé de ton logiciel de courrier électronique (j'espère que c'est le cas!)
- ou mieux 24 sous-dossiers (avec autant de règles en fonction de l'URL qui est dans le corps du message genre http: //region.machin ou http://machin.fr/region)
- de forwarder les mails à tes collègues régionaux (avec 24 règles), cela demandera beaucoup de préparation et de diplomatie avant de le faire (pour éviter 'fais ch.er ce c0n à nous spammer', c'est pas la faute du serveur ou la leur mais la tienne dans ces cas-là Smiley biggol ) mais peut augmenter la qualité générale des sites. Si ça intéresse quelqu'un (j'espère bis).
- de modifier le script d'envoi des mails pour n'envoyer qu'un mail par heure soit 24/jour (pas plus d'1H parce que tu ne serais pas au courant d'un problème sur une page clef)

Sinon, ces vieilles pages n'ont pas un équivalent récent?

Pour le cache de Google, je suis pas spécialiste et ignore si on peut lui demander d'oublier des pages après coup mais vu qu'il n'y a pas d'historique du cache, seulement la dernière version parcourue de la page de disponible (Google garde les vieilles versions sûrement, mais juste pour lui), tu peux lui fournir une page toute neuve qui viendra écraser tout cela ...
Modifié par Felipe (15 May 2006 - 16:11)
Merci Felipe, c'est super gentil de m'avoir répondu.

Je vais vérifier ce que je peux faire avec ton idée, ca m'a l'air compliqué mais je vais regarder ca avec attention.

Et non, je n'ai pas mis ca dans un dossier séparé, les messages me sont bel et bien transmis directement dans ma boite de courrier.

Est-ce que tu parles d'un dossier sur le serveur???
Du genre un log?


Les nouvelles pages ont un équivalent (pour la plupart) sauf qu'elle sont en php mais ne portent pas le même nom.

Et, le plus gros des problêmes est surtout que les erreurs qui me sont envoyées, sont souvent des images qui n'existent plus...je vais essayer de faire une règle pour les images de ces régionales.

Merci encore Smiley biggrin
Quelle idée denvoyer un mail automatique à l'apparition de la page 404.
Mon site n'est pas très gros, et pourtant, en un mois, ma page 404 est appelée en gros 2000 à 3000 fois.

Le meilleur truc est de proposer un bouton "signaler cette erreur au webmaster". Les plus avides internautes cliqueront.
Merci QuentinC,

Mais alors, c'est pas possible de recevoir seulement les erreurs de MON site???

Si ca ne serait que ces erreurs là, ca règlerait le problème.

Le gros du problême est que je recois celles des 24 autres sites qui sont avec le mien.

J'ai essayé de les mettres dans un dossier et d'interdire l'accès au moteur de recherche à ce dossier mais, pour le moment, c'est sans succès, je sais pas si ca prends quelques temps avant de se mettre en marche mais google a encore en tête les anciens liens,images...
Felipe a écrit :
Pour le cache de Google, je suis pas spécialiste et ignore si on peut lui demander d'oublier des pages après coup mais vu qu'il n'y a pas d'historique du cache, seulement la dernière version parcourue de la page de disponible (Google garde les vieilles versions sûrement, mais juste pour lui), tu peux lui fournir une page toute neuve qui viendra écraser tout cela ...


Google continue quelques semaines plus tard de retourner des pages HTML là où j'ai tout passé en .php

Mais comme j'ai conservé les mêmes noms, j'ai une erreur 300 (nom ambigu), et le serveur propose le bon nom, j'espère que les visiteurs comprennent
Smiley cligne

par exemple http://www.frobar.info/moto/34ch.htm

Pour l'autre problème, il me semble que tu devrais avoir un fichier httaccess par répertoire (si votre hébergeur le permet) ou tu peux utiliser le php pour tracer l'origine des erreurs et renvoyer le mail là où il faut...


    $source_erreur = $_SERVER["REQUEST_URI"]; 
    $code_erreur = $_SERVER["REDIRECT_STATUS"]; 
 


Source http://www.apachefrance.com/Articles/7/page4.html
Il faut te baser sur le domaine ou sous-domaine pour envoyer la mail au bon endroit. cf les variables $_SERVER, il y en a sûrement une qui contient cette info