8791 sujets

Développement web côté serveur, CMS

Bonjour,


Je fabrique des stats de visites en php...
Je compte bien tous les visiteurs qui arrivent.

Mais, j'ai aussi l'impression
que les passages des robots sur mes pages
sont comptabilisés.

Existe-t-il un truc, une fonction, un code...
pour ne pas les comptabiliser ces visites-là ?

Merci d'avance pour votre aide.
BOnjour,

Tu peux essayer de récuperer leur "user-agent", certain robots s'identifient correctement, mais tu n'auras pas une résultat 100% sûr.
J'ai vu cela !
Y en a "blindé" !
J'ai vu qu'ils étaient trop nombreux !
Modifié par jytest (17 Jul 2012 - 21:12)
Je crois que le mieux à faire est d'étudier les sources d'un outil de statistique open source comme Piwik et de regarder comment ils font.
Des adresses IP, évidemment. Certains ont aussi des user-agents spécifiques.

La plupart lisent le fichier robots.txt. A priori aucun humain ne le fait. Smiley smile

Voilà des pistes à creuser pour toi.
Modifié par jb_gfx (21 Jul 2012 - 21:27)
Je vais exploiter la piste du fichier robot.txt...
Comment peut-on voir si un robot a lu ce fichier ?
Salut,

pourquoi pas via tes log access de apache ? +
un script pour récolter les lignes où robot.txt a été appelé et isolé les adresses IP.

ou encore dans le même style ça trouvé avec une petite recherche

bon après comme toi ce qui t’intéresse c'est ceux qui ne le lisent pas. il te faudra comparer avec ton autre liste.

sinon pourquoi ne pas utiliser un outil tout fait?

bye.
Un outil, non.
Un script sur le serveur, oui !

Je reprécise que seules les visites par des non-robots doivent être prises en compte...
Au post de CPascal (renvoyant à un article du siteduzero),
je constate qu'on revient toujours aux user agent !
Modifié par jytest (24 Jul 2012 - 10:44)