Aller au contenu | Aller au menu | Aller à la recherche

Site membre du réseau Izardev et LCNET

Filtrer les spambots

Les serveurs web sont de plus en plus sollicités par des robots indésirables qui parcourent les sites internet qu'ils hébergent. Outre la montée en charge que çela peut représenter pour le serveur, ces robots servent souvent à récupérer des adresses mèl, ou même à voler le contenu du site.

La méthode ici propose de filtrer, grâce au fichier de configuration d'Apache (ou du .htaccess), sur les noms d'agent.

Exemple de configuration Apache

J'ai constaté dans les que statistiques Awstats que les robots suivants dont le nom d'agent contient java et webcapture étaient reconnu par le logiciel comme des robots spammeurs.

La méthode qui en découle est très simple : si le nom d'agent du robot contient java ou spambot, on interdit l'accès au site purement en simplement.

 

Il faut donc ajouter un ligne de type :

 

par nom d'agent de robot.

Mise en garde

Il n'existe pas que des robots malsains... si vous souhaitez par exemple que les moteurs de recherche indexent votre site, évitez d'interdit l'accès à Googlebot ou Yahoo! Slurp !

Partagez cet article !

  • Delicious
  • Stumbleupon
  • Digg
  • Facebook
  • Google
  • Linkedin
  • Yahoo Buzz
  • Twitter
Vous avez apprécié cet article ?

Commentaires S'abonner au flux RSS des commentaires

  1. Impossible réellement, mis à part faire comme ça... mais c'est pas infaillible, le nom d'agent d'un robot se spoof facilement. Il suffit au robot d'utiliser un nom d'agent commun comme celui de firefox.
  2. Bonjour, pour mon site de randonnées j'aimerai filtrer les robots qui récupereraient les adresses email. Comment parametrer le htacces ?
    Merci !
    Mr glue

Ajouter un commentaire

Les commentaires sont tous validés par un modérateur, votre commentaire n'apparaît pas directement sur le site.
Aucun support n'est assuré ici, vous pouvez néanmoins laisser vos remarques et critiques sur l'article, les points de vue pertinents sont toujours les bienvenus.