Reading:[Technique] Cloaking conditionnel par htaccess

[Technique] Cloaking conditionnel par htaccess

Le cloaking… qu’est-ce donc? Il s’agit d’une technique plutôt mal vu des moteurs de rechreche, qui permet de sélectionner les informations à afficher en fonction du visiteur. Si le visiteur est un robot, on lui affiche une page dédiée (avec de jolis mots clés, ou une redirection qui va bien). Le cloaking sert à afficher un faux PR (technique mise au point par : http://www.robots.darkseoteam.com remarque : leur page est ancienne, et la page n’est plus en PR10).

Pourquoi faire du cloaking? De nombreuses raisons sont possible, les plus évidentes sont liées au SEO. Néanmoins, je vous rappelle que cela vous blacklistera des grands moteurs de recherche lorsque cela sera découvert (si votre page est mise en cache, n’importe quel inernaute pourra voir la différence et vous accuser de spam, ou bien vous pourrez recevoir le visite d’un googleman qui effectuera tout seul le blacklistage).

Utilisation du .htaccess :

Pour effectuer un cloaking plus clean que du php, on va utiliser .htaccess. Dans le cas où vous désirez un cloaking plus élaboré est moins visible (seuls quelques parties de votre site changent, je vous conseille le précédent article sur les pages parking, afin que vous adaptiez le contenu à vos envies.

Notre htaccess va recevoir une instruction de redirection vers le site cible.com et testera seulement le nom du robot qui doit contenir ‘google‘ ; ceci afin de prendre en compte les robots feedfetcher, googlebot et google adsense. Pour en savoir plus sur apache-mod-rewrite, je vous conseille mon autre site pour débuter sur l’url rewriting avec apache mod rewrite.

[cc lang="htaccess]##Google Bot
RewriteCond %{HTTP_USER_AGENT} ^Google [NC]
RewriteRule ^(.*)$ /nouvellepage/$1 [L]
 [/cc]

Vérifier le cloaking sur votre page :

Si le cloaking a été effectué en se basant sur des listes d’Ip, il va être difficile de le vérifier si vous n’avez pas l’ip en question. Par contre, dans notre cas, comme il se base uniquement sur le nom envoyé par le robot, il est possible de voir le résultat en envoyant de faux headers à votre site cible. Pour cela, vous pouvez utiliser le service : http://www.smart-it-consulting.com/internet/google/googlebot-spoofer/. Il y en a des mieux, mais je nn’ai pas eu le temps de les retrouver. Si vous en avez, envoyez un commentaire.

Vous trouverez dans les liens ci-dessous plus d’informations pour compléter cet article, et d’autres outils.


Liens associés :

Liste de robots : http://www.botsvsbrowsers.com

Le cloaking expliqué pour les nuls : http://www.actulab.com/cloaking.php

Forum sur le cloaking : http://www.webmasterworld.com/forum24/

Se déguiser en robot : http://www.ericgiguere.com/articles/masquerading-your-browser.html

Une autre appli pour le cloaking : http://www.theblackmelvyn.com/2009/01/applications-cloaking-referer-ip-delivery/