Le Duplicate Content, kesako ?

pands

Ce n’est un secret pour personne, les moteurs de recherche filtrent tous les résultats avant l’affichage. Ce filtre, qui porte le nom de « Panda » chez Google, va désindexer des pages au contenu identique ou presque identique pour n’en garder qu’une, qui sera le résultat de notre recherche. Google en parle et met en garde les webmasters : plusieurs critères réunis peuvent faire descendre de manière conséquente la visibilité. Un de ces critère n’est autre que le Duplicate Content.

Matt Cutts, responsable de Google Web Spam livre lors d’une vidéo de la chaîne Youtube Google Webmasters que « 25 ou 30% du web est du contenu dupliqué » et donc considéré comme du SPAM par Panda.

Google autorise les pages citant une partie de contenu et citant ses sources, mais le Duplicate Content peut prendre plusieurs formes :

Never say no to Panda !

Le plagiat

D’après le code de la propriété intellectuelle, la reproduction partielle ou complète est considérée comme un délit. Vous pouvez être accusé ou victime de plagiat sur vos pages web, cela n’est pas rare. Il existe des sites comme Copyscape qui détectent les copies de votre site. Google a mis en ligne un formulaire Scraper Report pour dénoncer ce délit, il faut bien sûr l’accompagner de preuves comme des captures d’écrans.

Le DC ne s’applique pas uniquement sur le plagiat de contenu, il peut aussi prendre des formes beaucoup plus discrètes et fourbes.

La duplication interne

Il est possible d’être victime de DC avec soi-même, par exemple si votre site est accessible aux url http://site.com, http://site.com/index.php, http://www.site.com,  etc…

On appelle cela l’URL canonique, vous pouvez résoudre ce problème simplement en appliquant la Redirection 301. Encore faut-il le savoir me direz vous… mais tout bon développeur sera au courant… Il s’agit de quelques lignes en PHP à rajouter sur vos pages qui en sont victimes :

<?php
header("Status:301 Moved Permanently", false 301);
header ("Location: http://www.site.com/categorie/page.php");
exit();
?>

Vous pouvez aussi effectuer la redirection dans le fichier .htaccess de votre site internet si vous y avez accès.

Vérifiez le <head> de vos pages

Même si ces informations ne sont pas visibles par les utilisateurs, le Panda voit tout ! Si deux (ou plus) pages ont la même balise <titre> et autres metas similaires, cela pourra être considéré comme du DC.

Il faut rappeler que chaque pages est unique et doit disposer de son propre titre et de ses propres ajouts…

Pour corriger ce problème, il n’y a pas de secret. Vous devez revoir chaque page une à une, il est possible de détecter les pages à problème avec les outils de Google « Webmaster Tools ».

Veillez à ce que votre curation de contenu s’éloigne du Duplicate Content

Dans la forme, les deux procédés présentent des similitudes. Mais dans le fond, la curation de contenu n’est pas à but néfaste et n’est en rien considéré comme du spam ou du DC. Voici quelques conseils pour que vos pages passent haut la main le filtre de Google.

Attention, la curation n’est absolument pas une sorte de « feinte » pour tromper Google, il s’agit là d’une technique tout à fait approuvée, vous devez simplement veiller à la mettre en oeuvre correctement.

Prouvez votre intention :

La curation peut être fait automatiquement avec des outils tels que Sociallymap. L’outil vous donne l’opportunité de personnaliser vos publications en rajoutant du contenu additionnel comme un hashtag ou une phrase d’introduction. N’hésitez pas à abuser de ces rajouts ! Ce contenu que vous partagez va être lu par un bon nombre d’internaute, et ils ne cliqueront pas sur vos liens s’ils semblent sans intérêts… La curation est un excellent moyen de construire une communauté qualifiée et d’acquérir de la crédibilité sur son secteur d’activité. C’est la une des briques essentielles pour un bon référencement, et cela n’est absolument pas considéré comme du duplicate content, puisque seul les liens vers les articles d’origine sont publiés. Je vous conseille vivement cette technique, surtout si votre fréquence de création de contenu est faible.

Surveillez vos stats !

La première influence du Duplicate Content sur votre site internet est une baisse des vues et du référencement. Il est possible de voir toutes ces informations sur Google Analytics. Vérifier régulièrement ses stats permet de prévenir l’éventuelle sentence du Panda. Il faut savoir que corriger les problèmes de DC ne fait pas revenir vos internautes dans l’immédiat, alors prudence.

A vous de jouer maintenant ;)

Vous aimerez peut-être :

  • pit

    Bonjour, Un article publié sur un site et sur une page facebook et/ou google+ peut il être considéré comme duplicate content ? Merci.

    • Florent_Hernandez

      Bonjour, non cela ne sera pas du duplicate content si vous partagez le lien. Vous pourrez même rajouter un petit descriptif, ou les premières lignes. Cdt,

Lire les articles précédents :
CEO
L’utilisation des réseaux sociaux par les chefs d’entreprise

Que nous soyons dans le cas d’une start-up, d’une PME ou d’un groupe international, l’usage des réseaux sociaux par le...

pinocc
Web, Internet, « @ », médias sociaux et réseaux sociaux… La vérité !

Faute de temps pour écrire un article de fond sur une stratégie marketing (et je m’en excuse !), je vous...

Fermer