En effet, les moteurs de recherche pénalisent ou suppriment les contenus identiques et ne les présentent pas dans leurs résultats.
Les moteurs de recherche (comme Google par exemple) ont mis en place des filtres anti-duplicate pour gérer ce phénomène. Concrètement, lorsque plusieurs pages sont identiques ou ont un fort taux de similarité, le moteur les repère et expulse les doublons.
Duplication de contenu ?
Actuellement je n’ai pas trouvé le pourcentage de similarité limite pour ne pas être sanctionné. Je pense d’ailleurs que ce taux est différent selon la thématique, les sites…
Le filtre duplicate content ne touche que certaines pages et non pas les sites qui les contiennent et est censé toucher la page qui copie l’originale. Malheureusement pour nous, Google n’est pas encore parfait et peut pénaliser celui qui est plagié !
Pendant le concours racheumeuneu, j’ai testé ce fameux duplicate content sur un blog déjà indexé.
Ma page originale était alors 7eme sur la requête visée et possédait une bonne centaine de liens.
La page dupliquée reçut 10 à15 fois plus de liens.
Quatre jours plus tard, ma page originale est expulsée de l’index de Google !
Après avoir modifié la page dupliquée, fait un lien vers l’originale et ajouté quelques liens, ma page est de retour àla 14eme place et ce, 5 jours plus tard.
Il y a quelques années, Google a communiqué sur ce point et a conseillé de demander aux personnes qui reprennent un contenu de placer un lien vers l’article original. Quid des personnes qui veulent vous voir disparaitre sur une certaine requête ?