Qu’est-ce qu’un contenu dupliqué ? Le duplicate content est la bête noire du référencement. Cela s’apparente à copier-coller un texte qui ne nous appartient pas ou qui est présent sur une autre page web. D’autres personnes peuvent aussi nous voler notre propre contenu. Un site qui possède un contenu dupliqué est considéré comme de mauvaise qualité et Google n’aime pas les sites de mauvaise qualité. Comment reconnaître alors un contenu dupliqué ? En cas de duplicate content, Google sanctionne-t-il le site ? Comment peut-on éviter le duplicate content ?
Qu’est-ce qu’un contenu dupliqué ?
Un contenu dupliqué désigne le fait d’avoir deux contenus sur deux sites différents qui sont identiques ou similaires. Cela revient donc à copier-coller plusieurs parties d’un site sur son propre site. Dans la plupart des cas sur Google le duplicate content est involontaire et provient d’erreurs techniques et humaines. Un contenu dupliqué peut être détecté sur une page entière, partielle ou un simple extrait de paragraphe. Cependant ce n’est que lorsque le contenu dupliqué dépasse les 5 à 10% du contenu total du site que Google sanctionnera.
Il existe deux types de duplicate content : le duplicate content interne, lorsqu’un contenu est répété plusieurs fois sur le même site mais sur des pages différentes. Et le duplicate content externe lorsqu’un site a le même contenu qu’un autre site, le contenu a pu être volé, réutilisé à outrance… Il est plus difficile à gérer parce qu’on ne maîtrise pas le contenu des autres sites ni ce qui a été copié.
Les conséquences du contenu dupliqué en SEO sont très mauvaises. Il est donc impératif d’éviter le duplicate content parce qu’il peut jouer sur la position du site dans les résultats de recherche et par conséquent annuler tous les effets du référencement naturel. De plus, cela donne une mauvaise image à l’utilisateur. Si les internautes réalisent que le contenu de votre site n’est que du duplicate content, il quittera votre site ou vous fera de la mauvaise publicité.
Quelles sont les sanctions de Google en cas de contenu dupliqué ?
Les sanctions de Google pour le contenu dupliqué diffèrent selon le type de duplicate content. Les pénalités pour le contenu dupliqué peuvent aller d’un simple message d’avertissement sur Google Search Console, qui est un logiciel qui permet de savoir si son site est indexé, jusqu’au déclassement du site. Il existe différents niveaux de duplicate content :
- Deux pages totalement identiques : Google considérera alors que la page ayant le plus fort PageRank est l’URL canonique, c’est-à-dire l’URL référente et désindexera les autres pages
- Deux pages ayant un contenu semblable mais avec des balises Title et Description différentes : une requête qui fait appel au contenu commun donnera comme résultat la page ayant le plus fort PageRank, mais sur le contenu original les deux sites apparaîtront normalement
- Deux pages différentes mais avec des balises Title et Description identiques : le moteur de recherche peut trouver deux pages très similaires alors qu’un utilisateur ne verra pas forcément la différence. Si les balises Title et Description des deux pages sont identiques le contenu d’une des deux pages n’apparaîtra pas dans les résultats.
Également, avec l’apparition de l’algorithme Panda, de nombreux sites qui ont été jugés pauvres en contenu, de mauvaise qualité au contenu dupliqué, ont été déclassés. Cet algorithme agit pour filtrer les bons et mauvais contenus. Etant donné que le duplicate content est jugé comme mauvais, c’est l’ensemble du site, et non seulement le contenu dupliqué, qui sera sanctionné. Le site pourra donc perdre des places dans les SERP.
Le risque du contenu dupliqué sur Google est donc d’annuler tous les efforts que les propriétaires du site ont mis en oeuvre au profit du référencement naturel.
Qu’est-ce que le PageRank ?
C’est un algorithme utilisé par Google qui permet de mesurer la popularité d’un site ou d’une page web. Pour mesurer cela, l’algorithme prend notamment en compte le nombre de liens qui pointent vers la page mesurée. Plus il y en a et plus ils sont de bonne qualité, mieux le site sera noté.
Qu’est-ce qu’une SERP ?
La SERP est la page de résultats qui s’affiche lors d’une recherche sur Google. En SEO, l’objectif est de remonter dans cette page afin d’augmenter la visibilité de notre site web.
Comment éviter le contenu dupliqué en SEO ?
Pour éviter le contenu dupliqué en SEO il faut commencer par :
- Éviter d’utiliser du contenu déjà présent sur internet
- Éviter de dupliquer son propre contenu sur plusieurs sites
- Chercher à rédiger un contenu SEO unique et original.
- Pour le duplicate interne, il est possible de mettre en place une balise canonical qui permet d’indiquer la page de référence d’un groupe de pages ayant le même contenu. Cela permet d’indiquer à Google quelle page indexer.
Pour prévenir le duplicate content des outils existent aussi. L’un des outils les plus importants est Google Search Console, qui permet d’optimiser le référencement de son site. Il teste le duplicate content à travers une analyse précise du contenu du site. Il est possible de savoir ensuite si une partie du contenu est jugée dupliquée ou non. Il existe également Copyscape qui vous dit qui vole votre contenu et si votre contenu ressemble ou non à un autre. De son côté, l’outil Kill Duplicate va analyser les pages de votre site pour détecter si un contenu a été dupliqué.
Nous venons de le voir, le duplicate content en SEO doit être banni, il est donc important de créer des contenus uniques et de surveiller régulièrement son niveau de duplicate content avec les outils cités plus haut.