Le duplicate content – Référencement SEO

Classé dans : Référencement SEO-SEA | 0

Dans le cadre du référencement SEO de votre site, il y a de grande chance que vous soyez amené à rédiger du contenu, cela peut être dans le cadre d’un blog afin de produire du contenu en quantité, ou simplement le contenu descriptif de votre site en page d’accueil, ou encore les caractéristique de vos produits dans le cadre d’une boutique e-commerce.

Comme tout contenu produit et publié sur votre site, il est passé au crible par les robots dans le cadre du crawl pour l’indexation de votre site, lors de cette situation, tout vous est bénéfique, sauf si vous vous retrouvez dans une situation de duplicate content.

duplicate content référencement SEO

Qu’est-ce que le duplicate content ?

Lorsque les robots effectuent le crawl de votre site, tout le contenu analysé est ensuite comparé aux nombreuses autres pages déjà analysées par les robots des moteurs de recherche.

Lorsqu’il compare votre contenu à celui des autres sites, c’est pour s’assurer que vous produisez un contenu unique, autrement s’il y a trop de ressemblance avec un texte déjà présent sur internet, pire encore si vous paraphrasez d’autres contenus, il y aura de grande « chance » que votre contenu soit considéré comme duplicate content, contenu dupliqué en Français.

Pourquoi cette notion de duplicate content ?

Le principal objectif des moteurs de recherche est de permettre à ses utilisateurs d’obtenir le meilleur résultat répondant à sa requête et le plus rapidement possible.

Mais dans la page de résultats, il n’y a aucun intérêt à obtenir plusieurs fois le même résultat, au contraire, cela prend de la place et cause des pertes de temps ce qui va à l’encontre des objectifs des moteurs de recherche.

Ces derniers ont donc imposé la notion de duplicate content dans le référencement SEO, pour s’assurer que chaque résultat arrivant en tête des résultats soit unique, afin de répondre le plus rapidement et efficacement possible aux différentes demandes des utilisateurs.

Quels sont les risques du duplicate content ?

Lorsque les moteurs de recherche observent du duplicate content, la première action sera de significativement réduire le placement de votre page dupliquée dans le classement des résultats.

Autant dire que dans ces conditions, il y aura très peu de chances que votre page obtienne des visites depuis les moteurs de recherche.

Egalement, dans le cas de duplicate content, surtout si cela se répète, vous risqueriez de recevoir une pénalité de la part des moteurs de recherche, la pénalité est plus problématique puisque ce n’est pas uniquement la page incriminée qui en subira les conséquences mais l’ensemble du site.

En effet, lorsqu’un site reçoit une pénalité, la note de pertinence que vous attribuent les moteurs de recherche se retrouve impactée, si votre site est considéré comme moins pertinent, il aura logiquement plus de difficultés à faire progresser sa position dans les résultats de recherche.

Tout en voyant la pertinence impactée, votre budget de crawl sera réduit, et les robots des moteurs de recherche passeront moins régulièrement sur votre site pour indexer les nouveautés et mises à jour de votre site.

Heureusement, dans la search console, les pénalités sont affichées et vous aurez l’occasion de rectifier le tir.

Inscription au fil d'ID newsletter webprospection

Les duplications de contenus accidentels

Etant donné les risques lors de la publication de contenu dupliqué, on se doute que cette action est rarement faite volontairement.

Un détail très important lors de la rédaction de contenu : la page considéré comme contenu original est la première page indexée, et non pas celle créée !

Cela veut dire que si vous rédigez la description de votre fiche produit pour votre site d’e-commerce, puis, quelques jours plus tard, vous ajoutez le même produit avec la même description sur Amazon, puisque Amazon est un plus grand site dont la pertinence n’est plus à prouver aux yeux des moteurs de recherche, il sera plus rapidement crawlé pour l’indexation que votre site.

Vous pourriez donc attendre quelques semaines, tandis que du côté d’Amazon cela ne nécessitera que quelques jours, la page Amazon sera alors considérée comme contenu original, puis lorsque votre boutique e-commerce sera crawlée, il retrouvera le même contenu déjà indexé depuis le site d’Amazon, cela sera alors considéré comme duplicate content.

Il faut donc veiller à ce que votre description soit différente que celle d’Amazon, ou attendre que vos pages soient indexées pour publier la fiche produit sur Amazon.

 

La situation de duplicate content en SEO peut également se déclarer lorsque vous procédez à la sécurisation de votre site internet à l’aide d’un certificat. Dans plusieurs situation des personnes ont donc passé leur site de http à https sans effectuer les redirections nécessaires, toutes les pages étaient donc disponible avec un lien http et avec un lien https, résultat : tout le site est dupliqué, et dans ce cas le référencement se voit très fortement impacté si ce n’est pas corrigé rapidement.

Une erreur similaire, dans votre adresse url si vous n’effectuez pas de redirection de l’adresse sans www vers la version avec www, ou l’inverse, cela sera néfaste pour votre référencement SEO.

La page d’accueil doit posséder une URL unique, pourtant de nombreux site font l’erreur d’avoir la page d’accueil disponible sous plusieurs URL comme par exemple : site-internet.com/, site-internet.com/index.php, site-internet.com/accueil.

Tout en sachant que la page d’accueil est probablement l’une des plus importantes de votre site, cela serait vraiment dommage qu’elle finisse considérée comme duplicate content.

Mieux vaut prévenir du duplicate content que guérir

Puisque l’on peut rapidement se retrouver à passer par la case duplicate content sans le voir venir, il existe plusieurs outils dont le rôle est d’analyser votre texte et le comparera directement avec les textes présents sur internet pour trouver ceux qui ont le plus de similarité en établissant un pourcentage de similarité.

Plus le pourcentage est élevé, plus il est risqué d’exploiter le texte, généralement si une page a plus de 50% de similarité avec un contenu existant, c’est vraiment mauvais signe, il est conseillé d’avoir une similarité maximale de 30%.

Parmi les outils il y a Siteliner, cet outil scan tout votre site et vous permet de visualiser vos pages qui ont le plus de possibilités d’être considérés comme du duplicate content.

Il existe d’autres sites permettant de vérifier un texte avant de le publier, malheureusement, les sites que nous appréciions comme Positeo ne proposent plus ce genre d’outil.

Si vous connaissez d’autres sites avec un outil efficace, n’hésitez pas à nous les partager.

Inscription au fil d'ID newsletter webprospection

Il est donc facile de tomber dans le duplicate content suite à une erreur d’inattention, restez donc sur vos gardes afin de ne pas ralentir la progression de votre présence sur le web.

 

Laissez un commentaire