Qu’est-ce que la balise canonique et comment bien l’utiliser?

Mathilde Capezzuoli • 16 décembre 2021

Sur un site web (surtout en e-commerce), ça l’arrive qu’un même contenu soit accessible via plusieurs URLs. C’est ce qu’on appelle du contenu dupliqué. Sans surprise, lorsque laissé tel quel, ce genre de contenu peut affecter le référencement de vos pages dans les moteurs de recherche. 

On vous a créé un petit guide pour vous aider à mieux comprendre et utiliser les fameuses balises canoniques.

Qu’est-ce que la balise canonique?

La balise canonique est un extrait de code HTML (rel=canonical) qui définit la page la plus représentative et complète d’une série de pages avec du contenu similaire ou identique. La balise canonique indique aux robots d’exploration la version principale d’une URL à crawler et à indexer dans les moteurs de recherche. 

Comme ça, les visites des robots d’exploration sur un site web sont optimisées pour qu’ils passent du temps sur du contenu unique et complet.

Qu’est-ce qui cause le contenu dupliqué?

Même si vous ne voyez qu’une seule version d’une page dans votre CMS, cette même page peut être accessible via un nombre infini d’URLs. Sans balise canonique, les moteurs de recherche considèrent toutes les versions d’une URL comme étant des pages uniques. Vous comprendrez donc les problèmes que ça peut causer.

Exemple d’URLs dupliquées :

→ tonsiteweb.com
→ www.tonsiteweb.com
→ https://tonsiteweb.com
→ https://m.tonsiteweb.com
→ https://tonsiteweb.com/?utm_content=promo&utm_medium=social
→ https://tonsiteweb.com/?page=2

Alors, qu’est-ce qui peut causer le contenu dupliqué?

  • des URLs dynamiques, comme les pages d’affinement de filtres, les paramètres de recherche;
  • des articles de blogue qui se trouvent dans plusieurs catégories, donc le contenu est accessible via plusieurs URLs (exemple.com/blogue/referencement-seo/article et exemple.com/blogue/seo/article);
  • des sites web compatibles avec plusieurs types d’appareils (m.exemple.com et exemple.com).

Pourquoi les balises canoniques sont importantes pour votre SEO?

On ne le se cachera pas, la meilleure manière de régler un problème de contenu dupliqué est de simplement supprimer les pages en doublon et de créer des redirections. 

Dans les cas où les redirections ne sont pas possibles, les balises canoniques deviennent une excellente manière de consolider les contenus dupliqués et d’éviter, par le fait même, certains problèmes causés par les pages qui contiennent du contenu similaire.

En effet, les URLs avec du contenu dupliqué diluent les chances des URLs principales de se positionner dans les premiers résultats des moteurs de recherche. Sans balise canonique, les différentes versions d’une même URL vont se faire compétition dans les moteurs de recherche en répondant aux mêmes intentions de recherche. La compétition est déjà assez féroce comme ça dans les SERP, pas besoin d’en rajouter. 🙃 

De plus, le temps que les robots d’exploration investissent à crawler des URLs avec du contenu identique est du temps en moins passé sur du contenu unique et complet. La balise canonique permet de rendre les visites des robots d’exploration plus efficientes et du fait même, d’améliorer le référencement des pages importantes d’un site web.

Comment repérer les URLs dupliquées?

D’ordre général, on identifie les URLs dupliquées en réalisant un Audit SEO d’un site web. Bien heureusement, il existe plusieurs outils (gratuits et payants) pour identifier rapidement les pages dupliquées d’un site web. 

Voici quelques outils pour repérer les URLs dupliquées (ça peut aussi être fait par des experts SEO) :

  • Siteliner.com : outil gratuit et facile à utiliser qui scanne votre site web et vérifie certains problèmes de référencement (contenus dupliqués, liens brisés, etc.)
  • Screaming frog : outil payant (avec version gratuite) qui extrait les données d’un site web et vérifie les problèmes courants de référencement (dont les contenus dupliqués)
  • SEMrush : outil payant qui analyse la performance SEO de sites web et offre des recommandations

Comment ajouter des balises canoniques à vos pages?

Voici 4 méthodes d’indiquer aux moteurs de recherche l’URL à considérer parmi une série de pages dupliquées :

1. La balise rel=canonical

Cette méthode est, sans aucun doute, la manière plus claire d’indiquer aux robots d’exploration l’URL à considérer parmi une série de pages dupliquées. 

Pour intégrer la balise, il faut ajouter le code ci-dessous à la section <head> de chaque page dupliquée.

<link rel=“canonical” href=“https://exemple.com/page-canonique/” />

Vous n’aurez qu’à personnaliser la partie du code href=’’https://exemple.com/page-canonique/’’ avec l’URL qui a été désignée comme la version originale du contenu dupliqué.

2. En tête HTTP rel=canonical

Sans surprise, on ne retrouve pas de section <head> dans les documents PDF. Il faut donc utiliser l’en-tête HTTP pour identifier les canoniques.

Link: <http://www.exemple.com/telecharger/guide.pdf>; rel= »canonical »

3. Sitemap

Règle de base : les URLs non canoniques ne doivent pas se retrouver dans un sitemap. Ainsi, les URLs qui se retrouvent dans un sitemap sont perçues par les moteurs de recherche comme étant les URLs canoniques suggérées. 

Bien que ce soit une méthode simple pour identifier les URLs canoniques, elle n’est pas très sûre. En effet, Google ne garantit pas que les robots d’exploration vont réellement considérer ces URLs comme canoniques. S’ils trouvent une page qui est selon eux, plus complète et utile, ils peuvent la définir comme étant la version canonique.

En d’autres mots, c’est mieux de se référer aux 2 méthodes précédentes. 

4. Redirection 301

Les redirections 301 sont importantes lorsqu’on supprime des pages en double. Ça permet de faire une transition de la page dupliquée et supprimée vers l’URL canonique.

💡 Redirection 301 : code d’état qui signifie qu’une page a été déplacée de manière définitive vers un autre emplacement.

Règles générales des balises canoniques

1. Utiliser une balise self-canonical sur toutes vos pages

Qu’est-ce que c’est un self-canonical? C’est le fait d’ajouter une balise canonique sur une page qui pointe vers elle-même.

Ce n’est pas obligatoire, mais c’est fortement recommandé. 
Donc, si l’URL de votre page d’accueil est https://www.tonsiteweb.com, vous ajouterez le code suivant dans la section <head> de la page d’accueil :

<link rel=“canonical” href=“https://www.tonsiteweb.com” />

Croyez-moi, ça permet d’éviter bien des problèmes de contenu dupliqué en identifiant la page vers laquelle se référer en cas d’URLs en double.

2. Inclure l’URL complète dans la balise canonique

Si vous n’utilisez pas l’URL complète dans la balise canonique, Google va ignorer le tag. Voici ce que doit inclure une URL complète :

  • https://
  • www
  • le nom du domaine
  • .com

✅ https://www.cardiganmtl.com
❌ cardiganmtl.com

3. L’URL canonique ne doit pas se trouver dans le fichier robots.txt ou avoir une balise noindex

Une URL canonique qui se trouve dans un fichier robots.txt ou qui est taguée de la balise noindex, c’est contradictoire pour les robots d’exploration. 

À l’inverse, on veut que cette page se retrouve dans le sitemap du site pour faire valoir son importance auprès des robots d’exploration.

Besoin d’un coup de pouce?

Si vous n’avez pas le temps de vous en occuper (ce qui est très comprenable), nos experts en SEO se feront un plaisir de vous aider à consolider les URLs dupliquées à l’aide des balises canoniques.

Parlons-nous, c’est toujours mieux. 🔥


Lire plus d’articles écrit par Mathilde Capezzuoli:


Lire plus d’articles sur SEO (Référencement organique):