La balise canonical : pour limiter les contenus dupliqués sur son site

  • 24 juillet 2017
  • SEO

Rand Fishkin vient de sortir une vidéo sur la balise « rel=canonical » et ses meilleurs usages possibles.

Impossible d’ignorer cette balise si vous devez participer un jour à un E-commerce !

 

Qu’est-ce qu’une balise canonical ? A quoi sert-elle ?

Google apprécie les contenus uniques. Il n’apprécie pas que 2 pages soient identiques, que ce soit sur un même site et encore moins sur 2 sites différents (copier/coller).

Il arrive par contre que 2 pages à priori identiques soient légitimes (version normale/version imprimable…).

Pour un E-commerce, si le CMS ne gère pas les déclinaisons de produits, nous pouvons avoir 30 pages sur le même produit, avec des variantes de couleurs ou de tailles.

Pour que Google comprenne que nous ne cherchons pas artificiellement à gonfler le nombre de pages du site, il est recommandé d’utiliser une balise canonical :

Schéma Backlinko Balise Canonique

 

La version canonical correspond ainsi à la page de référence, à laquelle seront reliées toutes les déclinaisons/variantes.

Google propose quelques conseils pour sa mise en place : https://support.google.com/webmasters/answer/139066?hl=fr

Nous avions déjà évoqué le sujet dans un précédent article, en nous appuyant sur les recommandations d’Adam AUDETTE.

Celles de Rand Fishkin apportent un éclairage nouveau.

 

Préférer la canonical au /disallow et noindex ?

Dans sa conférence du SMX New York, Adam AUDETTE propose des solutions très claires contre le duplicate content.

Il propose notamment de placer les filtres peu nécessaires dans le même répertoire et de l’exclure via le fichier robots.txt.

Robots txt contre contenu dupliqué

 

Rand est très prudent par rapport au fait de bloquer / ne pas indexer certaines pages.

Il préfère utiliser la canonical dans une majorité de situations : Google possède ainsi tous les éléments pour évaluer un site et lui donner les classements qu’il mérite.

Il s’agit presque d’une « philosophie du contenu dupliqué » : au contraire de la tendance qui consiste à masquer tous les éléments juger peu intéressants, Rand livre tout à Google mais avec les clés pour comprendre ce qui est « dérivé de », grâce à la canonical.

 

Si tout vous semble obscur…

1/ Gardez en tête que les CMS courants sont assez à l’aise avec les déclinaisons de produits (WooCommerce, Prestashop…).

2/ Le plus important c’est votre jugement humain, à l’aide d’un « site:nomdedomaine.fr » tapé dans Google.

Vous devez étudier les pages indexées, relever celles qui semblent peu utiles/douteuses et réfléchir à la meilleure manière de les traiter.

Pour le « comment faire ensuite », la mise en oeuvre technique, Google aura la réponse.

 

 

J'ai engrangé mes premiers revenus sur le web en 2012 en développant et en monétisant le trafic de mes sites (AdSense...).


Depuis 2013 et mes premières prestations professionnelles, j'ai eu l'opportunité de participer à la progression de plus de 450 sites de plus de +20 pays.

A lire aussi sur le blog

Voir tous les articles
No Comments

Un commentaire ?