La balise canonical : pour limiter les contenus dupliqués sur son site

  • 24 juillet 2017
  • SEO
No Comments

Rand Fishkin vient de sortir une vidéo sur la balise « rel=canonical » et ses meilleurs usages possibles.

Impossible d’ignorer cette balise si vous devez participer un jour à un E-commerce !

 

Qu’est-ce qu’une balise canonical ? A quoi sert-elle ?

Google apprécie les contenus uniques. Il n’apprécie pas que 2 pages soient identiques, que ce soit sur un même site et encore moins sur 2 sites différents (copier/coller).

Il arrive par contre que 2 pages à priori identiques soient légitimes (version normale/version imprimable…).

Pour un E-commerce, si le CMS ne gère pas les déclinaisons de produits, nous pouvons avoir 30 pages sur le même produit, avec des variantes de couleurs ou de tailles.

Pour que Google comprenne que nous ne cherchons pas artificiellement à gonfler le nombre de pages du site, il est recommandé d’utiliser une balise canonical :

Schéma Backlinko Balise Canonique

 

La version canonical correspond ainsi à la page de référence, à laquelle seront reliées toutes les déclinaisons/variantes.

Google propose quelques conseils pour sa mise en place : https://support.google.com/webmasters/answer/139066?hl=fr

Nous avions déjà évoqué le sujet dans un précédent article, en nous appuyant sur les recommandations d’Adam AUDETTE.

Celles de Rand Fishkin apportent un éclairage nouveau.

 

Préférer la canonical au /disallow et noindex ?

Dans sa conférence du SMX New York, Adam AUDETTE propose des solutions très claires contre le duplicate content.

Il propose notamment de placer les filtres peu nécessaires dans le même répertoire et de l’exclure via le fichier robots.txt.

Robots txt contre contenu dupliqué

 

Rand est très prudent par rapport au fait de bloquer / ne pas indexer certaines pages.

Il préfère utiliser la canonical dans une majorité de situations : Google possède ainsi tous les éléments pour évaluer un site et lui donner les classements qu’il mérite.

Il s’agit presque d’une « philosophie du contenu dupliqué » : au contraire de la tendance qui consiste à masquer tous les éléments juger peu intéressants, Rand livre tout à Google mais avec les clés pour comprendre ce qui est « dérivé de », grâce à la canonical.

 

Si tout vous semble obscur…

1/ Gardez en tête que les CMS courants sont assez à l’aise avec les déclinaisons de produits (WooCommerce, Prestashop…).

2/ Le plus important c’est votre jugement humain, à l’aide d’un « site:nomdedomaine.fr » tapé dans Google.

Vous devez étudier les pages indexées, relever celles qui semblent peu utiles/douteuses et réfléchir à la meilleure manière de les traiter.

Pour le « comment faire ensuite », la mise en oeuvre technique, Google aura la réponse.

 

 

Passionné par le référencement depuis 2012, j'ai démarré le SEO en travaillant sur la levée des pénalités Pingouin / Panda puis sur des E-commerces.

Comment fonctionne le blog ?

La plupart des articles sont issus de questions adressées par e-mail. N'hésitez pas à poser la vôtre ~~

Besoin d'aide pour un projet web ?

Voyons si nous pouvons être complémentaires. Devis gratuit sous 24h par e-mail.

Ne ratez pas un article en suivant la newsletter

More from our blog

See all posts
No Comments

Leave a Comment