Certaines parties de votre boutique devraient être cachées à Google. Pourquoi ? Quelles pages devrait-on exclure des résultats des recherches et comment le faire sur Shopify ? C’est ce que l’on va voir ensemble.
Pourquoi cacher une page aux robots d’exploration ?
Permettre ou non aux robots (Google, Bing Bot) d’explorer et d’indexer vos pages est important pour au moins 3 raisons :
- Conserver le Budget de Crawl pour les pages business en excluant les pages de faible valeur SEO.
- Éviter que des pages techniques n’apparaissent lors des recherches.
- Éviter les problèmes de contenus dupliqués.
Quelle est la différence entre Noindex et Nofollow ?
Ces deux balises metas robots ont un intérêt différent et doivent être utilisés intelligemment :
- Dofollow / Nofollow : Indication faite à Google d’aller suivre ou pas un lien.
- Index / Noindex : Directive faite à Google d’intégrer ou pas une page dans ses résultats.
Bons exemples :
- Une boutique de chaussures souhaite faire connaître sa collection « Mocassin » et tous les produits qu’elle contient. DOFOLLOW + INDEX
- La création d’un Tag « Mocassin » cause un doublon avec la collection principale. La page s’intitule -> Collection Mocassin – Tagué « mocassin » – Boutique Chaussure NOFOLLOW + NOINDEX
Mauvais exemple :
- La collection « Mocassin » comporte 3 pages de produits, le webmaster pense que la pagination doit être mise en NOINDEX + NOFOLLOW, c’est une erreur car cela revient à dire à Google « Ne suit pas les liens des pages 2 et 3 » ce qui l’empêcherait de trouver les produits des autres pages et de les indexer.
Que me faut-il désindexer sur ma boutique Shopify ?
D’une manière générale…
- Tout ce qui touche aux comptes utilisateurs et invités
- Les recherches internes et navigation à facettes (filtres de recherche) s’il n’y a pas un intérêt SEO
- Les doublons (qu’on appelle DUST) souvent fréquent en e-commerce comme les collections taguées ou l’accès aux fiches produits avec et sans le slug /collections/.
Mais globalement toutes les pages n’ayant pas de contenus ou d’objectifs SEO.
URL couramment désindexée | Type de page |
---|---|
Politique de Confidentialité et de Retour, CGV, Mentions légales, Contact, Policies | Pages légales |
/search?q= | Collections liées aux recherches internes |
/collections/all* | Collection tous les produits |
/collections/types?q= | Collections de types par défaut |
/checkout /account /cart | Pages de paiement |
/collections/vendors?q= | Collections fournisseurs « vendors » |
/produits/nom-du-produit /collections/nom-de-la-collection/produits/nom-du-produit | Doublon URL d’accès aux fiches produits |
/collections/nom-de-la-collection/nom-du-tag | Collection dédiée à un tag |
/blogs/nom-du-blog/tagged/nom-du-tag | Blog dédié à un tag |
Pour une recherche efficace des pages à désindexer, il est nécessaire d’avoir un visuel sur toutes les URL de votre site web shopify. Pour TOUTES les connaître, lancer un crawler sur votre site type Xenu ou Screaming Frog. Ajoutez également les URL trouvées dans la Search Console et si possible vos pages linkées par des sites externes, visibles dans des outils de monitoring de backlinks, il y a souvent des surprises.
Maintenant que vous avez cette liste dédoublonnée, passez les en revue manuellement afin d’estimer leur intérêt d’être ou non dans l’index de Google.
Comment ne pas référencer et Indexer des Pages sur Shopify ?
Il existe plusieurs méthodes pour ajouter les balises noindex nofollow
, en voici 5.
Solution 1. NoIndex avec l’éditeur en masse
Bien qu’on en parle à peine, il existe un champ caché qui vous permet de désindexer et supprimer des pages du plan du site de Shopify.
Il s’agit d’un champ méta nommé seo.hidden
.
Ajouter le chiffre 1
à ce champ déclenche trois actions :
- Il supprime la page du sitemap
- Elle met la page en mode noindex
- Elle met la page en nofollow
Accédez à cette éditeur via cette url :
https://YOURSTORE.myshopify.com/admin/bulk?resource_name=Product&edit=metafields.global.canonical,metafields.seo.hidden:integer&limit=250
Cette première méthode convient aux fiches produits et aux collections en remplaçant dans l’url le paramètre resource_name=Collection
.
Solution 2. NoIndex avec Metafield Guru
Pour une mise en place de cette technique étendue à toutes les pages du site (articles de blog, pages…) nous utiliserons une application d’édition des champs metas, dans notre cas, nous avons utilisé l’excellent meta field guru :
Ajouter une meta field pour la page concernée avec ces champs :
- « type »: « number_integer »
- « namespace »: « seo »,
- « key »: « hidden »,
- « value »: 1,
Solution 3. NoIndex avec une App dédiée
La méthode la plus simple évidemment est d’utiliser des applications uniquement dédiées à l’ajout de balises noindex, nofollow. Il y a plusieurs apps qui vous aideront à cacher des produits ou bloquer les pages que vous souhaitez. La plupart du temps elles seront payantes.
En voici 2 :
- XML HTML Sitemap / NoIndex SEO
- NoIndexify – Sitemap Manager (Super application gratuite, vérifier si elle fonctionne toujours)
Si vous ne voulez rien débourser, la partie suivante sera plus pour vous même si elle nécessite quelques lignes de code.
Solution 4. NoIndex avec le robots meta tag dans le code de la page
Une autre solution consiste à rajouter une ligne de code directement sur les pages que vous souhaitez désindexer. En premier dans l’éditeur de code.
La ligne en question :
<meta name="robots" content="noindex">
Solution 5. NoIndex avec le robots meta tag dans theme.liquid
La directive noindex
peut être insérée dans le code source de votre thème shopify,
Avant tout, dupliquez votre thème, vous pourrez revenir en arrière si jamais vous commettez une erreur : Boutique en ligne – Thèmes – Actions – Dupliquer
Une fois ceci fait, dirigez vous dans : Boutique en ligne
=> Thèmes
=> Actions
=> Modifier le code
=> fichier theme.liquid
.
Trouvez la fermeture de la balise head qui ressemble à ça : </head>
Comme dans cet exemple, copiez l’un des codes ci-dessous juste avant le </head>
:
Désindexer des pages sur shopify :
{% if template == 'page' %}
{% if page.handle == 'tracking-genie' or page.handle == 'politique-de-confidentialite' or page.handle == 'politique-de-retour' %}
<meta name="robots" content="noindex,nofollow"/>
{% endif %}
{% endif %}
Désindexer les URL de type « /collection/nomdelacollection/nomduproduit »
On connait le problème sur Shopify, par défaut deux urls permettent d’accéder aux fiches produits. Après avoir réglé ce problème, expliqué dans la partie Structure d’URL.
Vous pouvez ajouter juste au-dessus la balise </head>
, le code suivant :
Code pour désindexer les url de type: « /collections/nomdelacollection/nomduproduit » :
{% if template == "product" %}
{% assign $productUrl = product.url | within: collection %}
{% if productUrl contains 'collections' %}
<meta name="robots" content="noindex">
{% endif %}
{% endif %}
Si vous décidiez de garder l’autre structure d’url :
Code pour supprimer les url de type: « /products/nomduproduit » :
{% if template == "product" %}
{% assign $productUrl = product.url | without: collection %}
{% if productUrl contains 'products' %}
<meta name="robots" content="noindex">
{% endif %}
{% endif %}
Désindexer les collections et blogs « Tagué » sur shopify :
On résout ce genre de problème pour les collections et ce genre pour les blogs. Doublé à l’ajout d’une canonical. Isolez-les si vous souhaitez en utiliser qu’un des deux.
{% if template contains 'collection' and current_tags %}
<meta name="robots" content="noindex" />
<link rel="canonical" href="{{ shop.url }}{{ collection.url }}" />
{% elsif template contains 'blog' and current_tags %}
<meta name="robots" content="noindex" />
<link rel="canonical" href="{{ shop.url }}{{ blog.url }}" />
{% else %}
<meta name="robots" content="index,follow">
<link rel="canonical" href="{{ canonical_url }}" />
{% endif %}
Désindexer les url de recherche « search » shopify :
{% if template contains 'search' %}
<meta name="robots" content="noindex" />
<link rel="canonical" href="{{ shop.url }}" />
{% endif %}
Désindexer les pages de fournisseurs « vendors » shopify :
{% if template contains "collection" and collection.handle == "vendors" %}
<meta name="robots" content="noindex, follow">
<link rel="canonical" href="{{ shop.url }}" />
{% endif %}
Désindexation en masse et prise en compte rapide par Google
Mettre une page en noindex, ne suffit pas pour qu’elle disparaisse dans la minute des SERP de Google. Il doit en effet, la visiter de nouveau pour découvrir cette nouvelle directive.
Vous avez apporté des modifications à de nombreuses pages et vous souhaitez que Google réanalyse rapidement vos URL, vous avez deux options :
- Utiliser l’outil d’inspection de Google Search Console, 1 par 1 limité à 10 par jour. Etendu à 200 url par jour avec l’API. Utilisez l’outil gratuit FOUDROYER et ce TUTO.
- Soit envoyer à Google un plan de site HTML ET XML dédié à vos url à désindexer . Pour en savoir plus, écrivez-nous.
Désindexation à une date précise
Pour votre e-commerce, une page ne doit plus être présente dans Google à partir d’une date ou une heure précise ? Ajoutez cette méta robot au début du code html de votre page pour l’informer de son expiration : <meta name="googlebot" content=unavailable_after:23-Jul-2023 18:00:00 EST">
La désindexation de cette manière est précise et très efficace.
Conclusion
Comme nous venons de le voir, la balise noindex
est essentielle en SEO pour limiter la prise en compte de pages nocives par Google. Elle partage cependant le même inconvénient que la canonisation, elle n’économise pas le budget de crawl. Certes une page en noindex sera de moins en moins exploré par Google, mais si vous souhaitez limiter son passage au maximum :
- Une fois que l’url en noindex a disparu des moteurs de recherche, vous devriez la bloquer dans le fichier ROBOTS.TXT.
- Dans l’idéal, supprimez dans le code source de votre thème shopify l’apparition de ces liens afin que le crawler ne trouve plus du tout ces URL.
Cet article répondait à la question : Comment ne pas référencer et indexer des pages sur Shopify ?
Bon Référencement !