Spam d'url blogs (combinaisons de tags)

Topic summary

Problème central: afflux de trafic spam «humain» ciblant les pages de blog Shopify via des combinaisons de tags (/blogs/explore/tagged/…), majoritairement depuis la Chine. Cela multiplie les URLs et fausse fortement les statistiques (sessions, pages vues, rebond), sur une boutique avec le thème Palo Alto 6.1.0.

Mesures tentées: blocages dans robots.txt (disallow sur /blogs/explore/tagged/ et variantes) et app Blockify: Fraud Filter. Limites signalées: robots.txt ne bloque que l’indexation des crawlers, pas l’accès; le filtrage par pays n’empêche pas l’enregistrement de la session.

Dernière mise à jour: pas de défense native efficace dans Shopify ou le thème. Recommandation indiquée: exiger une connexion et/ou mettre en place des CAPTCHA personnalisés. Principe rappelé: si un humain peut accéder facilement, un bot le peut aussi.

Termes clés: robots.txt = consignes pour les crawlers, pas un pare-feu. CAPTCHA = test pour distinguer humains et bots.

Statut: non résolu. Aucune solution native confirmée; seule piste concrète évoquée: restreindre l’accès (login) et ajouter des CAPTCHA sur les pages de blog.

Summarized with AI on December 12. AI used: gpt-5.

Bonjour,

Depuis quelques semaines, nous faisons face à un problème important de trafic spam sur notre boutique Shopify (thème Palo Alto 6.1.0).

Le trafic provient quasi exclusivement de Chine et cible uniquement les pages de blog, en particulier via des combinaisons artificielles de tags qui génèrent de nombreuses URLs.

Exemple :

/blogs/explore/tagged/tag1+tag2+tag3+tag4+tag5

Il s’agit manifestement de faux trafic, sans comportement utilisateur réel, qui fausse complètement nos statistiques (sessions, pages vues, taux de rebond, etc.). Attention à priori ce n’est pas considéré comme des bots mais comme du trafic “humain”.

Nous cherchons à savoir s’il existe :

  • une solution native dans Shopify ou dans le thème Palo Alto pour bloquer ou limiter ce type de trafic,

  • ou des bonnes pratiques (paramétrage, règles, apps, robots.txt, autre) pour empêcher l’indexation et l’accès à ces URLs générées par tags.

  • J’ai déjà utilisé Sidekick et j’ai suivi certaines reco (ajout au robots.txt User-agent: *
    Disallow: /en/blogs/explore/tagged/ Disallow: /blogs/explore/tagged/ Disallow: /*/blogs/explore/tagged/)

  • Aussi intégré l’application “Blockify: Fraud Filter”, le support m’a précisé que malheureusement elle ne fonctionnerait pas pour notre cas (même en bloquant le pays “Chine”, la session serait déjà enregistrée).

Bref, nos stats sont complètement faussées et à priori sans solution, même avec le support Shopify…

Merci d’avance pour vos retours et recommandations.

You don’t have a real native defense beyond requiring login and/or customized captchas. Take note: if a human can access your site with ease, a bot can too.