Sitemap.xml problems

Topic summary

Un site web rencontre des problèmes de référencement causés par la duplication d’URLs suite à un problème de traduction. Les pages existent en multiples versions avec des slugs erronés (ex: /fr/en-us/, /fr/en-fr/, /fr/en-nl/) qui sont toutes indexables (code 200).

Problèmes identifiés:

  • Les mauvaises URLs sont canonisées vers les bonnes versions, mais Google indexe préférentiellement les mauvaises
  • Des fichiers sitemap.xml référencent ces URLs erronées
  • Conséquences: contenu dupliqué, gaspillage du crawl budget, baisse d’autorité

Situation technique:

  • Les URLs problématiques ne sont pas visibles dans le CMS Shopify
  • L’utilisateur prévoit de rediriger les mauvaises URLs vers les bonnes

Question posée:
Comment retirer ces URLs erronées du sitemap.xml et de l’index Google, sachant qu’elles ne sont pas accessibles via le CMS?

La discussion reste ouverte sans réponse pour le moment.

Summarized with AI on October 30. AI used: claude-sonnet-4-5-20250929.

Bonjour à tous !

Je rencontre un certain nombre de problèmes techniques sur mon site web qui nuisent au référencement organique de celui-ci.

Notamment le fait que mes pages existent en de multiples versions d’URLs différentes. Il semble y avoir eu un problème au moment de la traductions, les ulrs se sont dupliquées avec des slugs érronés (toutes indexables et en code 200)
Exemple : https://www.juilletjuillet.com/fr/collections/boys-swim-shorts (url correcte)

https://www.juilletjuillet.com/fr/en-us/collections/boys-swim-shorts

https://www.juilletjuillet.com/fr/en-fr/collections/boys-swim-shorts

https://www.juilletjuillet.com/fr/en-nl/collections/boys-swim-shorts

https://www.juilletjuillet.com/fr/en-us/collections/boys-swim-shorts

Toutes ces mauvaises urls sont bien canonisées vers les bonnes versions d’urls. En revanche, Google, comme d’habitude, n’en fait qu’à son nez et préfére plutôt indexer les mauvaises versions d’urls.

Un problème qui n’arrange pas cela est le fait qu’il existe des fichiers sitemap.xml qui référencent toutes les mauvaises versions d’urls à Google.

Cela cause donc :

-contenu dupliqué

-crawl inutile (sous-optimisaiton de crawl budget)

-baisse d’autorité

J’ai l’intention de rediriger toutes les mauvaises urls vers les bonnes mais savez-vous m’aider pour la partie sitemap.xml ? Comment les retirer de l’indexe et de mon fichier sitemap de base ? Sachant que ces urls ne sont même pas visibles dans le CMS Shopify.

D’avance merci pour votre aide précieuse !

Pierre.