Google Panda & ebay

Panda 4.0: high-kick de Google sur eBay…

Dans la foulée de la mise à jour du filtre Google Panda (version 27, ou 4.0), SearchMetrics.com sort une analyse préliminaire intéressante de l’impact sur le positionnement et la visibilité d’une série de majors américains. SearchEngineLand.com et Moz.com pour leur part, pointent du doigt la chute vertigineuse d’eBay.

eBay: perte de visibilité organique

Voilà qui fait mal. Cette perte massive et brutale de visibilité est directement lié à la chute du taux d’emprise sur les résultats de recherche: eBay passe de 1% à moins de 0,3% d’emprise en seulement 3 jours, selon le baromètre de Moz.com.

eBay: perte d'emprise sur les SERPS (Google Panda 4.0)

Toujours d’après Moz.com, la principale section du site d’eBay impactée par cette mise à jour correspond au répertoire /bhp/: jetons-y un oeil.

eBay: avec ou sans Black Hat ?

Rishi Lakhani (refugeeks.com) a pu isoler au travers d’analyses réalisées via SEMRush que la section /bhp/ d’eBay est fortement incriminée. Et pour cause…

Faut-il en rire, ou est-ce volontaire… “BHP” est un bel acronyme de “Black Hat Pages”. Sans véritablement faire appel à des techniques “Black Hat” de haut vol, généralement bien plus agressives (et intelligentes) que ce qu’on voit ici, il faut avouer que ce qu’on trouve sous /bhp/ est à la fois une erreur stratégique fondamentale, et une technique d’un autre âge.

Pour trouver ces pages, il faut descendre, descendre et descendre encore, jusqu’au bas de la plupart des pages d’annonces du site d’enchères, jusqu’à la section “More to explore”. Cette section propose des liens, vers des pages de Mélange de contenu (Content Mashup), à savoir des pages qui proposent:

  • des portions de contenu existant déjà sur les pages de catégorisation
  • des portions de contenu existant déjà sur les pages de produits

Exemple: cette page produit (Truggy Tamiya Super Levant) propose des liens vers des pages de mashup sous /bhp/:

More to explore : Tamiya 1/10 RC, Tamiya RTR, 1 10 Brushless RC RTR, Tamiya 1 10 RC Kit, 1/10 RTR Buggy, 1 10 RC Drift Car RTR, Tamiya Ferrari 1/10, Tamiya Supra 1/10, Tamiya CC01 RTR, 1 10 Short Course RTR

…et qui sont – par définition – hyper-optimisées sur certains mots-clé.

Cette technique vieille comme Google fonctionne un temps. Nul doute qu’eBay s’est fait du bien en exploitant cette méthode de génération de contenu qui permet d’alimenter Google en nouvelles pages indexables parfaitement optimisées… Certes, ce sont des pages optimisées, très proches les unes des autres d’un point de vue thématique, dont le maillage ultra-serré est “valide”, mais… ça reste de la duplication de contenu pure et simple.

eBay a fait une énorme boulette, aucun doute là dessus…
Nous avions mené une expérience en ce sens en 2005/2006, sur un site de test qui nous avait permis de faire indexer plus de 900 millions de pages par Google, sans aucun effort particulier (pas même une once de référencement), sur base de 600 contenus de moins de 300 mots, jusqu’au jour où le site fût tout simplement blacklisté par le moteur de recherche (et il l’est toujours…). Cette expérience nous avait permis de jeter les bases de la problématique aujourd’hui universellement connue du Duplicate Content.

Le Duplicate Content & nos CMS habituels…

Par “CMS habituels”, nous parlerons ici de deux gestionnaires de contenu particulièrement générateurs de contenu dupliqué: WordPress et Magento. D’autres CMS, comme Joomla! et Drupal ont également leur lot de petites failles potentiellement génératrices de duplicate content, mais WP et Magento sont des exemples plus évidents (et plus répandus).

La duplication de contenu (ou Duplicate Content) est une notion relative à l’exploitation d’un contenu identique, même partiellement, sur plusieurs pages d’un même site, ou de sites différents. Il est convenu et démontré depuis plusieurs années que la duplication de contenu est susceptible de nuire gravement à la capacité de positionnement d’une page, de plusieurs pages, voire de l’ensemble d’un site Internet. Le filtre Google Panda a (entre autres) pour vocation d’évaluer la qualité et la richesse du contenu: de cette évaluation peuvent découler différentes pénalités algorithmiques.

Le Duplicate Content sous WordPress…

WordPress est un bon CMS. Un excellent CMS, léger et facile à prendre en mains, bourré d’extensions intéressantes, et flanqué de centaine de milliers d’excellents templates. C’est sans aucun doute le CMS le plus abordable, et la base de travail la plus évidente pour déployer un site traditionnel ou un micro e-Commerce.

Néanmoins, les sites propulsés par Wordpress pâtissent d’une fonctionnalité old school qui, même si elle peut aujourd’hui être exploitée plus finement, reste beaucoup trop souvent exploitée à l’ancienne d’une manière qui expose potentiellement le site à d’importantes pénalités… J’ai nommé: les tags !

Les tags sont tellement simples, tellement évidents: ajouter un tag à un article sous WordPress permet sans effort d’ajouter ce dernier à une page spécialement optimisée pour un mot-clé en particulier, qui ne présente des contenus qu’exclusivement liés à ce terme…

C’est bien beau, mais dès lors que plusieurs articles sont liés aux mêmes tags… on a vite fait de se retrouver avec un site qui propose, sur des dizaines, des centaines, voire des milliers de pages, un contenu identique, constitué d’extraits déjà présents sur d’autres pages: les catégories !

Entre autres méthodes permettant d’exploiter idéalement le contenu de votre WordPress, apprenez-en plus sur le bon usage des tags.

Le Duplicate Content sous Magento…

Magento est plus que certainement le CMS e-Commerce le plus puissant et le plus efficace qui soit. Néanmoins, celui-ci n’est pas fondamentalement SEO Friendly: de nombreuses fonctionnalités et logiques internes peuvent en faire un véritable appât à pénalités.

Trois causes sont principalement identifiables:

  1. Les produits présents dans plusieurs catégories…
  2. La navigation par couches, ou les filtres de contenu…
  3. La réorganisation de contenu par l’utilisateur…

Ces problèmes et leurs solutions ont été abordés récemment dans notre article dédié à l’optimisation de Magento pour Google.

Les résultats de recherche indexables…

La technique peut paraître d’un autre âge. En fait… elle l’est.
Malheureusement, cette méthode d’optimisation totalement obsolète est encore appliquée sur un très grand nombre de sites, généralement sur base d’une recommandation provenant d’un webmaster ou d’une agence mal informés, ou peu au fait de ce qui fait le SEO d’aujourd’hui. La problématique du Duplicate Content apparaît sur plus de 70% des sites que nous sommes amenés à analyser. Dans plus de 20% des cas, la duplication de contenu par la génération de résultats de recherche indexables et liés est directement incriminée.

L’indexation de ses propres résultats de recherche pose un double problème:

  1. Un problème de duplication de contenu évident, puisqu’il est fondamentalement possible de se retrouver très rapidement avec plusieurs centaines de pages totalement identiques, générées par toute une série de variantes de requêtes tapées sur votre site web…
  2. Un problème de réputation, puisqu’il est possible que certaines recherches réalisées par vos visiteurs ne soient pas “safe” (recherches sur des mots-clés liés à la pornographie, aux médicaments, etc…). Un concurrent peu scrupuleux aurait vite fait de réaliser quelques centaines ou milliers de recherches, générant autant de pages porteuses de termes nuisibles.

Si vous devez absolument rechercher du positionnement sur un terme en particulier, et que votre site ne dispose d’aucune page qui y soit adaptée, c’est qu’il faut en créer une (une landing page parfaitement optimisée, par exemple).

Crédits image: Moz.com / SearchMetrics.com.

Cet article vous a plu ? Partagez-le :Share on LinkedIn3Share on Google+2Share on Facebook0Tweet about this on TwitterDigg thisShare on Reddit0Share on StumbleUpon0Buffer this pageEmail this to someone

Mots-clefs : Duplicate Content, optimisation, techniques, White Hat

Commentaires (8)

  • Avatar

    jean

    |

    super article merci bcp

    Reply

    • Avatar

      Tamy

      |

      Comme vous, je trouve l’article utile (enfin en ce qui me concerne)

      Reply

  • Avatar

    missiv

    |

    merci pour les infos. effectivement dur à gérer le duplicate content !

    Reply

  • Avatar

    Perspectives-3d.fr

    |

    Pas mal simple en effet missiv mais des infos intéressantes! Tres beau site missiv auu passage

    Reply

  • Avatar

    simon

    |

    super article merci bcp

    Reply

  • Avatar

    Patrick

    |

    Merci beaucoup pour ces informations. Les CMS posent effectivement des problèmes de duplicate content. Personnellement, je préfère éviter d’utiliser un CMS pour ne pas être confronté à ce type de problème.

    Reply

Laisser un commentaire

Optimiser votre site

Beau ne signifie pas efficace...

i.SEO vous conseille dans le cadre de l'amélioration de votre site web pour une meilleure considération par Google, et un meilleur positionnement dans les résultats naturels: consultez-nous !

Référencer votre site

Si l'optimisation est le fondement de toute stratégie de positionnement, le référencement en est le principal levier.

i.SEO assure vos campagnes de référencement naturel et positionne votre site dans les premiers résultats: consultez-nous !