Ben DAVAKAN

Vous êtes au bon endroit pour concrétiser vos ambitions sur le web. Parlons-en dès maintenant.

les allégations juridiques d’automattic sur le référencement : est-ce fondé ?

les allégations juridiques d’automattic sur le référencement : est-ce fondé ?

les allégations juridiques d’automattic sur le référencement : est-ce fondé ?

les allégations juridiques d’automattic sur le référencement : est-ce fondé ?

Sommaire

Le litige opposant Automattic à WP Engine comporte des allégations portant sur le rôle du SEO. Le mémoire en défense mentionne à plusieurs reprises « search engine optimization » et « SEO » pour soutenir l’idée que WP Engine aurait abusé de l’utilisation du mot « WordPress » afin d’améliorer son classement dans les moteurs de recherche, dans le cadre d’une prétendue campagne d’« infringement » utilisant les marques WordPress à des fins commerciales. Un examen attentif des éléments avancés montre que certaines preuves sont potentiellement biaisées et que les affirmations relatives au SEO s’appuient sur des conceptions obsolètes du fonctionnement des moteurs de recherche.

Les allégations d’Automattic concernant le SEO

Dans son contre‑mémoire, Automattic soutient que WP Engine aurait délibérément employé des techniques de SEO pour se positionner sur des requêtes liées à WordPress, créant ainsi, selon eux, un risque de confusion pour les internautes.

Le contre‑mémoire précise :

« WP Engine a également semé la confusion ces dernières années en augmentant de manière significative le nombre d’apparitions des marques des contredisants sur ses sites web. À partir de 2021 environ, WP Engine a commencé à augmenter nettement son usage des marques WordPress, et à partir de 2022 environ, a fortement accru son emploi des marques WooCommerce. »

Automattic affirme ensuite que la répétition d’un terme sur une page serait la stratégie SEO mise en œuvre par WP Engine. C’est à ce point que leurs assertions deviennent discutables pour toute personne familiarisée avec les méthodes modernes de classement des moteurs de recherche.

Le contre‑mémoire avance aussi :

« L’augmentation du nombre d’apparitions des marques WordPress sur le site de WP Engine est particulièrement susceptible de provoquer de la confusion dans le contexte d’Internet.

Selon les informations et en croyance, les moteurs de recherche internet prennent en compte le nombre d’occurrences d’un terme dans le texte d’un site web pour évaluer la « pertinence » d’un site par rapport aux termes qu’un utilisateur saisit lorsqu’il recherche des sites.

La décision de WP Engine d’accroître le nombre d’apparitions des marques WordPress sur son site web semble être une stratégie consciente de « search engine optimization » visant à faire en sorte que lorsque des internautes recherchent des entreprises proposant des services liés à WordPress, ils soient exposés à des liens rédigés et formatés de façon trompeuse qui les mènent vers les sites de WP Engine plutôt que vers WordPress.org ou WordPress.com. »

La plainte qualifie cette stratégie d’« agressive » :

« La stratégie de WP Engine incluait une utilisation agressive du search engine optimization afin d’employer très fréquemment les marques WordPress et WooCommerce et de confondre les consommateurs recherchant des fournisseurs autorisés des logiciels WordPress et WooCommerce ; »

Le nombre d’occurrences d’un mot‑clé est‑il un facteur de classement ?

Avec plus de vingt‑cinq ans d’expérience dans le domaine du SEO, je peux affirmer qu’il existe une incompréhension fondamentale dans l’argumentation d’Automattic. L’idée selon laquelle les moteurs de recherche « prennent en compte le nombre de fois » qu’un mot‑clé apparaît dans le contenu d’un site pour déterminer son classement est, aujourd’hui, inexacte.

Les moteurs de recherche modernes ne se limitent plus à compter la fréquence brute d’un terme sur une page. Les algorithmes, notamment grâce à des modèles de traitement du langage comme BERT ou des approches sémantiques similaires, cherchent à comprendre l’intention et le sens des requêtes et du contenu. Ils sont capables de classer des pages pertinentes même si celles‑ci n’utilisent pas littéralement les mots exacts saisis par l’utilisateur.

Ce constat n’est pas seulement une opinion : la documentation officielle de Google sur le fonctionnement de la recherche explique explicitement que le classement repose sur l’intention de l’utilisateur et sur la compréhension sémantique du contenu, indépendamment de la simple présence de mots‑clés exacts :

« Pour retourner des résultats pertinents, nous devons d’abord établir ce que vous recherchez — l’intention derrière votre requête. Pour cela, nous construisons des modèles de langage pour tenter de déchiffrer comment les quelques mots que vous saisissez dans la barre de recherche correspondent au contenu le plus utile disponible.

Cela implique des étapes aussi simples que la reconnaissance et la correction des fautes d’orthographe, et va jusqu’à notre système sophistiqué de synonymes qui nous permet de trouver des documents pertinents même s’ils ne contiennent pas exactement les mots que vous avez utilisés. »

Si la documentation de Google ne suffit pas à convaincre, il suffit d’observer des résultats concrets : la page de WordPress.com se classe par exemple en deuxième position sur la requête « Managed WordPress Hosting » alors que cette expression n’apparaît pas littéralement sur la page concernée. C’est un exemple parlant de la capacité des moteurs à évaluer la pertinence au‑delà de la simple correspondance textuelle.

Capture d’écran montrant WordPress.com dans les résultats

Quelles sont les preuves avancées ?

Pour étayer ses affirmations, Automattic présente un graphique comparant la moyenne mensuelle d’occurrences du mot « WordPress » sur les sites de WP Engine et d’un échantillon de dix‑huit autres hébergeurs. Visuellement, le graphique met en évidence que WP Engine mentionnerait « WordPress » beaucoup plus fréquemment que la majorité des concurrents retenus.

Capture d’écran du graphique

Un zoom sur ce graphique (valeurs incluses) illustre que les mentions mensuelles de « WordPress » sur les pages de WP Engine dépasseraient largement celles des autres hébergeurs analysés.

Gros plan du graphique

À première vue, les chiffres semblent indiquer une stratégie agressive de répétition du terme « WordPress ». Cependant, l’interprétation de ces données nécessite prudence : le choix des entités comparées, la méthode de comptage et le périmètre analysé peuvent tous introduire des biais significatifs.

Le comparatif d’Automattic est‑il biaisé ?

Une analyse de la liste des dix‑huit hébergeurs retenus par Automattic montre une hétérogénéité importante : seulement cinq des hébergeurs inclus (y compris WP Engine) proposent exclusivement une offre de managed WordPress. Les quatorze autres sont des hébergeurs généralistes proposant des offres variées — cloud, VPS, serveurs dédiés, enregistrements de domaines, etc.

Cette hétérogénéité a une conséquence simple mais cruciale : sur l’ensemble d’un site d’hébergement généraliste, le terme « WordPress » sera naturellement moins présent qu’au sein d’un site spécialisé dans l’hébergement managé de WordPress. En d’autres termes, comparer des sites mono‑service à des sites multi‑service sans normalisation introduit un biais en faveur d’une conclusion selon laquelle un site spécialisé « spamme » plus le terme.

Deux exemples illustrent bien ce point : Namecheap et GoDaddy sont surtout connus comme bureaux d’enregistrement de noms de domaine et proposent une vaste gamme de services. Leur mention moyenne de « WordPress » est attendue comme étant fortement diluée par rapport à un site qui ne fait que de l’hébergement managé WordPress.

Parmi les cinq hébergeurs qui proposent une offre WordPress dans l’échantillon d’Automattic, deux d’entre eux sont en fait centrés sur des extensions ou constructeurs : Elementor et WPMU Dev. Leur contenu est en grande partie consacré à des documentations et articles sur leurs plugins, ce qui réduit mécaniquement la proportion d’occurrences du terme « WordPress » sur la totalité du site.

En résumé, la sélection des concurrents incluse dans le graphique d’Automattic comporte des choix discutables qui peuvent donner une image trompeuse du niveau d’utilisation du terme « WordPress » par WP Engine. Seuls deux acteurs de la liste — Kinsta et Rocket.net — présentent un profil de service directement comparable à WP Engine.

Comparaison entre hébergeurs managed WordPress

Pour une évaluation plus juste, il est préférable d’opérer une comparaison en face à face des pages qui se concurrencent réellement sur la requête « managed WordPress hosting ». J’ai procédé à une recherche consistant à ajouter le nom de domaine à la requête « managed WordPress hosting » afin d’isoler la page la mieux positionnée pour chaque domaine et de compter le nombre d’occurrences du mot « WordPress » sur ces pages.

Voici les résultats obtenus pour les trois hébergeurs managés figurant dans la liste d’Automattic :

Rocket.net

La page d’accueil de Rocket.net se classe en première position pour la requête « rocket.net managed wordpress hosting ». Cette page contient le terme « WordPress » 21 fois.

Capture d’écran des résultats Google

Kinsta

La page la mieux classée de Kinsta pour l’intention recherchée est kinsta.com/wordpress-hosting/ : sur cette page, le mot « WordPress » apparaît 55 fois.

WP Engine

La page de WP Engine ciblant l’offre managée est wpengine.com/managed-wordpress-hosting/ et y figure le terme « WordPress » 27 fois.

Une comparaison directe, page à page, entre hébergeurs managés (tirée de la propre liste d’Automattic) montre donc que WP Engine n’apparaît pas comme l’extrême en matière d’occurrences du mot « WordPress » : son nombre se situe au milieu de l’échantillon étudié.

Nombre d’occurrences du mot « WordPress » par page

  • Rocket.net : 21 fois
  • WP Engine : 27 fois
  • Kinsta : 55 fois

Et les autres hébergeurs managed WordPress ?

Pour étoffer la comparaison, j’ai analysé cinq autres hébergeurs managés absents de l’échantillon d’Automattic, afin de voir combien de fois le mot « WordPress » apparaît sur leurs pages les mieux positionnées :

  • WPX Hosting : 9
  • Flywheel : 16
  • InstaWP : 22
  • Pressable : 23
  • Pagely : 28

Ces chiffres montrent que la mention « WordPress » varie considérablement d’un acteur à l’autre. Avec ses 27 occurrences, WP Engine se situe plutôt dans la partie haute de cet échantillon, mais reste loin derrière certains concurrents comme Kinsta ou même certaines pages généralistes qui, surprise, utilisent encore plus le terme.

Comparaison avec des hébergeurs généralistes

Pour compléter le panorama et confronter directement les résultats au graphique initial d’Automattic, j’ai isolé la page la mieux positionnée de plusieurs hébergeurs généralistes en requêtant « managed WordPress hosting » suivi du nom de domaine. Ce test est une comparaison one‑to‑one entre pages qui sont effectivement en concurrence sur l’intention « hébergement WordPress managé ».

Autres hébergeurs comparés à WP Engine :

  1. InMotion Hosting : 101 fois
  2. Greengeeks : 97 fois
  3. Jethost : 71 fois
  4. Verpex : 52 fois
  5. GoDaddy : 49 fois
  6. Cloudways : 47 fois
  7. Namecheap : 41 fois
  8. Liquidweb : 40 fois
  9. Pair : 40 fois
  10. Hostwinds : 37 fois
  11. KnownHost : 33 fois
  12. Mochahost : 33 fois
  13. Panthen : 31 fois
  14. Siteground : 30 fois
  15. WP Engine : 27 fois

Les résultats peuvent surprendre : sur cette base, WP Engine utilise le mot « WordPress » moins souvent que la plupart des hébergeurs généralistes mentionnés. Cette observation remet en question l’interprétation que donne Automattic de son propre graphique.

À titre de comparaison, la page de WordPress.com la mieux classée sur l’intention « hosting » (wordpress.com/hosting/) emploie le mot « WordPress » 62 fois, soit plus du double de la page de WP Engine.

Les allégations SEO d’Automattic seront‑elles infirmées ?

Plusieurs éléments indiquent que les affirmations d’Automattic concernant l’utilisation du SEO par WP Engine reposent sur des bases discutables. Premièrement, leur interprétation du fonctionnement des moteurs de recherche contredit la documentation officielle de Google et la compréhension moderne des algorithmes sémantiques. Deuxièmement, leur graphique souffre d’un biais de sélection des concurrents qui rend la lecture des données trompeuse.

Enfin, la simple observation du fait que WordPress.com se classe pour certaines requêtes sans contenir textuellement les mots‑clés montre qu’il est erroné d’affirmer que le nombre brut d’occurrences d’un mot sur une page est déterminant pour le classement. Les moteurs mesurent la pertinence via des signaux plus complexes : expérience utilisateur, architecture du site, backlinks, qualité du contenu, signaux sémantiques, etc.

Pour objectiver davantage la discussion, j’ai soumis l’URL de WP Engine (wpengine.com/managed-wordpress-hosting/) à un outil d’analyse de densité de mots‑clés. Le Keyword Density Tool retourne une densité du mot « WordPress » d’environ 1,92% sur cette page. D’un point de vue SEO, ce niveau est modéré et ne correspond pas à ce que l’on qualifierait usuellement de « suroptimisation » ou de « keyword stuffing ».

La question juridique qui se pose devant le juge sera donc de savoir si l’utilisation d’un terme commercial protégé, même fréquente, constitue une stratégie d’infringement au sens des lois sur les marques, et si cette utilisation est effectivement destinée à tromper les utilisateurs en tirant indûment parti de la notoriété d’une marque. Sur le plan technique, toutefois, il semble difficile d’étayer l’argument selon lequel la fréquence brute d’un mot‑clé serait la cause d’un succès de référencement.

Analyse méthodologique et limites des preuves présentées

Pour évaluer correctement des assertions fondées sur des mesures de contenus, il est indispensable d’examiner la méthode employée. Voici quelques points méthodologiques qui méritent d’être pris en compte :

  • Définition du périmètre — comparer l’intégralité d’un site multi‑service à un site mono‑service fausse la comparaison. Il faut normaliser par type de page (pages produits, pages d’accueil, landing pages dédiées).
  • Méthode de comptage — compter les occurrences peut varier selon que l’on considère le HTML complet, le texte visible, les attributs ALT des images, ou encore le contenu généré dynamiquement.
  • Échantillonnage temporel — les mentions peuvent fluctuer au fil du temps (annonces, pages temporaires, blog posts saisonniers). Une moyenne mensuelle sans précision sur la fenêtre temporelle demeure insuffisante.
  • Intention et pertinence — la présence du terme « WordPress » sur une page peut répondre à une logique éditoriale légitime (description du service, documentation), sans que cela traduise une volonté de tromper.
  • Contexte sémantique — les moteurs évaluent la qualité sémantique : l’utilisation naturelle d’un terme dans un contexte informatif est traitée différemment du bourrage artificiel de mots‑clés.
  • Signals complémentaires — backlinks, CTR organique, taux de rebond et autres mesures UX interviennent fortement dans le référencement et ne sont pas pris en compte par une simple comptabilisation d’occurrences.

En l’absence d’une méthodologie transparente et reproductible fournie par Automattic (filtres exacts, période d’analyse, définition des pages incluses), le graphique présenté a une valeur probante limitée.

Que peut décider un tribunal ?

D’un point de vue procédural et juridique, la question devant le juge ne sera pas uniquement technique ; elle mêlera droit des marques, preuves d’intention, et appréciation de la confusion du public. Les juges évaluent souvent :

  • La probabilité de confusion entre signes distinctifs ;
  • L’intention de l’utilisateur de la marque défendue (bonne foi vs. mauvaise foi) ;
  • La nature des produits et services et le canal de distribution (ici, l’environnement en ligne) ;
  • Le témoignage d’utilisateurs ou enquêtes de terrain prouvant la confusion effective ;
  • La proportionnalité des preuves techniques quant à la stratégie de référencement.

Techniquement, montrer qu’un site utilise fréquemment le terme « WordPress » n’établit pas nécessairement une stratégie illégale : il faut démontrer que cette utilisation vise à tirer un avantage déloyal en créant une confusion substantielle chez les consommateurs. Le simple constat d’une fréquence plus élevée, surtout si la méthodologie de comparaison est biaisée, suffira rarement à emporter la conviction d’un tribunal.

Recommandations pour une analyse plus rigoureuse

Si l’objectif est d’évaluer de manière fiable si une entreprise abuse d’un terme de marque pour améliorer son référencement et tromper les utilisateurs, voici une approche méthodologique plus robuste :

  • Définir un échantillon homogène de concurrents (mêmes types de pages, mêmes intentions de requêtes).
  • Utiliser des outils de crawl pour extraire le texte visible réellement indexé par les moteurs (rendre compte des pages incluses/exclues).
  • Préciser la période d’analyse et produire des séries temporelles plutôt qu’une moyenne statique.
  • Mener des tests d’utilisateurs (user testing) ou enquêtes de perception pour mesurer la confusion réelle.
  • Corréler présences lexicales et signaux de performance (trafic organique, positionnement, taux de clics) afin de démontrer un effet concret sur le référencement.
  • Documenter toute action marketing ou communication (annonces payantes, campagnes d’affiliation) qui pourrait expliquer l’usage accru d’un terme.

Adopter ce type d’approche fournit des preuves plus solides et reproductibles, utiles tant dans un débat public que devant un tribunal.

Conclusion

Les allégations portées par Automattic relatives au recours au SEO par WP Engine reposent sur deux idées principales : (1) la fréquence d’un mot sur un site influe directement sur le classement, et (2) WP Engine aurait utilisé le mot « WordPress » d’une manière délibérément trompeuse. Sur le premier point, la documentation et la pratique du référencement moderne contredisent l’idée que la simple fréquence brute d’un mot‑clé soit un facteur déterminant de classement. Sur le second, les données fournies par Automattic souffrent d’un biais de sélection des concurrents et d’un manque de transparence méthodologique.

En l’état, les éléments techniques présentés ne suffisent pas à démontrer de manière concluante qu’une stratégie d’infringement fondée uniquement sur la fréquence des mots‑clés a été mise en œuvre, ni qu’elle a produit un avantage significatif en termes de référencement. Reste à voir comment le tribunal appréciera l’ensemble des éléments, notamment les aspects juridiques liés à la protection des marques et la démonstration d’un préjudice réel.

Image à la une par Shutterstock/file404

Références