
Depuis la fin de l’année 2022, le débat sur la position de Google concernant les contenus générés par l’intelligence artificielle (IA) a suscité un vif intérêt dans le domaine du SEO. Jusqu’à présent, la position officielle de l’entreprise était claire : qu’il s’agisse de textes créés manuellement ou par IA, c’est la qualité du contenu qui prime, notamment conformément aux critères E-E-A-T (Expérience, Expertise, Autorité, et Fiabilité). Cependant, un changement de cap semble s’indiquer au début de cette année.
Google : nouvelles sanctions pour les contenus produits par IA
Lors d’une intervention au Search Central Live de Madrid, témoin l’intervention de la spécialiste SEO Aleyda Solís, John Mueller, responsable des relations avec Google Search, a souligné une évolution significative : « La note la plus basse sera attribuée si la majorité du contenu principal de la page (texte, images, audio, vidéos, etc.) est copié, reformulé, généré automatiquement ou produit par une IA, ou s’il provient d’autres sources avec peu d’efforts, peu d’originalité, et peu ou aucune valeur ajoutée pour les internautes. » Cette annonce marque un tournant par rapport à l’énoncé d’origine de Google, qui affirmait que l’utilisation de l’IA n’influençait pas les classements.
Le document Search Quality Evaluator Guidelines, mis à jour le 23 janvier 2025, confirme également cette nouvelle approche. Il y est stipulé que « le contenu provenant d’une seule page ou de plusieurs sites, résumé, reformulé ou paraphrasé par des humains ou des outils d’IA générative » est maintenant considéré comme « contenu copié ou paraphrasé ». Néanmoins, l’intention de Google reste équilibrée, le document précisant : « L’utilisation exclusive d’outils d’IA générative ne détermine pas le niveau d’effort ni l’évaluation de la qualité de la page. Ces outils peuvent produire des contenus de qualité variable. »
Les méthodes de détection des textes générés par l’IA par Google
Mais comment Google parvient-il à identifier qu’un texte a été créé par une intelligence artificielle, surtout quand aucun outil de détection n’est parvenu à obtenir des résultats fiables à 100 % ? Le moteur de recherche laisse entrevoir quelques indications dans ses documents. Les sites présentant les éléments suivants sont signalés :
- Des incohérences entre le contenu et les mentions légales : Par exemple, une page peut se présenter comme un guide à destination des parents, tandis que les conditions d’utilisation indiquent qu’il s’agit d’une initiative pour les amateurs d’IA.
- Une absence de transparence quant à la provenance du contenu : Certains sites affirment que certains articles sont générés (ou partiellement) par une IA sans indiquer lesquels. Ce manque de clarté peut diminuer la confiance de Google dans l’ensemble des contenus.
- Une finalité déclarée experte : Lorsqu’un site annonce que son contenu est publié à des fins de recherche ou de démonstration, cela soulève des doutes quant à sa pertinence pour un public plus large. Le même point s’applique aux sites qui reconnaissent que les informations peuvent contenir des inexactitudes ou qu’elles ne sont pas actualisées.
- Des auteurs fictifs ou trompeurs : Certains sites recourent à des profils inventés ou générés par IA (photos, biographies, identités) pour donner l’impression que les contenus sont rédigés par de véritables personnes. Cette technique peut être perçue comme trompeuse.
- Des indices textuels révélateurs d’une production automatisée : Certaines pages affichent des phrases typiques des textes rédigés par des IA, comme « En tant que modèle de langage… » ou des références à des dates limites d’accès aux informations (clairement : données limitées à septembre 2021). Cela indique une production automatisée avec peu ou pas d’interférence humaine.
Répercussions de l’approche de Google envers l’IA sur les sites web
Google ne remet pas en cause l’utilisation de l’IA en soi, mais il a compris que les outils d’IA générative peuvent contribuer à la création de contenus de faible qualité. Le Search Quality Evaluator Guidelines précise ainsi qu’est particulièrement pénalisée « l’utilisation d’outils automatisés (IA générative ou autres) pour produire, avec peu d’effort, un grand volume de pages apportant peu ou pas de valeur ajoutée aux utilisateurs, en comparaison avec d’autres contenus similaires en ligne. »
Le moteur de recherche semble concentrer ses efforts sur les sites principalement, voire totalement, construits par l’intelligence artificielle et dont les contenus n’offrent pas une réelle valeur ajoutée pour le lecteur. Les critères de sanction suggèrent même que seuls les usages les plus extrêmes, qui ne comportent presque aucune forme d’interaction humaine, seront désavantagés. En revanche, une IA utilisée pour créer un texte utile ne devrait pas être pénalisée, du moins pour le moment.
