Robby Stein, vice‑président produit pour Google Search, a récemment donné une interview où il a expliqué comment AI Mode gère la qualité, la façon dont Google mesure l’utilité des réponses et comment l’expérience acquise avec la recherche classique sert à repérer le contenu réellement utile (parmi d’autres signaux comme les clics). Il a également détaillé cinq facteurs liés au SEO qui restent déterminants pour le fonctionnement du AI Mode.
Comment Google réduit les risques d’« hallucinations »
Lorsqu’on évoque les hallucinations — c’est‑à‑dire des réponses inventées ou inexactes par un modèle d’IA — Robby Stein souligne que les mécanismes de contrôle de la qualité dans AI Mode s’appuient largement sur ce que Google a appris en plus de deux décennies avec la recherche traditionnelle. Les critères qui guident le choix des liens et l’évaluation du caractère utile d’un contenu sont intégrés au raisonnement du modèle et s’appuient sur l’expérience de la recherche classique plutôt que d’être une refonte complète partant de zéro.
L’intervieweur a demandé :
« Ces modèles sont non déterministes et peuvent parfois produire des réponses erronées… comment vous prémunissez‑vous contre cela ? Comment garantissez‑vous que l’expérience de recherche Google reste constante et de haute qualité ? »
Robby Stein a répondu (paraphrase) :
« Ce problème n’est pas inédit. Même si la génération de contenu par IA est récente à grande échelle, la réflexion sur des systèmes de contrôle de l’information existe depuis vingt‑cinq ans.
Les systèmes d’IA sont construits par‑dessus ces bases. Nous adoptons une démarche rigoureuse pour savoir, pour une requête donnée, si l’information renvoyée est valable, si les liens proposés sont pertinents et s’ils correspondent aux besoins d’un utilisateur.
Tous les signaux et les données disponibles pour identifier ce qu’il convient d’afficher sont intégrés dans le modèle et dans la façon dont celui‑ci utilise Google Search comme outil de recherche d’information.
Le système tire parti de cet héritage ; il ne repart pas de zéro. Par exemple, si quelqu’un recherche des restaurants dans un quartier, nous savons déjà quels types de ressources ont été utiles historiquement et nous pouvons les proposer directement.
Avec le temps, les modèles se sont aussi améliorés pour mieux suivre des instructions. On peut définir des primitives et des règles de conception — ce qu’il faut faire ou éviter — et le modèle les applique généralement bien, même s’il commet parfois des erreurs. Globalement, la qualité du modèle a suffisamment progressé pour réduire la fréquence de ces défaillances. »
Cette explication montre que AI Mode est conçu pour « s’ancrer » dans les mêmes signaux de qualité, de pertinence et de confiance qui ont guidé la recherche classique pendant des décennies. La gestion des hallucinations passe donc par une combinaison : encodage des heuristiques historiques, utilisation de sources jugées fiables et contrainte de raisonnement qui oriente le modèle vers des réponses fondées plutôt qu’autonomes.
Comment Google mesure l’utilité dans AI Mode
La question suivante de l’interview portait sur les signaux concrets utilisés par Google pour déterminer si une interaction avec AI Mode est réellement satisfaisante pour l’utilisateur. Robby Stein indique que l’approche n’a pas changé de principe : elle combine évaluations humaines, retours explicites et mesures comportementales en ligne pour estimer la utilité.
L’intervieweur a demandé :
« À mesure que la recherche évolue et que les résultats deviennent plus dynamiques, quels signaux regardez‑vous pour vérifier que l’utilisateur obtient non seulement ce qu’il souhaite, mais aussi la meilleure expérience possible ? »
Robby Stein a répondu (paraphrase) :
« Nous utilisons une batterie de métriques. Nous étudions d’abord l’utilité via des évaluations humaines réalisées hors ligne : des personnes jugent la qualité des réponses.
En parallèle, nous observons les réponses en conditions réelles : les retours explicites (pouces levés/baissés), mais aussi des signaux comportementaux — est‑ce que les utilisateurs consultent l’information, l’utilisent, reviennent ?
On triangule entre ces différents éléments parce qu’un seul indicateur peut être trompeur. Par exemple, l’usage élevé d’un produit peut parfois résulter d’un mauvais fonctionnement plutôt que d’une satisfaction — les gens l’utilisent plus parce qu’ils doivent répéter leur recherche.
Dans la recherche, nous suivons des métriques spécifiques qui détectent quand des utilisateurs reviennent sans avoir trouvé de réponse satisfaisante pour une même requête, ce qui est un signe d’échec.
En combinant tests humains, retours directs et comportements d’usage, nous estimons mieux si ce que nous proposons est réellement utile. »
L’essentiel de cette réponse est que l’utilité n’est pas inférée à partir d’un seul signal superficiel, comme le volume de requêtes ou le temps passé. Google tient compte d’évaluations qualifiées, de feedbacks explicites et d’indicateurs comportementaux permettant de repérer la friction (par exemple des tentatives répétées pour la même requête). Cette méthodologie assure une continuité entre les standards de la recherche classique et ceux appliqués dans AI Mode.
Pourquoi la combinaison de signaux est nécessaire
Un indicateur isolé peut conduire à des conclusions erronées :
- Une forte fréquence d’utilisation peut signifier qu’un outil est pratique, ou au contraire qu’il oblige l’utilisateur à reformuler sans cesse sa demande.
- Des « likes » ou des retours positifs peuvent être biaisés par la formulation d’une réponse plutôt que par sa véracité ou sa profondeur.
- Les évaluations humaines permettent de juger la qualité intrinsèque, mais elles sont coûteuses et ne reflètent pas toujours l’échelle du comportement réel.
En croisant ces éléments, Google obtient une image plus robuste de l’expérience utilisateur et peut ajuster les modèles et les critères de classement en conséquence.
Cinq signaux de qualité pour la recherche assistée par IA
En réponse à une question sur le classement du contenu généré ou aidé par l’IA et sur la pertinence des bonnes pratiques SEO, Robby Stein a listé cinq facteurs principaux qui aident à déterminer si une page répond aux standards de qualité et d’utilité pour une requête donnée.
Robby Stein a expliqué (paraphrase) :
« Le modèle commence par comprendre la requête et en déduire l’intention. Il génère ensuite un éventail de requêtes connexes (des dizaines) évoquant ce que les internautes demandent souvent — c’est une forme de recherche sous‑jacente permettant d’identifier ce qui a été utile pour d’autres.
Il existe une forte continuité avec le travail de qualité réalisé depuis vingt‑cinq ans : est‑ce que ce contenu porte bien sur ce sujet ? Est‑ce que les gens l’ont trouvé utile pour cette question ?
En résumé, les mêmes principes s’appliquent. Voici les points essentiels :
- Est‑ce que votre contenu répond directement à la question de l’utilisateur ?
- Est‑ce qu’il est de **haute qualité** ?
- Est‑ce qu’il se **charge rapidement** ?
- Est‑ce qu’il est **original** ?
- Est‑ce qu’il **cite des sources** ?
Si les gens cliquent sur ce contenu, l’estiment utile et y reviennent, il sera bien positionné pour la requête, y compris dans l’univers AI. »
Ci‑dessous, nous décomposons et approfondissons chacun de ces cinq éléments et leur portée pour les éditeurs et les créateurs de contenu.
1. Réponse directe à l’intention de recherche
Le premier critère est la capacité d’un contenu à fournir une réponse claire et pertinente à la question initiale de l’utilisateur. Cela signifie :
- Comprendre l’intention : informationnelle, transactionnelle, navigationnelle ou locale.
- Structurer la réponse pour que l’information principale soit visible sans dilution (résumé, points clés, encadrés explicatifs).
- Anticiper les sous‑questions courantes et y répondre, soit dans le corps de la page, soit via des sections complémentaires.
Pour AI Mode, qui effectue une « recherche sous‑jacente » en optimisant et en élargissant la requête, il est essentiel que la page cible corresponde aux variantes et aux angles que le modèle génère automatiquement. Plus le contenu couvre l’intention et les expressions associées, plus il a de chances d’être reconnu comme pertinent.
2. Contenu de haute qualité
La qualité englobe la précision factuelle, la profondeur de l’analyse, la clarté rédactionnelle et l’aptitude à offrir une valeur ajoutée par rapport aux autres pages sur le même sujet. Des éléments concrets :
- Informations vérifiables, à jour et sourcées.
- Structure logique : titres cohérents, paragraphes lisibles, résumés.
- Rédaction professionnelle et ton adapté au public cible.
- Absence d’erreurs factuelles ou de formulations trompeuses.
Google continue d’accorder une place centrale à ces qualités lorsque le modèle évalue les pages candidate au classement, tant pour la recherche classique que pour le AI Mode.
3. Performance technique : temps de chargement et expérience
Le troisième signal concerne les aspects techniques : un contenu doit se charger rapidement et offrir une expérience utilisateur fluide. Les critères incluent :
- Temps de chargement (Core Web Vitals et autres métriques).
- Compatibilité mobile et ergonomie.
- Absence de pop‑ups intrusifs et navigation claire.
Un site lent ou difficile à utiliser réduira la satisfaction des visiteurs et enverra des signaux négatifs qui peuvent pénaliser son positionnement, y compris dans les scénarios où l’IA référence le contenu.
4. Originalité du contenu
L’originalité reste un critère majeur : le contenu doit apporter une perspective, une synthèse, des données ou un angle qui n’est pas simplement dupliqué ailleurs. Pour les systèmes d’IA, distinguer le caractère original permet d’éviter de promouvoir des répétitions ou des agrégations peu utiles.
L’originalité se manifeste par :
- Expériences propres, études de cas, analyses exclusives.
- Valeur ajoutée éditoriale (ex : guides approfondis, méthodologies).
- Formats originaux (visualisations, extraits, démonstrations interactives) qui enrichissent la compréhension.
5. Citer des sources et référencer
La citation de sources fiables renforce la crédibilité et facilite la vérifiabilité. Pour AI Mode, qui tente de s’appuyer sur des ressources éprouvées, les pages qui référencent correctement leurs sources sont plus susceptibles d’être jugées utiles et dignes de confiance.
Pratiques recommandées :
- Inclure des références précises (liens vers études, données officielles, sources primaires).
- Expliquer l’origine des informations et les éventuelles limites.
- Indiquer la date de mise à jour pour montrer la fraîcheur des données.
Conséquences pratiques pour le SEO
Les cinq signaux ci‑dessus confirment que les bonnes pratiques SEO traditionnelles restent pertinentes : répondre à l’intention, produire du contenu de qualité, optimiser la vitesse et l’expérience, créer de l’originalité et sourcer correctement. Quelques observations supplémentaires :
- Le AI Mode peut explorer plusieurs variantes de la requête ; couvrir ces variantes dans un contenu augmente les chances d’apparaître comme ressource utile.
- L’impact des clics et des mesures comportementales demeure : un contenu qui attire, retient et satisfait les visiteurs envoie des signaux positifs.
- Le simple fait de générer du texte avec une IA ne suffit pas ; l’apport humain (vérification, structure, sources) reste décisif.
Que signifie tout cela pour les éditeurs et créateurs de contenu ?
La synthèse à retenir est simple mais exigeante : l’arrivée de systèmes comme AI Mode ne supprime pas l’importance du travail éditorial sérieux. Au contraire, elle renforce la nécessité de produire des contenus :
- qui répondent précisément aux besoins des utilisateurs,
- qui sont fondés sur des informations vérifiables,
- qui offrent une expérience technique irréprochable,
- et qui apportent une valeur distincte par rapport à la concurrence.
Les éditeurs bénéficieront d’une approche mixte : utiliser des outils d’IA pour la productivité tout en appliquant une relecture humaine stricte, des validations factuelles et un soin particulier à la structuration et au référencement technique. L’objectif est d’être reconnu par les signaux historiques de qualité et d’utilité que Google continue d’affiner.
Surveillance et amélioration continue
Comme l’a noté Robby Stein, l’évaluation est un processus continu. Les équipes mesurent régulièrement :
- les métriques d’engagement (taux de rebond, durée de session, conversions indirectes),
- les retours utilisateurs (feedbacks explicites sur les réponses IA),
- et les évaluations humaines à grande échelle pour recalibrer les modèles.
Cela signifie qu’une stratégie de contenu effective inclura un volet de mesure pour détecter les points de friction, tester différentes formulations et actualiser les pages en fonction des retours réels.
Résumé des points clés
Pour récapituler :
- AI Mode s’appuie sur l’expérience historique de Google Search pour minimiser les hallucinations et promouvoir des réponses fiables.
- L’utilité est mesurée via une combinaison d’évaluations humaines, de feedbacks explicites et d’indicateurs comportementaux ; un seul signal isolé n’est pas suffisant.
- Cinq signaux de qualité demeurent essentiels : réponse directe, qualité éditoriale, performance technique (chargement rapide), originalité et citation de sources.
- Les bonnes pratiques SEO restent valables : produire des contenus utiles, bien structurés, vérifiables et techniquement optimisés.
Related : Google’s AI Mode: What We Know & What Experts Think
Regardez l’interview à partir d’environ 1h23 :
En conclusion, l’intégration de l’IA dans les interfaces de recherche ne change pas les fondamentaux : les systèmes cherchent toujours à identifier et à valoriser les contenus qui sont réellement utiles et fiables pour les utilisateurs. Les éditeurs qui privilégient la rigueur, la transparence des sources, l’originalité et l’expérience utilisateur conservent un avantage, que la recherche soit traditionnelle ou assistée par IA.
Articles connexes
- Il est temps de mesurer concrètement la pertinence quand on parle de « trafic pertinent »
- entre enjeux récents et nouvelles possibilités, l’éclairage de Conserto
- Google met en place un balisage structuré pour les conditions de livraison des marchands
- Comment mettre en pratique, de manière concrète, les critères E‑E‑A‑T de Google ?
- ChatGPT juge un site à partir de seulement quelques pages Autres options : – ChatGPT évalue un site sur la base de quelques pages seulement – ChatGPT se fait une opinion d’un site d’après quelques pages seulement
- adapter ses contenus aux réponses de l’intelligence artificielle : les conseils de Microsoft
- À NESS 2025 : comment faire face à l’ère dominée par l’IA
- Impact des données structurées sur l’intelligence artificielle et la visibilité dans les recherches pilotées par l’IA
