Ben DAVAKAN

Vous êtes au bon endroit pour concrétiser vos ambitions sur le web. Parlons-en dès maintenant.

le véritable fonctionnement de Google Discover

le véritable fonctionnement de Google Discover

le véritable fonctionnement de Google Discover

le véritable fonctionnement de Google Discover

Sommaire

Ce texte repose principalement sur la fuite d’informations provenant de Google et correspond à mon observation des contenus qui performent durablement dans **Discover**. J’ai extrait ce que je considère comme les **proxies** les plus significatifs et les ai regroupés selon un flux logique qui reflète le fonctionnement probable du système.

Les opinions exprimées ici sont personnelles.

En bref

  1. Votre site doit être perçu comme une « source fiable » avec un niveau de **SPAM** suffisamment bas, évalué par des indicateurs comme le **publisher_trustScore**, pour être éligible à **Discover**.
  2. Le fonctionnement de **Discover** suit une chaîne en six étapes, reposant sur le ratio **bonne vs mauvaise interaction** (longs temps de lecture vs pogo-sticking) et les **visites répétées** pour noter puis renoter la qualité du contenu en continu.
  3. Le contenu récent reçoit un coup de pouce initial. Le succès dépend d’un **CTR** performant et d’une **engagement initial positif** (les bons clics et partages provenant de tous canaux comptent, pas seulement de Discover).
  4. Les éléments en phase avec les centres d’intérêt d’un utilisateur sont favoris. Pour optimiser, concentrez-vous sur vos zones d’**autorité thématique**, soignez vos titres, adoptez une approche centrée sur les entités et utilisez des images larges (1200px+).
Image Credit: Harry Clarkson-Bennett

J’identifie une quinzaine de **proxies** que Google utiliserait pour satisfaire la soif de contenus des utilisateurs dans le fil **Discover**. Le mécanisme n’est pas fondamentalement différent de celui de la recherche traditionnelle, même si l’expérience utilisateur et les attentes sont très distinctes.

La recherche traditionnelle est un canal d’**attraction** (« pull ») — l’utilisateur va chercher une réponse — alors que **Discover** est un canal de **poussée** : il expose des contenus à un utilisateur qui navigue passivement, souvent en train de tuer le temps. Ces deux mondes coexistent au sein du même écosystème Google, mais leurs mécanismes de réussite sont différents.

Voici comment tout cela fonctionne, étape par étape.

Image Credit: Harry Clarkson-Bennett

Les directives officielles de Google pour Discover

Cette partie est assez technique et les consignes officielles de Google relatives à l’éligibilité restent volontairement générales :

«…Discover utilise de nombreux signaux et systèmes employés par la Recherche pour déterminer ce qui est… contenu utile, fiable et centré sur les personnes

Google conseille des pratiques basiques mais essentielles : des titres pertinents (accrocheurs sans être trompeurs), une image à la une d’au moins **1200 pixels** de largeur et la production de contenus opportuns qui apportent une valeur ajoutée.

Cependant, ces recommandations générales laissent une large part d’interprétation. Voici un décodage plus concret de ce que nous savons ou supposons.

La chaîne en six étapes de Discover

Du moment où un article est publié jusqu’à sa disparition du fil, voici le modèle en six étapes qui décrit comment **Discover** pourrait sélectionner, tester, évaluer et renouveler les contenus. Ces étapes sont des regroupements conceptuels basés sur les éléments révélés par la fuite et par l’observation du comportement du produit.

  1. Vérification d’éligibilité et filtrage de base
  2. Exposition initiale et phase de test
  3. Évaluation par la qualité utilisateur
  4. Boucle d’engagement et rétroaction
  5. Couche de personnalisation
  6. Cycles de déclin et de renouvellement

Vérification d’éligibilité et filtrage de base

Première condition : votre site doit être considéré comme **éligible** pour apparaître dans **Discover**. Concrètement, cela signifie être perçu comme une **source fiable** sur le sujet et maintenir un score de **SPAM** bas pour ne pas franchir les seuils de déclassement.

Trois indicateurs principaux semblent piloter cette étape :

  • is_discover_feed_eligible : attribut booléen indiquant si une page peut ou non être considérée pour le fil.
  • publisher_trustScore : note évaluant la fiabilité et la réputation de l’éditeur.
  • topicAuthority_discover : score mesurant l’autorité du site par sujet.

Ces métriques permettent d’établir une base : sont-ce des domaines et des pages dignes de confiance pour être exposés dans un environnement où l’utilisateur vient naviguer sans intention explicite ?

Exposition initiale et phase de test

Lorsqu’un contenu est récent, il reçoit un **boost de fraîcheur** qui le met temporairement sous les projecteurs. L’idée : tester rapidement sa capacité à générer un intérêt réel avant de l’intégrer plus profondément dans le fil.

  • freshnessBoost_discover : amplification temporaire de la visibilité pour le contenu récent.
  • discover_clicks : comptage des clics initiaux servant d’indicateur de popularité.
  • headlineClickModel_discover : modèle prédictif du CTR basé sur le titre et l’image.

Il est probable que Google applique un modèle de type bayésien pour estimer le CTR attendu d’un article en se basant sur les performances historiques du domaine, d’un sous-dossier, ou d’un auteur. Plus un site a publié de contenus de qualité dans une niche, plus les prédictions deviennent précises.

En pratique, ça signifie qu’un bon historique éditorial dans une thématique donnée facilite la découverte de nouveaux contenus de cette même thématique.

Évaluation par la qualité utilisateur

Après le test initial, la mesure la plus déterminante est l’évaluation par l’utilisateur. Google utilise des modèles comparables au système dit de « bonne vs mauvaise interaction » (good vs bad clicks) pour juger si une page satisfait réellement les visiteurs.

Les signaux déterminants incluent :

  • discover_blacklist_score : pénalités appliquées aux contenus jugés spammy, trompeurs ou clickbait.
  • goodClicks_discover : interactions positives (longs temps de lecture, navigation vers d’autres pages).
  • badClicks_discover : interactions négatives (rebonds rapides, très court dwell time).
  • nav_boosted_discover_clicks : métrique des visites répétées ou du retour, indicateur de satisfaction durable.

En résumé : un bon titre seul n’est pas suffisant. Si le titre attire mais que la lecture est courte (pogo-sticking), le contenu sera rapidement déclassé. Les visites répétées, les partages et les signaux hors Discover (réseaux sociaux, clics depuis Chrome) participent aussi à cette évaluation.

Des titres trop accrocheurs peuvent dégrader à la fois la perception des lecteurs et la crédibilité aux yeux des algorithmes (Image Credit: Harry Clarkson-Bennett)

Il est important de noter que les données de clic ne proviennent pas uniquement de **Discover**. Toutes les interactions — partages sociaux, clics via Chrome, etc. — enrichissent le modèle. Ainsi, générer des interactions de qualité dans les heures et jours qui suivent la publication augmente significativement les chances d’amplification.

Boucle d’engagement et rétroaction

Une fois qu’un article circule, il entre dans une dynamique d’itération : impressions, CTR, feedback explicite (je n’aime pas / ne m’intéresse pas) et autres métriques alimentent des modèles qui ajustent en temps réel la visibilité.

  • discover_impressions : nombre d’affichages d’un article dans les fils Discover.
  • discover_ctr : rapport clics/impressions, utilisé pour modéliser et comparer les titres et images.
  • discover_feedback_negative : retour utilisateur explicite qui peut réduire la distribution tant à l’échelle individuelle que collective.

Ces signaux comportementaux définissent la réussite d’un article. Le système apprend et s’améliore au fil du temps, en affinant la sélection pour des cohortes d’utilisateurs aux centres d’intérêt similaires.

Cette logique d’apprentissage est appliquée aussi bien à Discover qu’au cœur de l’algorithme de recherche de Google (Image Credit: Harry Clarkson-Bennett)

On peut supposer que Google stocke les combinaisons titre-image afin d’alimenter des modèles statistiques permettant de repérer plus vite ce qui fonctionne pour tel ou tel groupe d’utilisateurs.

Couche de personnalisation

Google dispose d’un volume considérable de données utilisateur et de signaux comportementaux : historique de navigation, interactions dans Chrome, préférences implicites et explicites. Cette richesse de données permet à **Discover** d’affiner fortement la personnalisation du fil.

  • contentEmbeddings_discover : représentations vectorielles du contenu permettant d’évaluer la proximité entre un article et les intérêts d’un utilisateur.
  • personalization_vector_match : module qui ajuste en temps réel la sélection en comparant le vecteur d’un contenu au vecteur d’intérêt utilisateur.

Plus un contenu est proche du profil d’intérêts d’un utilisateur ou d’une cohorte, plus il a de chances d’être remonté dans leur fil.

Pour voir des indices de cette personnalisation, il est possible de consulter la page d’engagement du site dans Chrome (chrome://site-engagement/) : elle donne un aperçu des interactions enregistrées par le navigateur et permet de comprendre certains points de contact techniques entre l’utilisateur et les pages.

Cycles de déclin et de renouvellement

La fraîcheur est un facteur clé pour Discover. Au fil du temps, le fil favorise des contenus récents et fait décroître la visibilité des sujets qui s’épuisent ou ne génèrent plus d’engagement.

  • freshnessDecay_timer : mécanisme mesurant la décroissance de visibilité suite à l’exposition initiale.
  • content_staleness_penalty : pénalités appliquées aux contenus qui deviennent obsolètes ou dont l’intérêt décline.

Le résultat : les contenus populaires peuvent rapidement saturer le marché et voir leur diffusion diminuer au profit de nouvelles publications. Cependant, certains contenus « evergreen » peuvent être actualisés et relancés, prolongeant ainsi leur cycle de vie.

Globalement, **Discover** s’apparente à un réseau social réinventé par Google : un espace où la personnalisation et la fraîcheur dictent l’ordre des choses, avec l’ambition évidente de retenir les utilisateurs plus longtemps sur ses propres produits.

Indice : garder l’utilisateur dans l’écosystème augmente les revenus (Image Credit: Harry Clarkson-Bennett)

Une méthode en 11 étapes pour tirer parti de Google Discover

Pour maximiser vos chances d’apparaître dans **Discover**, mieux vaut travailler méthodiquement sur la qualité, la cohérence et la promotion initiale de vos contenus. Voici une feuille de route structurée et pragmatique.

Avant tout, identifiez les thématiques où votre site détient déjà une forme d’**autorité thématique**. Pour cela, utilisez vos données Search Console (clics, impressions) et analysez les sous-dossiers ou auteurs qui génèrent le plus de trafic organique ou d’engagement. Des outils tiers comme Ahrefs peuvent compléter cette analyse via des rapports de part de voix.

Illustration : représentation de la part de voix (Image Credit: Harry Clarkson-Bennett)

En vous concentrant sur les thématiques où vous êtes déjà visibles et pertinentes, vous optimisez vos efforts et augmentez vos chances de succès sur Discover.

Voici la séquence recommandée :

  1. Respecter les exigences minimales pour les images. Assurez-vous que vos images principales respectent la contrainte de largeur minimale de **1200 pixels**. C’est un critère technique simple mais souvent négligé.
  2. Identifier vos zones d’autorité thématique. Analysez Search Console et vos indicateurs SEO pour repérer les sous-dossiers, auteurs et entités pour lesquels votre site obtient déjà de la visibilité. Concentrez vos ressources éditoriales sur ces segments.
  3. Investir dans du contenu qui apporte une véritable valeur. Priorisez les articles susceptibles de générer des liens, des partages et un engagement durable plutôt que de rechercher uniquement des clics instantanés. Le clickbait est contre-productif : il peut nuire à la réputation de votre site et déclencher un déclassement.
  4. Être connecté au cycle de l’actualité. La réactivité compte : être parmi les premiers à couvrir une information est un avantage. Si vous n’êtes pas le premier, apportez une analyse ou un angle additionnel qui enrichit le sujet.
  5. Adopter une approche centrée sur les entités. Mentionnez clairement les personnes, organisations et lieux dans le titre, le chapeau, les intertitres, les données structurées et les attributs ALT des images. La clarté sur l’objet du contenu réduit le risque que Google réécrive vos titres.
  6. Optimiser l’Open Graph title. Le titre OG — souvent utilisé par les réseaux sociaux — est fréquemment repris par Discover. Utilisez-le pour proposer une version plus attractive sans pour autant être trompeuse ; gardez la mention de l’entité principale.
  7. Partager rapidement sur des canaux push. Donnez au contenu une impulsion initiale en le diffusant sur des newsletters, réseaux sociaux et autres canaux. Si le contenu dépasse ses prévisions de partage et de lien, il a plus de chances de “décoller” dans Discover.
  8. Soigner l’expérience page. Pages rapides, connexion sécurisée (HTTPS), gestion publicitaire mesurée (pas d’interstitiels intrusifs) et mise en page claire favorisent des temps de visite plus longs et réduisent le taux de rebond.
  9. Favoriser des parcours utilisateurs de qualité. Réfléchissez à la manière dont les lecteurs venant de Discover peuvent être guidés vers d’autres contenus pertinents sur votre site. Des suggestions contextualisées basées sur le temps de lecture ou la profondeur de scroll peuvent prolonger les sessions.
  10. Monétiser/prioriser des conversions simples. Les visiteurs provenant de Discover sont souvent passifs : privilégiez des conversions légères (inscription simple, pages vues additionnelles) plutôt que des processus complexes avant d’avoir gagné leur attention.
  11. Conserver et relancer vos meilleurs contenus. Tenez un registre des contenus qui performent bien. Les articles evergreen peuvent être mis à jour et republicés pour relancer leur visibilité et bénéficier à nouveau du **freshnessBoost_discover**.

Remarque : si vous anticipez qu’un contenu va générer, par prédiction, 3 partages et 2 liens, mais que vos efforts marketing lui permettent d’obtenir 7 partages et 9 liens, les modèles considéreront probablement ce contenu comme supérieur aux attentes et l’algorithme pourra lui réserver une distribution plus large.

Autrement dit, la promotion initiale joue un rôle déterminant : il s’agit de générer des signaux de qualité tôt dans le cycle de vie du contenu pour convaincre les modèles que le contenu mérite un éventuel amplificateur Discover.

Ressources complémentaires :


Article original publié sur Leadership in SEO.


Image à la une : Roman Samborskyi/Shutterstock