Pendant que tout le lanterneau numérique s’émouvait du sort d’OpenAI et du faux départ de Sam Altman, Google avance sur son projet Gemini qui se veut le concurrent direct de GPT 4. L’année dernière, à la même époque, au moment de la sortie de ChatGPT, un vent de panique a soufflé chez le géant américain, le contraignant à sortir dans la précipitation son propre chatbot BARD. Ce fut un beau plantage. Déjà en France, il était inaccessible si on n’avait pas de VPN mais en plus les résultats donnés étaient loin de donner satisfaction. Bref la course à l’échalote avait bel et bien commencé.
Tout ça, c’est bien beau mais en vérité, personnellement, je me fiche bien de savoir qui aura le LLM le plus performant, tellement on ne se pose pas la question du est-ce bien raisonnable ? Aussi, je me suis demandée ce qui nous attachait encore à Google (plus ou moins) : la réponse est assez claire et limpide : son moteur de recherche.
En novembre 2020, je m’étais déjà penchée sur la stratégie de Google dans un numéro de Futuromium intitulé “La voix sous cloche” dans lequel je m’intéressais au futur développement du moteur de recherche et notamment à la recherche conversationnel. Je me doutais déjà à l’époque que ce ne serait guère glorieux pour un tas de raisons.
J’avais jusqu’alors un usage très professionnel de Google. Pour ma veille et mes recherches, c’était un outil indispensable. Mais depuis maintenant, deux ans, je constate une perte de qualité dans les résultats de recherche. Et même en étant une pro du dorking, c’est de plus en plus difficile d’avoir des résultats pertinents.
Je me suis donc demandée (oui, je me pose beaucoup de questions) si cette impression de perte de qualité était un constat totalement subjectif de ma part ou bien si d’autres personnes partageaient ce même sentiment. J’ai donc lancé sur Mastodon un petit sondage auquel 224 personnes ont répondu et là, les résultats sont sans appel, à 77% les personnes interrogées considèrent que les performances de Google se sont dégradées.
De par et d’autres de l’Atlantique, on considère donc que les résultats de Google ne sont de moins en moins pertinents. Considéré encore comme un outil exceptionnel, il y a peu, je me suis donc penchées sur les raisons d’une telle dégradation.
Premiers constats
Google s’est en fait amélioré pour les requêtes simples comme « l’âge de Paul Newman » (grâce aux « réponses rapides »), mais il n’est pas bon pour les recherches complexes, comme chercher des réponses à des questions scientifiques complexes.
Malheureusement, il m’est impossible de déterminer avec précision la période où les recherches sur Google ont été les plus fructueuses. J’ai le sentiment qu’entre 2008 et 2013, la plupart des résultats de recherche correspondaient à la requête et que Google était agréable à utiliser. Mais même à cette époque, certains des problèmes décrits ci-dessous se posaient déjà.
Les années 2014 à 2019 ont également été assez bonnes (mais les problèmes sont devenus de plus en plus fréquents). Ces dernières années, quelque chose de vraiment anormal s’est produit. Cela est devenu particulièrement évident à partir de l’hiver 2022-2023, lorsque les résultats contenaient trop de texte généré par l’IA.
Mais l’objectif principal de cet article n’est pas de déterminer à quel moment Google a commencé à mal chercher, mais de préciser les problèmes et de suggérer des solutions possibles.
Les problèmes rencontrés
Une qualité des résultats qui baisse
Dernièrement, Google a commencé à afficher de plus en plus de résultats qui n’ont rien à voir avec la requête de recherche (ou qui ne sont pas pertinents d’après l’extrait de texte qui apparaît sur la page principale des résultats).
Si la requête est très spécialisée et qu’il y a peu de résultats pour celle-ci, il se peut même qu’il n’y ait que 1 ou 2 résultats pertinents pour l’ensemble des résultats.
Essayez par exemple de faire une simple recherche comme ceci “nomdefamille*mail.com” et il est fort possible que dans les résultats de recherche, un ou deux soient réellement pertinents.
Google ne comprend plus les requêtes longues et complexes
Sur certains groupes de discussions spécialisés dans la veille et la recherche, on peut trouver parfois des exemples de requêtes de recherche d’utilisateur.ices qui fonctionnaient auparavant. Par exemple, si vous étiez un passionné de vieilles voitures, à la question « Où se trouve le circuit de minuterie de la pompe de lave-glace de la simca 1000 ? », Google donnait une série de résultats satisfaisants, il y a quelques années, mais aujourd’hui, c’est comme si le moteur de recherche avait cessé de la comprendre.
Plus il y a de mots dans une requête, moins Google est performant. Il y a 10 ans, les requêtes longues fonctionnaient beaucoup mieux.
Les filtres augmente l’effet bulle
Si vous vous connectez constamment au moteur de recherche avec votre compte Google, vous créez de facto un historique de vos recherches.
Les résultats dépendent non seulement de la requête en cours, mais aussi de toutes les requêtes que vous avez saisies depuis la création du compte.
L’impact de la localisation de l’utilisateur.ice est également devenu.e beaucoup plus puissant. J’ai récemment constaté que lorsque je cherche un salon de coiffure sur le lieu de résidence de mes vacances, même si j’ajoute le nom de la ville au nom du salon de coiffure, les résultats affichent toujours les salons de coiffure qui se trouvent près de chez moi, mais pas dans la ville correspondante.
Le référencement généré par l’IA, future plaie
Il s’avère que la seule chose qui soit pire que les textes de référencement, ce sont les textes de référencement générés par l’IA.
Un grand nombre de textes rédigés dans le seul but de vendre quelque chose et contenant de fausses informations seront injustement placés en tête des résultats de recherche.
Parfois, ces textes seront combinés avec 3 à 5 publicités Adsense sur une même page, ce qui sera absolument frustrant et contre-productif.
Que faire ?
J’ai mentionné ci-dessus rapidement le dorking. Pour un.e spécialiste de l’OSINT (Open Source Intelligence), le dorking est une méthode de recherche très appréciée, il s’agit, en fait, d’aller à la pêche aux informations sensibles via les moteurs de recherche. Cela passe par l’utilisation de requêtes très spécifiques propres à chaque moteur (vous pouvez faire du DuckDuckGo dorking, si vous utilisez ce moteur de recherche).
Un des dorking le plus utilisé et le plus connu est l’expression exacte.
Les moyens les plus efficaces, à mon avis, pour améliorer les résultats de recherche de Google seraient une combinaison de l’utilisation des guillemets et de l’opérateur intitle : (recherche par titre de page).
intitle:”simca 1000”
Cette requête cherchera toutes les pages web qui ont pour titre Simca 1000.
Si vous désirez vous débarasser des pages optimisées pour le référencement naturel, rajoutez par exemple un réseau social pour restreindre votre recherche.
intitle:”simca 1000” site:reddit.com
Ici, vous demandez à Google de vous donner comme résultats que les pages titrés Simca 1000 mais que sur reddit.com (et ça marche aussi pour Facebook, Twitter, etc.)
Contourner la géoloc’
Il peut être très utile de sortir de la bulle de filtre pour améliorer la qualité de vos résultats de recherche. Pour commencer, vous pouvez simplement utiliser le mode incognito de votre navigateur et certains services pour modifier votre localisation et votre langue, comme isearchfrom.
Tester d’autres moteurs de recherche
Même si Google est un incontournable pour tout veilleur professionnel qui se respecte, il existe une multitude d’autres moteurs de recherche. Qui plus est, certains sont spécialisés, et notamment les moteurs de recherche par IP/nom de domaine. Ils ont l’avantage de ne pas vous encadrer dans un quelconque filtrage et les résultats sont pour le coup bruts de décoffrage (tentez par exemple le moteur Netlas).
De même, n’hésitez pas à vous servir du moteur d’archive.org ou des librairies de l’ombre qui vous permettent de récupérer des données archivées ou non accessibles pour le grand public.
En conclusion
La recherche sur Internet est affaire souvent d’ingéniosité et de créativité. Se contenter uniquement des moteurs de recherche généralistes peut s’avérer parfois frustrant. Et il est clair que Google n’est plus aussi déterminant et central qu’aupravant. La dégafamisation passe naturellement par moins utiliser ce moteur de recherche, voire à s’en passer.
Vous pourriez être tenté de passer désormais uniquement par les assistants comme ChatGPT ou d’autres. Je vous le déconseille fortement, tant leurs résultants sont souvent mauvais quand ils ne disent pas n’importe quoi.