Les moteurs de recherche sont notre porte d’entrée sur le web. Mais savez-vous correctement les utiliser ? Identifiez-vous quelle(s) partie(s) d’Internet ils interrogent, ou comment sont organisés les résultats que vous obtenez ? Savez-vous qu’il existe une multitude de moteurs de recherche web (et pas seulement Google), et quelles sont leurs spécificités ?
Afin de vous permettre de perfectionner l’utilisation de ces outils du quotidien pour vos recherches d’information, nous débutons dans ce numéro une nouvelle série consacrée aux moteurs de recherche.
Moteur de recherche : de quoi parle-t-on ?
Selon Wikipédia, « Un moteur de recherche est une application web permettant à un utilisateur d’effectuer une recherche en ligne (ou recherche internet), c’est-à-dire de trouver des ressources à partir d’une requête composée de termes. »
Les ressources accessibles via un moteur de recherche sont variées : on peut accéder à des sites internet, blogs, forums, wikis, mais aussi à des images, vidéos, fichiers, applications, ainsi qu’à des bases de données, catalogues, métamoteurs…
Il existe différents types de moteurs de recherche. Ceux qui vont nous intéresser aujourd’hui sont les moteurs que nous utilisons au quotidien, les moteurs de recherche web. Il en existe un grand nombre, mais le plus utilisé (hors Asie) est de très loin Google, installé par défaut sur la plupart des navigateurs (source : Wikipédia).
Pour autant, d’autres moteurs de recherche web trouvent peu à peu leur public, en se positionnant sur certains aspects. C’est le cas de moteurs de recherche web dits « écologiques et solidaires », comme Ecosia ou Lilo : ces moteurs reversent une partie des revenus générés par la publicité et la revente de données à des causes écologiques, sociales ou humanitaires. En plus de leur engagement, ces moteurs rendent lisibles le principal business model des moteurs de recherche actuels, basé sur de la publicité et la revente de données générées en les interrogeant.
Il est également important d’identifier une catégorie de moteurs de recherche web engagés dans la protection des données personnelles des utilisateurs, comme Duck duck go, Qwant ou Startpage. Leur philosophie est de préserver la vie privée et de ne stocker aucune information personnelle (adresses IP et traces numériques comme la signature du navigateur), tout en assurant une neutralité dans l’affichage des résultats (à l’inverse de la personnalisation des résultats proposée par Google et son « expérience utilisateur »).
Quelques moteurs de recherche web
Les plus répandus (adossés à des grosses entreprises) | Google (Google) Bing (Microsoft) Yahoo! (Verizon Média) |
|
Moteurs écologiques et solidaires (reversant une partie de l’argent généré par les recherches à des causes) | Lilo Ecosia |
|
Moteurs engagés dans la protection des données personnelles des utilisateurs |
Duck duck go Qwant Startpage |
Certains de ces moteurs sont des métamoteurs, c’est-à-dire qu’ils ne possèdent pas leur propre système d’exploration, indexation et restitution des résultats du web, mais qu’ils interrogent plusieurs autres moteurs de recherche simultanément, en affichant à l’internaute une synthèse pertinente. C’est par exemple le cas de Startpage ou Lilo.
Enfin, d’autres moteurs de recherche sont dits « spécialisés », c’est-à-dire qu’ils interrogent une partie ciblée du web. C’est par exemple le cas de Base ou de Google Scholar, spécialisés dans la recherche d’articles et de publications scientifiques (pour plus d’informations sur ces outils, lire le « Allô la doc ? #2 » sur le sujet).
Qu’interrogent les moteurs de recherche web ? (web visible/ web invisible)
Les moteurs de recherche web interrogent une partie des ressources d’Internet appelée le « web visible ». Pour schématiser, il s’agit des différentes pages, blogs, images, vidéos… qui sont parcourus et récupérés par les robots d’indexation, puis indexés et restitués à l’aide d’algorithmes lorsque vous interrogez un moteur de recherche web.
On estime que le web visible représente entre 1 et 4% des ressources totales d’Internet, quand le web invisible constitue entre 96 et 99% du net.
Selon le Grand dictionnaire terminologique, cité par Futura Sciences, « Les ressources du Web invisible comprennent, entre autres, les sites Web construits autour d’une base de données (interrogeable uniquement par un moteur de recherche interne), les pages accessibles par un formulaire de recherche, les pages protégées par un mot de passe, les pages interdites aux robots d’indexation, les pages écrites dans des formats propriétaires, les intranets et les extranets. »
⇒ Ce qu’on peut ajouter : seule une infime partie du net est donc référencée par les moteurs de recherche web. De ce fait, dans le cadre d’une recherche documentaire, il est important de ne pas se contenter « d’interroger Google », mais aussi de compléter son investigation par l’interrogation d’autres outils référençant une partie du web invisible, comme des catalogues de bibliothèques, des bases de données… Cerner le fonctionnement et la complémentarité des outils qu’on utilise au quotidien permet ainsi de perfectionner notre stratégie de recherche.
Astuce : installer plusieurs moteurs de recherche dans son navigateur Firefox
- Pour commencer, vérifiez que la barre de recherche est bien présente dans à la barre d’outils de Firefox, à droite de l’URL (tutoriel pour l’installer en 2 clics).
- Cliquez sur l’icône de loupe dans la barre de recherche, puis sur « Paramètres de recherche », pour ouvrir le panneau « Recherche des Options » de Firefox.
- Tout en bas de cette page, sous le bloc « Raccourcis de recherche », cliquez sur le lien « Découvrir d’autres moteurs de recherche». Le site web des Modules pour Firefox s’ouvre.
- Sélectionnez le module de moteur de recherche que vous désirez, ou bien cherchez le dans la barre de recherche « Recherchez des modules », et cliquez sur « Ajouter à Firefox» : testez d’installer Duck duck go, Qwant, Startpage, Lilo ou encore Ecosia !
En testant différentes requêtes, vous constaterez qu’il peut y avoir des différences notables, sur les 2-3 premières pages de résultats, entre les réponses apportées par deux moteurs de recherche web différents. Nous pourrons aborder prochainement de quoi sont constitués les résultats d’une recherche en fonction des spécificités de certains de ces moteurs.
Ne ratez pas le prochain numéro d’Allô la doc, dans lequel nous reviendrons sur la manière d’interroger ces moteurs de recherche web de manière plus avancée et pertinente (formuler ses requêtes, filtres et astuces à connaitre…) !