Frustrants, les moteurs de recherche ?

11 septembre 2012 9 h 57 min 36 commentaires Views: 1097

Partagez cet article

  • TwitterTwitter
  • FacebookFacebook

Auteur(e)

Tags:

Une des faiblesses qui accable les sites Web ne roulant pas sur l’or, est la précision des moteurs de recherche. L’approximatif est de mise à cette enseigne et y remédier peut coûter la peau des fesses. Croyez-moi !

Cette question, soulevée par Gilles Plante, un abonné de longue date, met le doigt sur un des problèmes qui pénalise NELSON DUMAIS – LE MAGAZINE (NDLM). Par défaut, les logiciels de gestion de contenu (CMS) comme WordPress proposent leur petit moteur, de gentillets petits machins comme celui auquel on peut accéder, ici même en haut des pages, du côté droit. Certains visiteurs/utilisateurs s’en accommodent, d’autres non.


S’il faut rechercher un terme simple, il est génial. Il sait même s’acquitter d’une requête de deux ou trois mots, par exemple misère noire. Faites le test et vous découvrirez qu’il n’est pas si mauvais, surtout si vous entourez l’expression de guillemets comme ceci : «misère noire».

Personnellement, il m’est fort utile. Supposons que je veuille savoir si je vous ai déjà parlé de Larry Ellison, je tape ce mot dans la fenêtre de recherche et avant d’ouvrir une à une les fiches qu’il propose, je le retape dans la boîte de recherche du fureteur (Ctrl – F), ce qui place les incidences de Larry Ellison en surbrillance. Pas vite vite, mais quand même mieux que rien.

Évidemment, il ne faut pas trop lui en demander. Ce gadget ne déduit pas. Il ne fait que fouiner dans le sens de la requête déposée. Ainsi, si on lui demande « comparatif iOS Android », il présentera des fiches comportant ces trois mots, collés ou non. Il ne comprendra pas qu’on recherche un document de comparaison entre deux ordiphones.

Je vous entends me souffler à l’oreille d’installer Google Site Search, un service très rapide qui coûte entre 100 $ et 2 000 $ par année selon son usage. Plus il est sollicité, plus il est cher. Même chose pour Bing, d’ailleurs, qui lui aussi a une version pouvant être installée dans un site Web. Ask ? Trop commercial et souvent idiot !

Mais, test à l’appui, ces produits ne semblent guère plus précis que celui, gratos, de WordPress. Ainsi, s’ils brillent avec “misère noire”, ils sont lamentables avec “comparatif iPhone Android”. Testez la démo sur cette page, vous verrez !

Dois-je ajouter qu’il ne s’agit pas ici de recherche en langage naturel. Je vous parle ici de cette catégorie très onéreuse de moteurs qui comprennent n’importe quelle question posée avec des mots courants, p.ex. “composition chimique de l’eau”. Si le moteur est efficace, il fera deux choses. Il dénichera des fiches pouvant expliquer la composition et il répondra “H2O”.

Un bel exemple est Powerset, un produit très prometteur qui fut acquis par Microsoft en 2008, presque un an avant le lancement de Bing, et dont on semble avoir perdu la trace.

Autre bel exemple dont on n’entend plus souvent parler est Delphes, un produit d’ici qui connut ses heures de gloire il y a une douzaine d’années. Idem pour Nomino, un autre ancien fleuron des TI québécoises. Le Français Constellio ? C’est un peu comme le système de la Montréalaise Irosoft, un gros truc de gestion documentaire avec des subtilités de recherche. La partie de plaisir est de mettre ces systèmes en ligne sans recourir à des informaticiens habitués.

Au fait, il arrive quoi avec cette quête de l’interprétation machine du langage naturel ? Je ne vous parle pas ici de ma Fiat ou de Siri dans mon iPhone 4s, mais de ces gros progiciels bouffeurs de texte.

Le problème demeure entier. NDLM contient plus de 1 500 articles, techno à 98 %, sans parler des illustrations, ce qui est de loin suffisant pour qu’une chatte y perde ses petits. Depuis plus d’un an, j’ai beau compléter les textes avec des mots clés, ce qui facilite la recherche, la masse 2005-2011 des documents échappe à cette discipline. Retourner en arrière pour le faire n’est pas une solution; personne ne dispose du temps nécessaire à cette corvée.

Tout cela pour admettre qu’à moins de revirement majeur, par exemple quelqu’un parmi vous qui aurait une idée géniale, il va falloir continuer dans l’état actuel des choses.

Auteur(e) Nelson Dumais

Voué à un avenir brillant dès sa naissance, Nelson s’est néanmoins pris les pieds dans un ordinateur répandu partout dans un motel désaffecté et ne s’en est pas vraiment remis. C’était à Rimouski en 1981 et le monstre de 64 Ko, une sorte de tombeau en mélamine blanche, cahotait en CP/M, souffrait en anglais et tombait régulièrement mort. Avec l’acharnement d’un anthropologue fou, Nelson recherche depuis lors un ordinateur qui fonctionnera sans défaillance, sans souffrir ni faire souffrir, et cela dans une langue intelligible. Si jamais il trouve, il vous en fera part. C’est juré !

36 commentaires

  • (hors sujet)
    @ Nelson

    Je commence bien ma journée :mrgreen:

    Serait-il possible dans la configuration du site de mettre les liens plus visibles dans vos articles et dans les commentaires ?

    Vous l’aviez fait sur le blogue, et ça facilitait grandement le repérage des liens à suivre. Actuellement, un bleu pâli mêlé au texte en gris n’est pas évident à repérer.

    Merci et bonne journée!

    Cotez ce commentaire: Thumb up 17 Thumb down 0

  • Voila quelques années, j’ai incorporé Swish-E à un site que j’avais fait et il faisait une bonne job. J’ignore où il en est rendu cependant, s’il a évolué.
    http://swish-e.org/

    Cotez ce commentaire: Thumb up 5 Thumb down 0

  • Avez-vous pensé au moteur de recherche personnalisé de Google?

    La version standard est gratuite moyennant l’ajout d’annonces AdSense pour générer des revenus :wink:

    http://www.google.com/cse/

    Cotez ce commentaire: Thumb up 6 Thumb down 0

  • N.D.: —par exemple quelqu’un parmi vous qui aurait une idée géniale

    On m’a appelé?

    Deux morceaux de robot au premier qui comme moi n’obtient qu’un seul résultat (vers cet article-ci) en tapant «Comparatif iPhone Android». ;-)

    Cotez ce commentaire: Thumb up 3 Thumb down 0

    • @ Denis Pagé

      Je ne contesterai même pas vos résultats.

      Vous savez moi, les morceaux de robots, pftt! Depuis qu’on m’a proposé des morceaux de baratte et d’écrase raisins, je me méfie :razz:

      P.-S. J’ai quand même essayé de vous contredire :mrgreen:

      Cotez ce commentaire: Thumb up 6 Thumb down 0

    • Comme les robots n’intéressent personne semble-t-il ;-) voici ma réponse.

      Observez bien la partie gauche dans le terme de recherche. C’est ça le truc pour limiter la recherche à un site donné.

      Cotez ce commentaire: Thumb up 6 Thumb down 0

  • Lu sur un site techno ce matin.
    Microsoft va ouvrir des boutiques éphémères avant les fêtes de fin d’année aux
    États-Unis et au Canada.
    Le groupe doit notamment commercialiser à partir du 26 octobre sa tablette
    informatique Surface.
    Voilà sûrement "la raison" de ces boutiques !

    Cotez ce commentaire: Thumb up 4 Thumb down 0

  • Quelqu’un a essayé Copernic Agent Personal?

    Je l’ai essayé et «nelson dumais le magazine» arrive en premier lorqu’on tape Nelson Dumais dans la barre de recherche.

    C’est gratuit, mais c’est vrai qu’il faut travailler un ti peu plus.

    Cotez ce commentaire: Thumb up 3 Thumb down 0

    • Dans Google aussi. Si vous tapez General Motors, gm.com va sortir en premier. Google a du faire des changements pour respecter les marques de commerce.

      Avant, n’importe quel bozo qui écrivait General Motors mille fois dans son site pouvait se retrouver en haut.

      Le point, c’est la recherche dans le site.

      Pour ma part, je vais dans Google, je tape «ubuntu nelsondumais» et je prie pour avoir des résultats de ce site en premier.

      Ca marche avec cyberpresse dont l’engin de recherche est pourri parce qu’il n’accorde aucune importance à la date. Quelqu’un a oublié d’expliquer au technologue ce qu’est un journal quotidien.

      Cotez ce commentaire: Thumb up 5 Thumb down 0

  • Un ajout.

    Lorsqu’on tape «nelson dumais misère noire», y a plein de misère noire de Nelson.

    Cotez ce commentaire: Thumb up 3 Thumb down 0

  • Dans Google si vous voulez effectuer une recherche sur un site particulier il suffit d’ajouter le champ “site” avec le nom de domaine du site en question.

    Par exemple pour chercher “Comparatif iPhone Android” sur http://www.nelsondumais.com il suffir tout simplement de taper :

    Comparatif iPhone Android site:nelsondumais.com

    Cotez ce commentaire: Thumb up 7 Thumb down 0

  • Je sais pas trop ce que vous utilisez en ce moment pour faire vos recherches avec WordPress, mais dernièrement j’ai installé avec succés SOLR (engin d’indexage de la fondation Apache) pour faire l’indexation d’un site de vente électronique. Très rapide et les résultats sont pertinent.

    J’ai fais une petite recherche et il un a un plugin SOLR pour WordPress.

    http://wordpress.org/extend/plugins/solr-for-wordpress/

    J’imagine qu’en bidouillant un peu les résultats de recherche serait plus pertinent que l’engin de base.

    Cotez ce commentaire: Thumb up 2 Thumb down 0

  • Bonjour à tous.

    J’aimerais féliciter Nelson et son équipe pour la réalisation de ce nouveau site.

    J’aimerais me permettre une petite suggestion pour effectuer une recherche Google personnalisée ayant l’avantage d’être complètement gratuite!

    Le secret de cette recette consiste à restreindre le domaine de recherche en spécifiant comme première partie de l’interrogation le fragment de l’URL à utiliser suivi par le signe de ponctuation “:” et les critères de recherche.

    Pour reprendre l’exemple mentionné dans la chronique, comparatif iPhone Android, on entre dans la case de recherche le texte suivant:

    http://www.nelsondumais.com: comparatif iPhone Android

    Puisque le moteur de recherche Google est basé sur les URLs, il est possible de forger une recherche à partir de son propre site et de l’afficher dans une section du site.

    Toujours en reprenant le même exemple, voici comment ouvrir dans une nouvelle fenêtre, le résultat de la recherche sur Google:

    http://www.nelsondumais.com: comparatif iPhone Android

    Voici l’URL utilisé dans cet exemple:

    http://www.google.ca/search?q=www.nelsondumais.com%3A+comparatif+iPhone+Android

    Cotez ce commentaire: Thumb up 3 Thumb down 2

  • Dernière tentative pour l’affichage de l’hyper-lien:

    http://www.nelsondumais.com%3A%20comparatif%20iPhone%20Android

    Cotez ce commentaire: Thumb up 2 Thumb down 2

    • Bonjour à tous.

      En premier lieu, j’aimerais féliciter Nelson et son équipe pour la réalisation de ce nouveau site.

      J’aimerais me permettre une petite suggestion pour effectuer une recherche Google personnalisée ayant l’avantage d’être complètement gratuite!

      Le secret de cette recette consiste à restreindre le domaine de recherche en spécifiant comme première partie de l’interrogation le fragment de l’URL à utiliser suivi par le signe de ponctuation “:” et les critères de recherche.

      Pour reprendre l’exemple mentionné dans la chronique, comparatif iPhone Android, on entre dans la case de recherche le texte suivant:

      http://www.nelsondumais.com: comparatif iPhone Android

      Puisque le moteur de recherche Google est basé sur les URLs, il est possible de forger une recherche à partir de son propre site et de l’afficher dans une section du site.

      Toujours en reprenant le même exemple, voici comment ouvrir dans une nouvelle fenêtre, le résultat de la recherche sur Google:

      http://www.nelsondumais.com&58; comparatif iPhone Android

      Voici l'URL utilisé dans cet exemple:

      http://www.google.ca/search?q=www.nelsondumais.com%3A+comparatif+iPhone+Android

      P.S.: Le message original ne semble pas avoir été publié, voici donc la version originale.

      Cotez ce commentaire: Thumb up 4 Thumb down 2

  • J’ai une surprise aujourd’hui, mon commentaire à incité le sieur Nelson à faire un article à propos de ma question transmise à lui :-) .

    Quelqu’un peut-il me dire pourquoi Google fait à sa tête quand on met l’objet de notre recherche entre des apostrophes ? Aujourd’hui j’ai fait une recherche sur “HUI 34″, et il m’a trouvé des pages avec aujourd’hui 34 :-( . Je me souviens d’une fois où il avait trouvé ce que je cherchais… dans les commentaires de la page *soupir*. Trop souvent Google trouve trop de liens ‘pas rap’ et ce que l’on cherche est noyé dans une mer de liens.

    Parlant de mon cher Google, j’ai une partie de mon dentier contre cette cher entreprise, j’ai trouvé ceci aujourd’hui: Google.ca est un problème pour votre référencement. Petit extrait: “aire une recherche en français sur le domaine anglais ou faire une recherche en anglais sur le domaine français, donne des résultats particulièrement peu pertinents.”

    Frustrant les moteurs de recherche, mets-en !

    Cotez ce commentaire: Thumb up 3 Thumb down 0

    • Il faut comprendre comment un engin de recherche indexe et cherche et effectue des suggestion. Plus il indexe de fichier, plus il trouve de termes plus il peut avoir de meilleurs résultats. La présentation des résultats est une question de statistiques pas d’algorithme comme on a tendance à le croire ou à le supposer.

      En général, mettre des apostrophe ou pas n est qu’un hint pour l’engin de cherche, qu’il va avoir tendance à ne pas considérer parceque un index doit être constitué de simpes terme,

      Cotez ce commentaire: Thumb up 2 Thumb down 0

  • lil y a les engins de recherche tel google et il y a plein d’outils sémantiques qui trouvent plus d’écho chez les universitaires mais qui sont loin d’être aussi efficaces que les premiers.

    Cotez ce commentaire: Thumb up 2 Thumb down 0

  • Bonjour Nelson,

    Merci pour cet article sur la frustration que peuvent générer les moteurs de recherche. Une petite correction sur Constellio:
    1. Il n’est pas français mais Canadien !
    2. C’est vraiment un moteur de recherche et non pas un outil de gestion de documents. L’éditeur de Constellio – Doculibre – propose effectivement une solution de GED, mais celle-ci s’appelle Intelligid. En ce qui concerne Constellio, ce qui fait qu’il est un peu “lourd”, c’est qu’il arrive avec une batterie de fonctionnalités qui peuvent le rendre un peu dur d’accès mais très flexible: beaucoup de connecteurs (comme ça vous pouvez indexer aussi bien du web que des bases de données par exemple), gestion de plusieurs types de documents, puis configuration avancée de la recherche (gestion des synonymes, de la sécurité d’accès etc), et enfin outils statistiques pour voir qui cherche quoi (et s’ils trouvent!).
    Du coup j’en profite pour poser une question: vous êtes à la recherche d’un moteur “performant et abordable”, mais pour vous: combien de temps seriez-vous prêt à passer pour configurer votre moteur (car oui il faut généralement passer un peu de temps à customiser son moteur!), et à combien estimez-vous que la fonctionnalité est “abordable”?

    Cotez ce commentaire: Thumb up 1 Thumb down 0

    • Désolé de m’être laissé enfirouaper encore une fois par le Web et ses artifices. Le mal est fait, mais je vais quand même apporter la correction.

      Pour votre question, la réponse est simple. J’ai adopté le modèle d’affaires du Web 2.0, un mode basé, notamment, sur la gratuité. Pour générer des sous et pouvoir procéder au développement, il faut, d’une part, se fier à la publicité et aux dons et, d’autres part, tâcher de ne rien dépenser en optimisant toutes les avenues gratuites. En ce sens, je suis à la recherche d’une solution qui ne me coûtera que le temps nécessaire à l’adapter aux besoins de ce site et à la mettre en ligne.

      Merci pour votre intervention.

      Cotez ce commentaire: Thumb up 2 Thumb down 0

  • Arrêtez de faire des recherches sur l’association entre «misère noire» et «Nelson Dumais» car ça finit par faire une incantation Vaudou et la chtouille pourrait s’abattre. :-/

    Cotez ce commentaire: Thumb up 2 Thumb down 0

  • @Nelson

    J’ai peut-être manqué quelque chose, mais, pourquoi ne pouvons-nous plus éditer un commentaire lorsque l’on voit qu’un lien ne s’affiche pas correctement?

    De plus, un petit résumé de codes de base HTML (un exemple complet pour chaque) sur votre site permettrait aux utilisateurs de réussir du premier coup. Par exemple: crochets a ou i ou b, et les liens vers les images. Peut-être un lien dans votre Webzine où le lecteur pourrait voir ces exemples. De grâce, ne pas redirigé vers des sites extérieurs. Seulement vers votre Webzine.

    Merci de votre attention.

    Cotez ce commentaire: Thumb up 2 Thumb down 0

  • Pour travailler sur WordPress, les plugins de Yoast sont selon moi incontournables (surtout le plugin SEO). Plusieurs sont gratuits. Pour optimiser une grand quantité de contenu, il y a un plugin (payant par contre) qui permet de chercher dans tous les billet d’un site et de leur attribuer des étiquettes (tags) en bloc. Ce serait peut-être intéressant dans votre cas. http://yoast.com/optimizing-tags/

    Cotez ce commentaire: Thumb up 0 Thumb down 0