Upload
core-techs
View
2.005
Download
3
Embed Size (px)
DESCRIPTION
Solution de moteur de recherche open source ou propriétaire
Citation preview
Drupal et les solutions de recherche
Au programme
> Pourquoi la recherche ? > Le fonctionnement « out of the box » > La solution SolR avec Drupal > Externaliser votre recherche
Pourquoi la recherche est-‐elle si essen1elle ?
Les enjeux d’un bon moteur de recherche
Satisfaction de l’utilisateur qui trouve ce qu’il cherche
Transformation &
conversion plus efficace
Réponse à l’obésité de l’information
Pourquoi les internautes utilisent un moteur de recherche
• Ils ne trouvent pas rapidement l’information par la navigation habituelle
• Ils savent ce qu’ils cherchent et préfèrent utiliser le moteur pour accéder directement à l’information
Ce que veulent les internautes :
Oublions la complexité des interfaces multi-critères et boléennes
Respectons les conventions UX et utilisons les facettes
Les critères d’analyse d’un bon moteur de recherche
• Efficacité • Rapidité • Pertinence • Personnalisation
La fonc1on de recherche par défaut sous Drupal
Une fonction par défaut sous D7
• Formulaire simple & multi-critère • Gestion intégrée des permissions
Les paramétrages de Search
• Indexation manuelle • Fréquence d’indexation • Modules de recherche activés : par entité • Classification & poids des contenus
Les inconvénients de la recherche basique
• Performances limitées - SQL • Serveur nécessairement en local • Peu de paramétrage • Pas d’indexation plein texte • Gestion d’opérateurs logiques limités • La recherche doit matcher l’expression de
recherche
SolR
Qui est SolR ?
SolR
• Moteur de recherche en JAVA • Open Source • Projet APACHE • Très très largement utilisé • Issu du projet LUCENE
Le schéma de fonctionnement
Les avantages de SolR
• Indexation d’un volume de données important
• Rapidité
Les avantages de SolR
• Gestion du cache • Scalabilité • Gestion multi-
site
Les avantages de SolR
• Optimisation de la pertinence
• Optimisation de l’efficacité
Indexation plein texte
• Format de fichiers courants
• Ajout possible de bibliothèques
Scoring
Filtres et facettes
• Content type • Termes de
taxonomie par vocabulaire
• Auteurs • Dates de
publication & modification
• Textes et nombres choisis dans des listes déroulantes
Etendre les facette avec FacetAPI
• Gestion de l’ordre des items
• Gestion de facettes étendues selon certains contextes
• Paramétrage de l’affichage
• Exclusion de certains items
Pertinence de l’indexation
• Tout contenu / taxonomie modifiée est automatiquement réindexé
• Tout le contenu dépublié est retiré de l’index
• Stemmatisation du contenu
• Gestion des « stop words »
• Support multilingue
Etendre SolR
• Autocomplétion • Nuages de mots-clé • Correction orthographique • Slider de facettes • Optimisation des urls • Suggestions • Rich Snippet • Recommandations • Surlignage • Recherche géographique • Optimisation multilingue • …
Les limites de SolR
• Installation d’un serveur
• Compétences techniques étendues nécessaires
• Temps de paramétrage et d’optimisation
• Interface de gestion limitée
30 Core-Techs
Des solutions externalisées
Acquia Search
• Repose sur l’extension SolR • Service hébergé • Installation rapide en 5 minutes
Google Custom Search
• Un mode gratuit et un mode payant • Rapide et facile à installer • Pas de maintenance nécessaire
Acquia Search
• Service hébergé • Installation rapide en 5 minutes
Moteurs externalisés
• Back-office de gestion
• Amélioration pertinence et performance : siglaison, synonymie, gestion de thésaurus
• Moteurs de recherche Ecommerce
• Orienté traitement des contenus
• Saas ou licence
• Intégration de solutions tierce : OCR, recherche de couleurs, …
Moteurs de recherche Open Source
• Elasticsearch basé sur Lucène • Amélioration de la performance • Optimisation de la recherche temps réel
Les méthodologies d’intégration des solutions externalisées
Intégra1on sta1que Iframe
XML Webservices
En résumé :
Recherche na1ve
• Peu de contenus • Besoins simples de recherche
• Budget limité
Recherche SolR
• Nombreux contenus
• Capacités de paramétrage
• Besoin de recherche efficace
Recherche externalisée
• Pas de ressources techniques
• Budget variable selon la solu1on
• Besoins d’op1misa1on : sources hétérogènes, mul1-‐site, thésaurus, …
Et demain ?