Plugins de NLP pour Elasticsearch - A la découverte de vos données textes.

Basis Technology vient présenter 3 nouveaux plugins de “Rosette pour Elasticsearch” lancés en mars 2017 durant l’Elastic{on}. Ces 3 plugins viennent compléter les fonctionnalités de NLP existantes d’Elastic.

Rosette est un outil d’analyse de textes multilingue que nous avons récemment repackagé pour fonctionner avec les dernières versions d’Elastic, que ce soit On Premise ou en SaaS. Les 3 plugins ont 3 buts distincts:

  • améliorer la qualité de la recherche avec une analyse morphologique du texte (Multilingual Search Enhancement)
  • enrichir la recherche en ajoutant des metadatas au niveau de l’index (document enrichment)
  • fournir une solution de résolution d’identité (Identity Resolution)

Nous avons toujours eu l’habitude d’effectuer nos recherches avec des mots-clés pour trouver les informations importantes pour nous! Néanmoins avec la prolifération des données, il n’est pas toujours évident de savoir ce que l’on recherche exactement, il est donc nécessaire d’utiliser des techniques permettant d’extraire les informations importantes pour nous.

Posez-vous les questions suivantes:

  • comment trouvez-vous une information si vous ne savez pas exactement ce que vous cherchez?
  • comment est-ce que vous pouvez créer de nouveaux filtres à vos recherches (sentiment, catégories…)?
  • comment effectuez-vous vos recherches sur des données multilingues?
  • comment s’assurer que vous ne perdez pas de temps à faire le tri entre des faux-positif en passant à coté de faux-négatif?

Si vous répondez “ Je ne sais pas” à une de ces questions, alors vous allez vouloir voir cette démo de 20-25min.

Jeanne Le Garrec

Jeanne est responsable partenaires chez Basis Technology et travaille depuis 3 ans avec les partenaires intégrateurs et éditeurs spécialisés dans le data mining, l’extraction de données et les outils de recherches répartis dans le monde entier, dont les équipes d’Elastic.