La business intelligence appliquée au texte dans l'entreprise ou sur le web

Aujourd’hui les organisations (entreprises, associations, personnes, …) produisent et consomment des quantités de documents et de textes numériques (rapport, étude, synthèse, contrat, réponse aux enquêtes, sous format PDF, Office, web, …).

L’avènement des technologies du BIG DATA ont permis de mieux gérer ces énormes volumes de données, avec notamment la Business Intelligence qui a pour vocation d’exploiter cette multitude de données afin de faciliter le travail et les usages en contexte d’entreprise.

Seulement, voilà, ces outils se concentrent sur les données structurées ; or le texte n’est pas une donnée structurée.

De fait, la Business Intelligence se coupe de tout un pan de données (intéressantes voire prioritaires) en excluant les textes, données non structurées par définition.

Alors comment intégrer les données non structurées et faire de la Business Intelligence avec ?

Je vous propose de voir comment le couplage d'un annotateur NLP/TAL et de la stack Elastic décuple les possibilité d'analyse de masses de texte.

Le saviez vous ? Elasticsearch peut servir à indexer autre chose que des logs ;-)

Enregistrement réalisé lors du Meetup ElasticFR Paris #34

Aujourd’hui les organisations (entreprises, associations, personnes, …) produisent et consomment des quantités de documents et de textes numériques (rapport, étude, synthèse, contrat, réponse aux enquêtes, sous format PDF, Office, web, …).

L’avènement des technologies du BIG DATA ont permis de mieux gérer ces énormes volumes de données, avec notamment la Business Intelligence qui a pour vocation d’exploiter cette multitude de données afin de faciliter le travail et les usages en contexte d’entreprise.

Seulement, voilà, ces outils se concentrent sur les données structurées ; or le texte n’est pas une donnée structurée.

De fait, la Business Intelligence se coupe de tout un pan de données (intéressantes voire prioritaires) en excluant les textes, données non structurées par définition.

Alors comment intégrer les données non structurées et faire de la Business Intelligence avec ?

Je vous propose de voir comment le couplage d'un annotateur NLP/TAL et de la stack Elastic décuple les possibilité d'analyse de masses de texte.

Le saviez vous ? Elasticsearch peut servir à indexer autre chose que des logs ;-)

Enregistrement réalisé lors du Meetup ElasticFR Paris #34

Ivan Monnier

Ivan Monnier est CTO de Qwam, une société spécialisée dans le traitement de masses de texte. Qwam édite des solutions de crawl, de CMS et de Text Analytics et utilise extensivement la stack Elastic.