Management stratégique de l'information

 
Ce produit n'est plus disponible à la vente

Management stratégique de l'information

Trouvez la bonne information et sachez l'exploiter !

Nous vous recommandons

Weka Intégral Culture & communication

Weka Intégral Culture & communication

Voir le produit

Partie 6 - Fiches pratiques internet
Chapitre 3 - Tirer parti du Content Analytics

6.3/1 - Utiliser l'extraction de connaissances

I - Contexte

L'extraction de connaissances vise à identifier et à extraire automatiquement les éléments importants d'un corpus documentaire : entités nommées, mots-clés, expressions, concepts, relations, etc. Une utilisation judicieuse de ces éléments permet d'améliorer la gestion de l'information notamment en matière d'organisation des contenus mais aussi d'accès à l'information.

II - En pratique

Afin de tirer le meilleur parti de l'extraction de connaissances dans le cadre de l'amélioration de la gestion de l'information, une démarche en 4 étapes vous est proposée :

  • Étape 1 : Comprendre ce qu'est l'extraction de connaissances

  • Étape 2 : Identifier ce que peut vous apporter l'extraction de connaissances

  • Étape 3 : Procéder à l'enrichissement sémantique des documents

  • Étape 4 : Affiner la recherche d'information

1 - Étape 1 : Comprendre ce qu'est l'extraction de connaissances

Comme indiqué précédemment, l'extraction de connaissances a pour vocation d'identifier et d'extraire d'un corpus documentaire, de manière totalement automatique, les éléments jugés les plus importants.

Ces éléments peuvent être regroupés en quatre grandes catégories :

  • les entités nommées : noms de personnes, d'entreprises, de lieux, etc. ;

  • les mots clés ou expressions : il s'agit des termes qui ne relèvent pas de la catégorie des entités nommées ;

  • les concepts qui sont des représentations abstraites d'objets (le concept de véhicule peut être exprimé par différents mots clés tels que « voiture », « auto », « moto », etc.) ;

  • les relations entre des entités nommées, mots ou expressions, par exemple « une personne dirige une entreprise », « une entreprise rachète une autre entreprise », « une entreprise est implantée dans un pays », etc.

Si l'extraction d'entités nommées et/ou de mots clés et expressions est le processus le plus simple et le plus commun de la fonction d'extraction de connaissances, il n'en est pas de même pour l'extraction de concepts et encore moins pour l'extraction de relations. En effet, ces deux processus sont nettement plus complexes à mettre en œuvre car ils nécessitent une analyse en profondeur des contenus et une bonne compréhension du langage naturel.

Pour bien comprendre le principe de fonctionnement de l'extraction de connaissances, nous allons nous appuyer sur la présentation pas à pas d'un exemple. Même si chaque logiciel utilise ses propres algorithmes, le processus décrit ci-après propose une approche générale dont la vocation est avant tout pédagogique.

Le processus d'extraction de...

Si vous êtes déjà abonné, connectez-vous pour accéder à la publication dans son intégralité.