Tout savoir sur la compression automatique de texte

Compression automatique de texte

Tout savoir sur la compression automatique de texte

Dans le monde moderne, de grandes données sont disponibles pour chaque sujet et c’est vraiment un processus difficile de connaître et d’extraire le matériel exactement pertinent quand on le recherche en ligne et c’est exactement là que savoir résumer un texte est requis. Le résumé de texte est le processus de filtrage des informations les plus importantes de la source originale pour réduire la longueur du document texte et le résumé automatique de texte est le processus de génération de résumés d’un document en utilisant un logiciel et des outils technologiques.

Il existe deux approches de base à la compression automatique de texte.

Compression basée sur l’extraction

Dans le résumé basé sur l’extraction, un sous-ensemble des mots les plus importants est extrait du document texte original et est combiné pour en faire un résumé.  C’est comme un surligneur qui extrait l’information principale d’un texte source et la met en évidence. Dans le résumé basé sur l’extraction, le résumé extrait est composé des mots surlignés ou répétitifs, bien que les résultats puissent ou non toujours être grammaticalement exacts.

Résumé basé sur l’abstraction

Dans le résumé ou l’analyse de texte basé sur l’abstraction, des techniques d’apprentissage machine plus avancées sont appliquées pour raccourcir la longueur du document original et il crée un résumé tout comme le font les humains. Dans l’abstraction basée sur le résumé, de nouvelles phrases sont créées qui peuvent contenir des mots qui ne font même pas partie du document original. Le risque d’erreurs grammaticales est presque nul dans ce type de résumé, car il peut générer de nouvelles phrases et phrases et extraire les informations les plus importantes du texte source.

 

Pour obtenir des résumés plus précis et plus fiables, il est préférable de passer d’un résumé extractif à un résumé abstrait, car contrairement aux méthodes d’extraction, les techniques abstraites présentent l’information résumée sous une forme cohérente et fiable qui est à la fois grammaticalement correcte et facile à comprendre.

La méthode de compression abstraite donne des résultats moins stables que les méthodes de compression extractive. Mais on croit toujours que l’approche de la méthode abstraite est plus prometteuse en termes de production de résumés humains. Par conséquent, de plus en plus d’approches se multiplient dans ce domaine et offrent de nouvelles perspectives du point de vue informatique, cognitif et linguistique.

Bien qu’un résumé automatique du texte soit nécessaire dans tous les domaines de travail, il y a certaines utilisations courantes et importantes de celui-ci, notamment :

  1. Il réduit le temps de lecture.
  2. Il réduit le temps de recherche pendant la recherche car au lieu de lire le document en entier, vous pouvez le sélectionner en lisant les résumés.
  3. Il réduit le temps de recherche pour les gens d’affaires, les analystes aussi, car la plupart de leur temps est consacré à déterminer quel document est pertinent et lequel ne l’est pas. En utilisant des tableaux récapitulatifs, ils peuvent comprendre l’importance d’un document avant de l’ouvrir.
  4. En plus des gens d’affaires, des analystes, des universitaires et des chercheurs, il aide également les étudiants et les auteurs à produire des résumés de leurs travaux de recherche ou des chapitres de leurs livres.

 

Aline

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *