Retour

G-2023-53

An history of relevance in unsupervised summarization

et

référence BibTeX

Le résumé automatique de document a pour but de créer une version réduite d’un ensemble de textes pour aider des utilisateurs à mieux assimiler l’information pertinente contenue dans ces derniers. Les méthodes non supervisées sont parmi les méthodes les plus appropriées pour effectuer cette tâche puisqu’elles ne nécessitent pas d’étiquetage humain a priori pour condenser l’information. Cet article propose une revue de littérature détaillée de ces approches appliquées au résumé de document, octroyant alors une meilleure compréhension de leurs mécanismes et des principes fondamentaux sous-jacents. Cette analyse traite donc de plusieurs aspects importants. Tout d’abord elle offre une vue globale du domaine permettant d’expliquer certains contextes d’application, l’évaluation et l’évolution des approches non supervisées. Elle fournit une nouvelle typologie de classification des méthodes, clarifiant ainsi le lien entre la tâche du résumé de document et certains facteurs contextuels tels que l’intention et l’audience. Cela met particulièrement en avant comment ces facteurs influencent la notion de pertinence et la manière dont l’information est sélectionnée par un algorithme pour non seulement former le résumé, mais aussi mesurer sa performance. Résultant de ce travail, une discussion sur les ressemblances profondes entre les différentes méthodes et les limites qui leur sont reliées nous permet de proposer différentes recommandations et des pistes de recherche future afin d’intégrer les observations que nous avons réalisées.

, 37 pages

Axe de recherche

Application de recherche

Document

G2353.pdf (430 Ko)