19 novembre 2014

Connaissez-vous les outils « résumeurs »?

« Mais les ouvrages les plus courts sont toujours les meilleurs… »
Jean de la Fontaine

La fonction de résumé est très utilisée depuis près de vingt ans dans le domaine des TIC. Elle sert principalement à indexer les pages web afin que votre moteur de recherche favori puisse vous présenter les résultats pertinents très rapidement. Pensez à la dernière fois que vous recherchiez un document sauvegarder sur votre ordinateur. Après près d’une minute, une liste de tous les fichiers terminant par les lettres « doc » est apparue. Sur internet, 240 millions de résultats sont proposés après seulement un quart de seconde.

 

Elle sert aussi depuis peu à afficher des publicités sur les sites web selon des critères de pertinence. Les fils de nouvelles (RSS) utilisent ces mots clés et leurs synonymes, afin de suivre en continu un sujet de valeur pour une entreprise – leur image corporative dans les médias, par exemple.

 

Certains outils offerts aux entreprises permettent d’indexer et de résumer les documents contenus dans leurs archives. Un chargé de projet en Inde peut rapidement prendre connaissance des projets similaires effectués par sa société multinationale ailleurs dans le monde. Il s’agit de pratiques de « forage de données », d’« informatique décisionnelle » et de l’« amélioration continue de la qualité ».

 

Les nuages de mots (Word Cloud ou Tag Cloud)

Une utilisation plus ludique de cette technologie est la création de « nuages de mots ». Ces représentations typographiques attirent et retiennent l’attention afin d’en décoder le sens. Voyez un exemple :

 

 

Les logiciels de création de nuages utilisent la prévalence des mots afin de modifier la taille et la couleur des mots affichés. Plusieurs styles appliquent des formes à l’ensemble de mots afin de représenter la forme d’un nuage, par exemple.

 

Trois méthodes de résumé

Il existe trois méthodes de création de résumés : par abstraction, par extraction et par compression.

 

La première est la plus connue et la plus utilisée. Il consiste à écrire de nouvelles phrases qui décrivent le contenu d’un autre texte. C’est souvent l’auteur lui-même qui en décide du contenu sous forme d’introduction, de résumé scientifique en début d’article ou par la conclusion en fin de lecture. Il se présente aussi dans les livres didactiques sous forme d’encadrés, de mots clés, en surbrillance ou sous forme de questions à la fin d’un chapitre.

 

Le résumé peut prendre la forme de revue littéraire et de synopsis de film rédigé par des critiques ou des membres de communautés d’intérêts. La fiabilité des sources d’opinion doit être validée. Certains sites proposent une section « commentaires » afin que d’autres répliquent à l’argumentaire de la critique. Le recours à ces revues permet d’apporter des perspectives (historique, culturelle, philosophique, etc.) absentes à première lecture de l’œuvre à l’étude. On peut penser aux points de vue contemporains sur les théories de Sigmund Freud ou l’analyse du « motif du double » dans le roman Frankenstein de Mary Shelley afin d’y enrichir sa compréhension.

 

La méthode de résumé par extraction consiste à compiler les fréquences d’occurrences des mots dans un texte, de filtrer certains mots communs et d’assigner une pondération à ceux-ci (actif/passif, négatif/positif). Cette méthode se prête bien au traitement informatique. Comme nous avons vu, le nuage de mots n’utilise que la fréquence d’occurrence – Il ne peut qu’indiquer, d’une façon très superficielle, le sujet d’un article ou d’un chapitre. À l’aide d’un thesaurus, certains logiciels ciblent les phrases d’un texte qui atteignent les plus hautes cotes selon les critères propres au besoin : la « pertinence » – pour les résultats de recherche web par exemple.

 

Le logiciel Antidote propose, parmi un de ses prismes de révision, la statistique des mots. Ceci permet à un rédacteur de cibler l’utilisation de certains mots (tels les verbes ternes, les mots de sens faible ou flou) afin de pouvoir varier le champ lexical ou d’écrire avec plus de précision.

 

La fonction Résumeur du logiciel Médialexie utilise cette méthode afin de proposer les cinq ou dix phrases les plus probables de présenter une synthèse du texte. Il peut être utile durant la prélecture afin de s’intéresser au sujet ou de consulter un dictionnaire de mots inconnus.

 

Une utilisation intéressante pour l’apprenant visuel est la création d’un schéma conceptuel (un « mind map ») à partir de ce processus. C’est ce qu’offre le logiciel Xmind par le biais de son module « summerizer », à partir de page web Wikipédia. Cette option s’intègre bien dans le processus de préparation à la rédaction. Puisqu’un début de schéma est proposé, l’étudiant peut compléter le schéma de rédaction, basculer le tout en plan de rédaction dans Word et finalement mettre en phrase le texte.

 

La dernière forme de résumé est basée sur la compression de phrase. C’est ce qu’un étudiant fait en surlignant certains mots d’un texte avec un crayon de couleur translucide. Le repérage lors de la révision est facilité par cette utilisation de couleur (ou par le soulignement), mais requière la manipulation constante de chacune des pages. Il a aussi le désavantage de n’être que des parties de phrases – une série de mots disjointe de son ensemble contextuel. Il serait tout de même pertinent pour l’étudiant de développer ses habiletés de synthèse et de reformulation – des compétences très utiles pour l’ensemble de ses études et de sa carrière!

 

1 Recherche sur Google « doc », 11 avril 2014. Essayez-le!

1 Traduction de l’anglais pour « Data mining », « Business intelligence » et de « Continuous quality control ».

 

1 Sonia Maréchal, 8 octobre 2009, http://algorythmes.blogspot.ca/2009_10_01_archive.html

1 http://medialexie.ca/fr/logiciels/lire-ecrire/fonctions-daides/