Résumés
Résumé
Une tâche importante en philosophie est la lecture et l’analyse de textes pour en dégager les concepts. L’objectif de la présente étude est d’explorer la possibilité d’une assistance computationnelle pour effectuer cette tâche. Une méthode classique est le concordancier, mais celle-ci ne permet pas de distinguer les extraits où le concept n’est pas exprimé de manière canonique. Nous proposons une méthode permettant de reconnaître ces extraits, que nous appliquons à un corpus d’articles de la revue Philosophiques. Nous déterminons d’abord les extraits où le concept est exprimé de manière explicite. Ensuite, nous déterminons les extraits les moins susceptibles d’exprimer le concept cible. Enfin, nous utilisons plusieurs classifieurs afin de distinguer les extraits où le concept est exprimé de manière implicite. Les résultats montrent une différence significative entre les classifieurs les plus performants, machines à vecteurs de support et réseaux de neurones, et certains modèles probabilistes classiques.
Mots-clés :
- concept,
- lecture et analyse conceptuelle de texte assistées par ordinateur,
- LACTAO,
- word2vec,
- doc2vec,
- machine à vecteurs de support,
- réseau de neurones artificiel
Abstract
An important task in philosophy is reading and analyzing texts to identify concepts. The objective of this study is to explore the possibility of a computational support for this task. A classic method is the concordancer, but this approach does not make it possible to distinguish the excerpts where the concept is not expressed in a canonical way. We propose a method to identify these excerpts that we apply to a corpus of articles from the journal Philosophiques. We first determine the excerpts where the concept is expressed explicitly. Then, we identify the excerpts least likely to express the target concept. Finally, we train several classifiers to distinguish the excerpts where the concept is implicitly expressed. The results show a significant difference between the most efficient classifiers, support vector machines and neural networks, and some classical probabilistic models.
Keywords:
- concept,
- computer assisted conceptual analysis of texts,
- CACAT,
- word2vec,
- doc2vec,
- support vector machine,
- svm,
- artificial neural network