Résumés
Résumé
Cette contribution présente une réflexion méthodologique consistant en la comparaison des approches et des méthodes en matière de traitement automatisé des données textuelles, le croisement des outils logiciels, voire l’utilisation des résultats des uns pour les soumettre aux autres, et défend une démarche expérimentale en lexicométrie ou textométrie.
Mots-clés :
- Lexicométrie,
- statistique textuelle,
- méthode,
- visualisation
Abstract
This paper presents a methodological reflection comparing various automated data processing techniques, approaches, and methods. It promotes the use of various types of software while working on textual data, explains how results of software can be used as data in different settings and promotes an experimental approach in atextometrical or lexicometrical field.
Keywords:
- Lexicometry,
- Data Analysis,
- Method,
- Visualization
Veuillez télécharger l’article en PDF pour le lire.
Télécharger
Parties annexes
Bibliographie
- Bakthine, Mikhaïl, La poétique de Dostoïevski, Paris, Seuil, coll. « Points », 1970 [1929].
- Christine Barats et Jean-Marc Leblanc, « Exploration de corpus multimodaux pour l’analyse d’un processus de médiatisation : l’exemple du “classement de Shanghai” dans la presse francophone (2003-2010) et de son incidence sur la présentation de soi des universités sur leurs pages Web », XIe Journées internationales d’analyse statistique des données textuelles, Liège, 13-15 juin 2012, JADT, 2012, p. 81-93, http://lexicometrica.univ-paris3.fr/jadt/jadt2012/Communications/Barats,%20Christine%20et%20al.%20-%20Exploration%20de%20corpus%20multimodaux.pdf, site consulté le 6 octobre 2015.
- Beauvisage, Thomas, « Exploiter des données morphosyntaxiques pour l’étude statistique des genres. Application au roman policier », Traitement automatique des langages, vol. 42, no 2, 2001, p. 579-608.
- Benzécri, Jean-Paul, L’Analyse des données. Leçons sur l’analyse factorielle et la reconnaissance des formes et travaux du laboratoire de statistique de l’Université de Paris VI, Paris, Dunod, 1973.
- Benzécri, Jean-Paul, Histoire et préhistoire de l’analyse des données, Paris, Dunod, 1982.
- Benzécri, Jean-Paul, Pratique de l’analyse des données, Paris, Dunod, 1980.
- Biber, Douglas, « On the Complexity of Discourse Complexity; a Multidimensional Analysis », Discourse Processes, vol. 15, no 2, 1992, p. 133-163.
- Biber, Douglas, « Using Register-Diversified Corpora for General Language Studies », Computational Linguistic, vol. 19, no 2, 1993, p. 243-258.
- Brunet, Étienne, « Au fond du goofre, un gisement de 44 milliards de mots », dans Actes des Journées internationales d’analyse statistique des données textuelles, JADT, 2012, p. 7-21.
- Brunet, Étienne, Index de l’Émile, XLIII-LIII, dans Études rousseauistes et Index des oeuvres de J.J. Rousseau, Genève, Slatkine, 1980.
- Brunet, Étienne, Index des Lettres écrites de la montagne, dans Études rousseauistes et Index des oeuvres de J.J. Rousseau, Genève, Slatkine, 1983.
- Brunet, Étienne, Le vocabulaire de Jean Giraudoux: structure et évolution. Statistique et informatique appliquées à l’étude des textes à partir des données du Trésor de la langue française, Genève, Slatkine, 1978.
- Brunet, Étienne, Le vocabulaire de Marcel Proust, Genève, Slatkine, 1983.
- Brunet, Étienne, Le vocabulaire de Zola, Genève, Slatkine, 1985.
- Callon, Michel et al., La scientométrie, Paris, Presses universitaires de France, 1993.
- Chateauraynaud, Francis, Prospéro: une technologie littéraire pour les sciences humaines, Paris, CNRS, 2003.
- Cibois, Philippe, L’analyse factorielle, Paris, Presses universitaires de France, 1994.
- Daknou, Amani et Jean-Marc Leblanc, « TextObserver/WebObserver : Propositions ergonomiques pour l’exploration et l’exploitation des données textuelles multidimensionnelles», dans Stéphane Chaudiron, Madjid Ihadjadene et Bernard Jacquemin (dir.), Dispositifs numériques : contenus interactivité et visualisation, Actes du 16e colloque international sur le document électronique (CIDE 16), Lille, 21-22 novembre 2013, Paris, Europia.
- Foucault, Michel, Dits et écrits (tome 1, 1954-1975, et tome 2, 1976-1988), Paris, Gallimard, 2001 [1994].
- Guiraud, Pierre, Problèmes et méthodes de la statistique linguistique, Paris, Presses universitaires de France, 1960.
- Kastberg, Margareta et Jean-Marc Leblanc, « Extraction des isotopies d’un corpus textuel : analyse systématique des structures sémantiques et des coocurrences à travers différents logiciels textométriques », Revue Texto, vol. XVII, n° 3, Coordonné par Christophe Cusimano, 2012, http://www.revue-texto.net/docannexe/file/3059/texto_kastberg_leblanc.pdf, site consulté le 20 septembre 2015.
- Labbé, Dominique et Denis Monière, « Essai de stylistique quantitative. Duplessis, Bourassa et Lévesque », dans Annie Morin et Pascale Sébillot, VIe Journées Internationales d’analyse des données textuelles, Saint-Malo, 13-15 mars 2002, Rennes, IRISA-INRIA, 2002, no 2, p. 561-569, https://halshs.archives-ouvertes.fr/halshs-01019903, site consulté le 5 octobre 2015.
- Lebart, Ludovic et al., Statistique exploratoire multidimensionnelle, Paris, Dunod, 2000.
- Leblanc, Jean-Marc et Marie Pérès, « Modèles tridimensionnels pour la représentation de l’état des connaissances et propositions de visualisation pour l’analyse des corpus textuels », XIIe Journées internationales d’analyse statistique des données textuelles, Paris, 3-6 juin 2014, JADT, 2014, p. 373-384, http://lexicometrica.univ-paris3.fr/jadt/jadt2014/01-ACTES/31-JADT2014.pdf, site consulté le 5 octobre 2015.
- Mayaffre, Damon, « De la lexicométrie à la logométrie », L’astrolabe, 2005, p. 1-11, https://halshs.archives-ouvertes.fr/hal-00551921/document, site consulté le 5 octobre 2015.
- Moscarola, Jean, « Balladur, Chirac, Jospin, les mots d’une campagne. Quelques exemples d’analyse lexicale avec Le Sphinx », Journées internationales d’Analyse statistique des Données Textuelles, JADT, 1995.
- Muller, Charles, Essai de statistique lexicale. L’illusion comique de P. Corneille, Paris, Klincksieck, 1964.
- Pincemin, Bénédicte et al. « Fonctionnalités textométriques : proposition de typologie selon un point de vue utilisateur », Xe Journées internationales d’analyse de données textuelles, Rome, 8-11 mars 2010, JADT, 2010, p. 341-353, https://halshs.archives-ouvertes.fr/halshs-00856446, site consulté le 5 octobre 2015.
- Rabeharisoa, Vololona, L’analyse Leximappe de la presse grand public : le cas de la controverse sur le changement climatique global, Centre de sociologie de l’innovation, École des mines, 2005, htts//web.upmf-grenoble.fr/adest/seminaires/volo.html, site consulté le 5 octobre 2015.
- Reinert, Max, « Les “mondes lexicaux” et leur “logique” à travers l’analyse statistique d’un corpus de récits de cauchemars », Langage et société, vol. 66, no 1, 1993, p. 5-39.
- Reinert, Max, « Quelques interrogations à propos de l’“objet” d’une analyse de discours de type statistique et de la réponse “Alceste” », Langage et société, vol. 90, no 1, 1999, p. 57-70.
- Salem, André, « Introduction à la résonance textuelle », VIIe Journées internationales d’analyse statistique des données textuelles, Louvain-La-Neuve, JADT, 2004, http://lexicometrica.univ-paris3.fr/jadt/jadt2004/pdf/JADT_096.pdf, site consulté le 5 octobre 2015.
- Silberztein, Max et Agnès Tutin, « NooJ, un outil pour l’enseignement des langues. Application pour l’étude de la morphologie lexicale en FLE », Apprentissage des langues et système d’information et de communication, vol. 8, no 2, 2005, p. 123-134, https://alsic.revues.org/336, site consulté le 5 octobre 2015.