Abstracts
Résumé
Quatre-vingt-trois rituels de Chevaliers Kadosh, approximativement datés de 1750 à ce jour, sont traités numériquement par des méthodes de fouille de textes ou d’analyse lexicale (Data mining). Pour faciliter la compréhension du travail, ces méthodes sont brièvement décrites et les logiciels de mises en oeuvre sont comparés.
Il s’agit, pour ces textes de dates de première occurrence incertaines, de tenter d’établir des critères chronologiques et des caractères de parenté. Une ressource nécessaire à l’établissement de la filiation vraisemblable de ces rituels paraît être l’établissement d’un dendrogramme phylogénétique. Un tel arbre est construit à partir du concept de distance afin de comparer numériquement la proximité (similarité) ou l’éloignement (dissimilarité) de ces textes. Par commodité de traitement numérique, c’est une métrique fondée sur le khi2, ou méthode de Muller, qui est exploitée a priori sur les formes graphiques. Il apparaît a posteriori que la même métrique utilisée sur les fonctions syntaxiques conduit à un arbre phylogénétique quasi identique.
Mots-clés :
- Fouille de texte,
- distance lexicale,
- datation,
- fonctions syntaxiques,
- arbre phylogénétique,
- rituels maçonniques
Abstract
Eighty-three rituals for the Kadosh Knight grade of the Scottish rite, dated approximately from 1750 to the present day, are digitally processed by methods of text mining or lexical analysis. To facilitate the understanding of our work, these methods are briefly described and software implementations are compared.
For these texts, dates of first appearance are often uncertain, and so we attempt to establish chronological criteria and elements of kinship. A phylogenetic dendrogram appears as a necessary resource to determine the probable parentage of these rituals. Such a tree is built on the concept of distance and thus allows to compare the numerical proximity (similarity) or distance (dissimilarity) of these texts. For the purpose of digital processing, a metric based on Muller’s method or khi2 is used a priori on the graphical forms. It appears in retrospect that the same metric, when used on syntactic functions, leads to a nearly identical phylogenetic tree.
Keywords:
- Text Mining,
- Lexical Distance Dating,
- Syntactic Functions,
- Phylogenetic Tree,
- Rituals of Masonry
Appendices
Bibliographie
- Agulhon, Maurice, Pénitents et francs-maçons de l’Ancienne Provence, Paris, Fayard, 1984 [1968].
- Aréopage de recherche Sources, Suprême Conseil du GODF, Deux siècles de Rite Écossais Ancien Accepté en France, Paris, Dervy, 2004.
- Bayard, Jean-Pierre Bayard, Les Francs-Juges de la Sainte-Vehme, Paris, Dualpha, coll. « Vérités pour l’histoire », 2004.
- Beaurepaire, Pierre-Yves, L’Espace des francs-maçons. Une sociabilité européenne au XVIIIe siècle, Rennes, Presses universitaires de Rennes, Histoire, 2003.
- Beaurepaire, Pierre-Yves, Nobles jeux de l’arc et loges maçonniques dans la France des Lumières. Enquête sur une sociabilité en mutation, Montmorency, Ivoire-clair, « Les architectes de la connaissance », 2002.
- Benoit, Pierre, La Sainte Vehme, Paris, Albin Michel, 1958.
- Berlioz, Hector, Les francs-juges, op. 3, opéra inachevé, livret de Humbert Ferrand, 1826.
- Bonin, Emmanuel et Alain Dallo, « Hyperbase et Lexico 3, outils lexicométriques pour l’historien », Histoire et mesure, vol. 18, nos 3 et 4, 2003, p. 389-402, http://histoiremesure.revues.org/840, site consulté le 28 mai 2015.
- Brown, Dan, Da Vinci Code, Paris, J. C. Lattes, 2004.
- Brunet, Étienne, « Au fond du GOOFRE, un gisement de 44 milliards de mots », http://www.google.fr/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=1&ved=0CC8QFjAA&url=http%3A%2F%2Flexicometrica.univ-paris3.fr%2Fjadt%2Fjadt2012%2FConferenciers- invites%2FBrunet%2C%2520Etienne%2520-%2520Au%2520fond%2520du%2520GOOFRE.pdf&ei=5KwNU4a7Na6n0wW8gIHoDg&usg=AFQjCNFQe8xs4HmzT8w-dsyZG_jQzZ6DIw&bvm=bv.61965928,d.bGE, site consulté le 15 mai 2015.
- Étienne Brunet, Hyperbase. Manuel de référence, § 4 – La mesure de l’âge, 2011, p. 89, http://ancilla.unice.fr/bases/manuel.pdf, site consulté le 20 octobre 2015
- Étienne Brunet, « Peut-on mesurer la distance entre deux textes? », Corpus, no 2, 2003, http://corpus.revues.org/30, site consulté le 30 septembre 2015.
- Brunet, Étienne, Le vocabulaire de Jean Giraudoux, structure et évolution. Statistique et informatique appliquées à l’étude des textes à partir du Trésor de la langue française, Genève, Slatkine, 1978.
- Brunet, Etienne et Charles Muller, « La statistique résout-elle les problèmes d’attribution? », Strumenti critici III, 3, 1988, p. 367-387.
- Druon, Maurice, Les rois maudits, tome 1 : Le roi de fer, 1ère édition, 1955-1970.
- Ecco, Umberto, Le pendule de Foucault, traduit de l’italien par Jean-Noël Schifano, Paris, Grasset, 1990 [1988].
- Maciej Eder, Mike Kestemont et Jan Rybicki, « Stylometry with R: A Suite of Tools», dans Digital Humanities 2013, Conference Abstracts, University of Nebraska-Lincoln, 2013, p. 487-89.
- Eisenstein, Serguei et Dimitri Vassiliev, Alexandre Nevski, film historique, Moscou, 1938.
- Espalier, Limousin, « Grasset d’Orcet, le dernier témoin de l’art royal considéré comme code d’écriture des sociétés de métier », La chaîne d’union, n° 5, avril-juin, 1998, http://www.conform-edit.com/revues-maconniques/la-chaine-d-union, site consulté le 20 septembre 2015.
- Convard, Didier, Le triangle secret, Paris, Mazzarine, 2006.
- Flament, Claude et Michel-Louis Rouquette, Anatomie des idées ordinaires, comment étudier les représentations sociales, Paris, Armant Colin, 2003.
- Guérillot, Claude, La genèse du Rite Écossais Ancien et accepté, Paris, Guy Trédaniel Éditeur, 1993.
- Jannidis, Fotis et al., « Improving Burrows’ Delta: An Empirical Evaluation of Text Distance Measures », Digital Humanities, Conference Abstracts, 2015, http://dh2015.org/abstracts, site consulté le 10 août 2015.
- Knoop, Douglas et G. P. Jones, The Genesis of Freemasonry: An Account of the Rise and Development of Freemasonry in Its Operative, Accepted, and Early Speculative Phases, Manchester, Manchester University Press, 1947.
- Labbé, Cyril et Dominique Labbé, « La distance intertextuelle », Corpus, no 2, 2003, http://corpus.revues.org/31, consulté le 30 septembre 2015.
- Lafon, Pierre, « Sur la variabilité de la fréquence des formes dans un corpus », Mots, vol. 1, no 1, 1980, p. 127-165.
- Lamalle, Cédric et André Salem, « Types généralisés et topographie textuelle dans l’analyse quantitative des corpus textuels », dans Annie Morin et Pascale Sébillot (dir.), Actes des 6e Journées d’analyse des données textuelles, Saint-Malo, 2002, JADT, vol. 2, p. 403-411.
- Lassalle, Jean-Pierre, Le REAA conservatoire de la tradition occidentale, Colloque international du Rite Écossais Ancien et Accepté, Paris, 31 août 2004.
- Lebart, Ludovic, Validation Technique in Text Mining, dans Spiros Sirmakessis (dir.), Text Mining and Its Application, Berlin et Heidelberg, Springer Verlag, 2004, p. 169-178.
- Lebart, Ludovic et André Salem, Statistique textuelle, Paris, Dunod, 1994, http://lexicometrica.univ-paris3.fr/livre/st94/st94-tdm.html, p. 135, site consulté le 30 septembre 2015.
- Ligou, Daniel, Dictionnaire de la Franc-maçonnerie, Paris, Presses universitaires de France, 1987.
- Lucas, Georges, La guerre des étoiles, 1977, https://fr.wikipedia.org/wiki/Star_Wars, site consulté le 20 septembre 2015.
- Marchand, Pascal, « Un vert, ça va. Dix verts, bonjour les débats! », Bulletin de méthodologie sociologique, no 94, 2007, p. 76-83.
- Martinez, William, « L’identité nationale dans le discours de politique étrangère française. Une étude de lexicométrie chronologique », dans Actes des 4e journées d’analyse statistique de données textuelles, Université de Nice, Sophia Antipolis, mars 1998, JADT, p. 421-430.
- Mayer, David et Christian Buchta, proxy : Distance and Similarity Measures, 2008, R Package Version 0.4-1.
- Muller, Charles, Principes et méthodes de statistique lexicale, Paris, Hachette, 1977 (ouvrage réédité dans la collection Unichamp des éditions Champion, 1992, réimpression 1993).
- Naudon, Paul, Les origines religieuses et corporatives de la franc-maçonnerie, Paris, Dervy, 1953.
- Pateyron, Bernard, « Vingt-sixième degré du rite écossais ancien accepté : Écossais trinitaire ou Prince de Mercy », Revue Sources, n° 6, Suprême Conseil du GODF, Paris, 2007.
- Petruszewycz, Micheline, « L’histoire de la loi d’Estoup-Zipf : documents », Mathématiques et sciences humaines, no 4, 1973, p. 41-56.
- R Foundation for Statistical Computing, Vienne, http://www.R-project.org/, site consulté le 20 juin 2015.
- Pierre Ratinaud, Iramuteq. Interface de R pour les analyses multidimensionnelles de textes et de questionnaires. Un logiciel libre construit avec des logiciels libres, http://www.iramuteq.org/, site consulté le 21 octobre 2015.
- Reinert, Max, « Alceste, une méthodologie d’analyse des données textuelles et une Application. Aurélia de Gérard de Nerval », Bulletin de méthodologie sociologique, no 26, 1990, p. 24-54.
- Reinert, Max, « Une méthode de classification descendante hiérarchique : application à l’analyse lexicale par contexte », Les cahiers de l’analyse des données, vol. 8, n° 2, 1983, p. 187-198, http://www.numdam.org/item, site consulté le 22 septembre 2014.
- Salem, André, « Segments répétés et analyse statistique des données textuelles. Étude quantitative à propos du père Duchesne de Hébert », Histoire et mesure, vol. 1, no 2, p. 5-28.
- Tertulien, De la couronne du soldat (De corona militis) (211-212), traduction de Antoine Eugène Genoud, https://fr.wikisource.org/wiki/%C5%92uvres_compl%C3%A8tes_de_Tertullien/Genoud,_1852/De_la_Couronne_du_Soldat, site consulté le 20 octobre 2015.
- Yates, Frances Amalia, L’art de la mémoire, Paris, Gallimard, 2001 [1966].
- Yates, Frances Amalia, Les académies en France au XVIe siècle, Paris, Presses universitaires de France, coll. « Questions », 1996 [1947].
- Zipf, George Kingsley, The Psychobiology of Language: An Introduction to Dynamic Philology, Boston, Houghton-Mifflin, 1935.