Revue de l’Université de Moncton
Volume 45, Number 1-2, 2014 Les chiffres et les lettres peuvent-ils se marier ? Quinze ans de recherches au Laboratoire d’analyse de données textuelles Guest-edited by Sylvia Kasparian
Table of contents (16 articles)
Introduction
Articles
-
La lexicométrie française : naissance, évolution et perspectives
Etienne Brunet
pp. 13–33
AbstractFR:
Au terme d’une carrière de cinquante ans entièrement consacrée à la statistique linguistique, l’auteur tente d’établir un bilan de la discipline, au moins pour le domaine français. Il s’attache d’abord à évoquer les premières initiatives auxquelles sont associés entre autres les noms de Guiraud, Quemada, Gougenheim, Tournier et Muller. Puis il suit l’évolution des méthodes qui tendent à s’éloigner du modèle inférentiel prôné par Muller pour adopter une démarche descriptive où l’analyse s’appuie sur des calculs multidimensionnels. En passant de la calculette à l’ordinateur, l’outil informatique développe sa puissance sur des corpus de taille croissante, dont certains font l’objet d’un examen particulier : la BNF, Frantext, SketchEngine et enfin Google Books. La taille de ce dernier projet – qui atteint presque 100 milliards de mots pour la production française de ces deux derniers siècles – peut donner le vertige au jugement, sans effacer le doute, la composition du corpus, inégale et incertaine, faussant la chronologie. On en conclut que l’évidence aveuglante d’un résultat graphique ne doit pas en imposer à la raison. L’effet peut-être massif, et la cause obscure. La lexicométrie s’est beaucoup étendue en surface; il lui faut aussi gagner en profondeur.
EN:
After a fifty year career entirely devoted to statistical linguistics, the author attempts to establish a report on this discipline, at least for the French area. He first seeks to evoke the raw intitiatives that involve among other names Guiraud, Quemada Gougenheim, Tournier and Muller. Then he follows the evolution of methods which tend to move away from the inferential model advocated by Muller to adopt a descriptive approach where the analysis is based on multidimensional calculations. Passing from the calculator on the computer software tool developed its power on big size corpus, some of which are subject to particular scrutiny: the BNF, Frantext, SketchEngine and finally Google Books. The size of this last project - which is almost 100 billion words for the French production of the last two centuries - may make you dizzy judgment without erasing doubt, the composition of the corpus, uneven and uncertain, distorting the timeline. It is concluded that the blinding evidence of a graphic result should not impose on the reason. The effect can be massive, and the cause obscure. The lexicometry spread much surface; he must also gain depth.
-
Comprendre la monstration des crimes. Une étude comparée du récit médiatique des violences extrêmes contre les civils durant la Grande Guerre
Joceline Chabot and Sylvia Kasparian
pp. 35–55
AbstractFR:
Cet article présente les résultats d’une recherche comparée sur les récits médiatiques du « massacre des Arméniens » et des « atrocités allemandes » dans la presse canadienne francophone durant la Grande Guerre. Quelles sont les spécificités du récit de ces événements eu égard à la définition et la qualification des crimes perpétrés contre les populations civiles ? Le recours aux outils informatisés de données textuelles nous a permis de traiter 1 172 articles de presse afin de rendre visible et de comparer les termes par lesquels les « atrocités allemandes » commises contre les civils sur le front ouest en 1914 et le « massacre des Arméniens » de l’Empire ottoman en 1915-1916 se sont inscrits dans l’espace médiatique. Cette analyse comparative des actes impliquant des violences extrêmes contre les civils devrait valider notre hypothèse selon laquelle les contemporains ont compris le caractère systématique, intentionnel et radical des crimes commis par les autorités ottomanes contre la population arménienne.
EN:
This article presents the results of a comparative study on media narratives of the « Armenian massacre » and « German atrocities » in the French Canadian press during the Great War. What are the specificities of these events’ narratives pertaining to the definition and qualification of crimes perpetrated against the civilian population ? The use of computerized text data tools allowed us to process 1,172 newspaper articles in order to identify and compare the terms used to inscribe the « German atrocities » committed on civilians on the Western front in 1914 and the « Armenian massacre » in the Ottoman Empire in 1915-1916. This comparative analysis of acts of extreme violence against civilian populations should supports our hypothesis that contemporaries understood the systematic, intentional, and radical character of crimes being committed by Ottoman authorities against the Armenian population.
-
Sous la loupe d’Hyperbase : les combattants russes dans l’oeil de la presse illustrée française de 1914 à 1919
Raymond Blanchard
pp. 57–76
AbstractFR:
En nous appuyant sur un échantillon de la presse illustrée française, nous examinons les représentations des combattants russes, alliés et ennemis, entre 1914 et 1919. Précisément, nous tenterons de retracer l’évolution, d’un point de vue à la fois historique et linguistique, des dénominations et des qualifications employées dans la presse française à l’égard des combattants russes, dans le contexte du discours de propagande durant la Grande Guerre. Nous analyserons ainsi les permanences et les transformations de ces représentations. Pour ce faire, nous avons constitué notre corpus en dépouillant systématiquement trois magazines français entre 1914 et 1919, soit L’Illustration, Je sais tout et le supplément illustré du Petit Journal. Les analyses documentaires et statistiques de ce corpus à l’aide du logiciel Hyperbase nous ont permis de dresser un portrait détaillé des représentations des combattants russes telles que véhiculées par ces journaux.
EN:
This article aims to examine French representations of Russian combatants between 1914 and 1919 through a sample taken from the French illustrated press. More precisely, it will trace the evolution of the denominations and qualifications of Russian combatants from an historic and linguistic standpoint, within the context of French war propaganda during the First World War. We will thus analyze both the permanence and evolution of these representations. Our corpus is made up of a systematic selection of articles taken from three illustrated French publications during the period chosen: L’Illustration, Je sais tout, and Le Petit journal’s illustrated Sunday supplement.
-
La presse canadienne francophone et les événements du « 11 septembre » : une analyse des textes médiatiques par Sphinx et Hyperbase
Chantal Richard, Sylvia Kasparian and James de Finney
pp. 77–98
AbstractFR:
Comment les journaux francophones du Canada ont-ils traité des événements tragiques du 11 septembre 2001? Ce drame a provoqué un grand besoin de compréhension de la part de la population canadienne. Devant l’ampleur de l’événement, les médias canadiens ont réagi et proposé plusieurs articles informatifs et analytiques autour de cet événement tragique qui a bouleversé le monde entier. À partir d’un corpus constitué de 158 textes, tirés de six journaux qui représentent les principales régions francophones du Canada, Le Devoir, Le Soleil, La Presse, L’Acadie Nouvelle, Le Droit, La Liberté et représentant la totalité des textes qui font mention de l’expression « 11 septembre » dans les articles publiés entre le 11 septembre 2001 et le 12 septembre 2002, nous avons essayé de décrire par une analyse lexicale et thématique, grâce à des outils informatisés d’ADT, les représentations ainsi véhiculées dans la presse francophone au Canada.
EN:
This article examines the treatment of the tragic events of September 11th, 2001 by French-language newspapers in Canada. The Canadian population expressed a strong need to understand these events, and the Canadian media responded by publishing a number of informative and analytical articles in an effort to comprehend the magnitude of a tragedy which resonated around the world. By searching for the expression « 11 septembre » between September 11th, 2001 and September 12th, 2002 in Le Devoir, Le Soleil, La Presse, L’Acadie Nouvelle, Le Droit and La Liberté, newspapers that represent the main francophone regions of the country, we located and extracted 158 articles on the topic. This comprehensive corpus was then examined using text analysis software to produce a lexical and thematic analysis of the representations of these events in the French-language Canadian press.
-
Un oubli mémorable. Les journaux québécois face à la demande sociale de reconnaissance du génocide arménien par la communauté arménienne québécoise (1965-1998)
Joceline Chabot, Sylvia Kasparian and Christine Thériault
pp. 99–117
AbstractFR:
Depuis plus d’un demi-siècle, la communauté arménienne en diaspora lutte pour la reconnaissance du génocide commis contre les Arméniens par les autorités de l’Empire Ottoman en 1915-1916. Ce crime est l’objet d’un oubli institutionnalisé par le déni turc et l’indifférence d’une partie de la communauté internationale. C’est dans ce cadre que se situe notre article qui interroge la dynamique politique et symbolique mise en oeuvre dans l’espace médiatique québécois d’une demande de reconnaissance du génocide arménien par la communauté arménienne québécoise. Plus précisément, nous analysons l’inscription de la mémoire du génocide arménien et de sa représentation dans deux journaux québécois Le Devoir et La Presse, de son émergence dans les années 1960 jusqu’à la fin des années 1990. Le recours aux outils informatisés d’analyse de données textuelles pour l’analyse exploratoire et descriptive de notre corpus de presse représente l’un des aspects novateurs de notre recherche.
EN:
The Armenian community in diaspora has been struggling for more than half a century to have the genocide perpetrated against Armenians by the Ottoman Empire in 1915-1916 recognized. This crime has been largely ignored due to the Turkish policy of institutionalized denial and the indifference of the international community. Our paper examines the political and symbolic dynamics at work in the representation by the Quebec media of the demand by the Armenian community in Quebec for recognition of the Armenian genocide. More specifically, we analyse representation of the memory of the Armenian genocide in two Quebec newspapers, Le Devoir and La Presse, from the earliest instance of the demand for recognition in the 1960s to the end of the 1990s. Our analysis of the press corpus was done using innovative computerised textual data analysis tools.
-
Du dévoilement de certaines images mentales liées à la France dans les Conventions Nationales Acadiennes de 1881 à 1937 : une analyse rendue possible par Hyperbase
Manon Laparra-Villemonte de la Clergerie
pp. 119–135
AbstractFR:
Le présent article vise à rendre compte d’une recherche mythocritique effectuée à l’aide du logiciel de traitement de données Hyperbase sur une partie du vaste corpus des conventions nationales acadiennes, de 1881 à 1937, corpus double, à la fois discours politique et discours littéraire. Il s’agit de déterminer comment est représentée la France à l’intérieur des discours et pourquoi ces images sont-elles si présentes au sein des Conventions. Quel rôle jouent les références à la France à l’intérieur des grands discours nationalistes ? En quoi participent-elles de la construction de l’identité nationale acadienne ? Les hypothèses de travail ainsi que leurs vérifications ont été accomplies grâce aux possibilités du logiciel, en exploitant les fonctions documentaires et statistiques.
EN:
The following article presents a mythocritical research realised through the use of the Hyperbase program, on some of the many discourses of the acadian national congresses (conventions nationales acadiennes), from 1881 to 1937. The goal is to understand how and why France is represented so frequently in the speeches and to determine the role these references play in the nationalist Acadian discourse during the period. The hypothesis of the research as well as their verifications were conducted following the great possibilities of the Hyperbase program, by using both statistical and documentary fonctions.
-
Formes et fonctions des alternances de langues dans les romans contemporains hétérolingues au Canada : analyse assistée par Sphinx
Chantal Richard and Sylvia Kasparian
pp. 137–158
AbstractFR:
Cet article analyse dix romans contemporains hétérolingues dans le but de comprendre le fonctionnement et les motivations de l’hétérolinguisme littéraire par une microanalyse, suivie d’une typologie plus générale. Des milliers d’alternances de langues sont codées selon des variables de la forme et des fonctions dans le texte, et ce, à l’aide d’une grille d’analyse créée dans le logiciel Sphinx-Eurêka. Le croisement des variables de formes et fonctions permet ensuite de dégager les traits saillants de chaque roman, ce qui mène à une typologie de l’écriture hétérolingue à la fin du 20e siècle. Cette écriture peut être représentée sous forme d’une pyramide en trois sections, partant d’une approche mimétique, pour aller vers la parodie et se terminer par une approche créatrice.
EN:
This article analyzes the functions and motivations of literary code-switching and code-mixing in ten contemporary heterolingual novels. A microanalysis is followed by a more general typology. Thousands of instances of code-switching or mixing were coded according to form and function variables using a grid provided by software program Sphinx-Eurêka. A cross-referencing of these variables revealed the main characteristics of each novel, which led to a typology of heterolingual writing at the end of the 20th century. This typology places the the ten novels along the levels of a three-part pyramid. At the base is a “realistic” or mimetic approach which, doubled with irony, becomes parody, and finally, at the top, is the creative approach.
-
Analyse statistique des évangiles synoptiques : une étude de la paternité des textes par l’analyse des correspondances du taxi
Vartan Choulakian, Sylvia Kasparian, Maki Miyake, Hiroyuki Akama and Masanori Nakagawa
pp. 159–171
AbstractFR:
La généalogie des textes des évangiles synoptiques reste un sujet d’actualité. Différentes hypothèses existent quant à l’explication des similitudes ou des reprises de textes entiers d’un évangile à l’autre, dans les trois évangiles selon Matthieu, Marc et Luc. Une équipe de chercheurs japonais a réussi à identifier tous les segments communs entre les différents auteurs des évangiles de Marc, Luc et Matthieu et a construit un tableau de contingence qui décrit ces similitudes. Le tableau de contingence obtenu par le calcul des similarités dans les textes des évangiles synoptiques a été soumis à l’analyse des correspondances du taxi (ACT). L’ACT nous a permis d’obtenir des résultats interprétables et stables permettant de déduire une variante de l’hypothèse des deux évangiles.
EN:
The genealogy of the synoptic gospels is still of current interest. Different hypotheses exist regarding the similarities or the repetition of entire texts from one gospel to the next among the 3 gospels according to Matthew, Mark, and Luke. A team of Japanese researchers has identified all the segments common to these three gospel authors and has built a contingency table describing their similarities. A statistical Analysis of the contingency table calculated from the synoptic gospels is done by taxicab correspondence analysis (TCA). TCA produced stable and interpretable results, from which we deduced a variant of two gospel hypothesis.
-
Le concept de citoyenneté chez des immigrants et des membres de la société d’accueil en milieu minoritaire francophone : une analyse lexicale
Aïcha Benimmas and Sylvia Kasparian
pp. 173–197
AbstractFR:
Étant donné les changements et les mutations constantes que connaissent les sociétés sur différents plans (social, politique, économique, technologique, etc.), le concept de citoyenneté nécessite une redéfinition d’une manière continue. Si les citoyens francophones, immigrants et membres de la société d’accueil, peuvent se rejoindre grâce à la langue française, ils peuvent différer à cause de leurs autres caractéristiques identitaires à savoir, la culture, l’ethnie, la religion et l’histoire. C’est dans ce sens qu’il importe d’explorer le sens que ces différents groupes donnent aux concepts de citoyen et de participation citoyenne. L’utilisation des outils informatisés et statistiques nous a permis de relever, par un aller-retour constant entre les analyses qualitatives et quantitatives, les ressemblances et les divergences dans le discours de quatre groupes de participants à notre étude : jeunes immigrants, parents immigrants, jeunes de la société d’accueil et parents de la société d’accueil.
EN:
Given the changes and constant mutations which occur in societies at the social, political, economic, technological, and educational levels, the concept of citizenship must be continually redefined. While French-speaking citizens, immigrants and members of the host society can find common ground thanks to the French language, they can also find differences because of other characteristics linked to their identity, such as culture, ethnic background, religion, and history. This is why we must analyze the meaning that these groups give to the concepts of citizenship and citizen participation, interpreting the differences and similarities that surface in their discourse regarding these two concepts. The use of computerized tools and statistics has enabled us to find-through a constant comparison between qualitative and quantitative analyses-the perceptions, similarities, and divergences in the discourse of four groups of participants involved in our study: immigrant youth, immigrant parents, host society youth, and host society parents.
-
Analyse comparée de la dynamique d’évolution du français standard parlé dans les trois régions de Moncton, Bathurst et Edmundston, au Nouveau-Brunswick
Sylvia Kasparian and Louise Péronnet
pp. 199–214
AbstractFR:
Toute langue est soumise à la dynamique que crée la tension entre deux tendances opposées : la tendance à la diversification et la tendance à la standardisation. La tension résultant de ces deux mouvements tendanciels constitue le moteur de l’évolution d’une langue (Schogt, 1968, Breton, 1996 et Calvet, 1981). Le français parlé en Acadie du Nouveau-Brunswick est de plus en plus tiraillé par ces deux forces contradictoires de standardisation et de régionalisation. Aussi, nous nous sommes intéressées au point d’équilibre entre ces deux tendances, c’est-à-dire la description de l’état actuel de l’évolution du français parlé en Acadie du Nouveau-Brunswick, notamment à la description du français parlé en situation formelle, que nous appelons ici le « français standard acadien ». À partir d’entrevues réalisées lors d’une enquête auprès de jeunes cadres d’entreprises francophones de niveau universitaire dans trois centres urbains du Nouveau-Brunswick (Moncton, Bathurst, Edmundston), nous avons relevé les traits de variation que nous avons catégorisés selon des seuils et analysés en fonction des trois régions.
EN:
Any language is subject to the dynamics created by the tension between two opposing trends: the diversification trend and the trend towards standardization. The tension resulting from these two movements is the driving trend of the evolution of a language (Schogt, 1968; Breton, 1996; Calvet, and 1981). The French spoken in Acadian New Brunswick is increasingly torn between these two contradictory forces of standardization and regionalization. Our interest is the description of the equilibrium point between these two tendencies, the description of the current state of the evolution of spoken French in Acadia of New Brunswick, the description of the spoken French in formal situations, which we call here the "Acadian French standard". From interviews conducted during a survey of young cadres of Francophone businesses at university level in three urban centers in New Brunswick (Moncton, Bathurst, Edmundston), we identified the traits of variation that we analyzed and categorized.
-
Visualiser la cartographie postmoderne cybernétique de Régine Robin à l’aide du logiciel Hyperbase
Chantal Richard
pp. 215–231
AbstractFR:
Dans ses Papiers perdus, site Web qui se dédouble en parcours universitaire d’un côté, et créatif de l’autre, Régine Robin ne cherche pas à résoudre le problème du non-lieu, mais l’explore, l’exploite et en multiplie les possibilités. Organisés en cinq parties, les 106 fragments varient en longueur, et leur contenu est géré par des contraintes énoncées sur la page d’accueil de la section des textes de création. Malgré cette apparence d’ordre, l’auteure exprime le voeu que le texte soit reconstitué par le lecteur à sa guise, sans suivre un parcours prédéterminé. Afin d’aborder ces textes, nous ferons appel à la cartographie postmoderne, façon de décrire l’espace autour d’une manifestation du soi et de tracer de nouveaux parcours à travers les paysages postmodernes (Jones, 2007), ainsi qu’aux constellations sémantiques qui tracent les réseaux de sens par les graphes Association produits par le logiciel Hyperbase.
EN:
The author Régine Robin explores and exploits all the possibilities of cyberspace on her website titled Papiers perdus (lost papers), which is split between academic life and creative prose. On the creative side of Papiers perdus, 106 fragments of texts varying in length are organized in five sections and their content is suggested by constraints expressed by the author on her home page. Despite this illusion of order, the author encourages the reader to reconstitute these texts in any order they see fit without any guidance on her part. To create meaningful relationships between these fragments of cybertext without resorting to a linear reading, this article turns to the theory of postmodern cartography, which is a manner by which manifested subjective space can be understood as a means to access and create new paths of meaning through the postmodern world (Jones, 2007). Specifically, with the help of the software Hyperbase, I will analyze the semantic constellations which create networks of meaning through the Association graphs.
-
Structure modale des charagan - chants liturgiques arméniens - à la lumière du logiciel Sphinx : le genre, les espèces et leurs combinaisons dans la IVe Voix
Sylvia Kasparian and Aram Kerovpyan
pp. 233–254
AbstractFR:
Cet article se veut une étude originale d’application des méthodes d’analyse de données textuelles à des corpus musicaux. Aucune étude en musicologie moderne n’a encore décrit en détail le système modal en usage dans le répertoire des charagan, chants liturgiques arméniens. Dans ce répertoire, on peut déceler une vingtaine de modes musicaux qui semblent avoir été classés par convention dans un système symbolique d’oktoechos (huit modes). Ceci donne à chacun des modes de l’oktoechos le caractère d’une famille de modes plutôt que d’un seul mode spécifique. Dans cet article, nous présentons une première étape de la description de six versions différentes de 42 chants. En tout, 728 versets découpés en unités de phrases, formules, motifs, degrés ont été analysés avec le logiciel Sphinx. Notre analyse avec Sphinx permet une première description de la structure modale des charagan, faisant ressortir les spécificités des différentes versions, des degrés et des motifs propres aux différentes formules initiales, médiane et finale de ces chants.
EN:
This article is proposed as an original study on the application of the methods of textual data analysis to musical corpus. In modern musicology, the musical oktoechos of the charagan repertoire of the Armenian liturgical chant has never been described in detail. This repertoire is organized in an oktoechos (eight modes) system. In its present state, some twenty musical modes seem to have been classified by convention in a symbolic system of oktoechos. This fact gives each of the oktoechos modes the character of a mode family rather than a precise single mode. In this article, we are presenting the first stage of the description of six different versions of 42 chants belonging to the same mode and same melody-type. A total of 728 verses, divided into phrase units, are analysed with Sphinx application program. Our analysis with Sphinx allows us to show the specificities of different versions, degrees, as well as proper motifs of initial, median and final formulae of different versions of these songs. The analysis also permits to reveal characteristic formulae suits of sharakan phrases, and the environment created by different intervals which constitute this mode.
-
INTEX à l’épreuve de la description de la morphosyntaxe du verbe aller en français acadien
Aline Chapados and Sylvia Kasparian
pp. 255–272
AbstractFR:
Les utilisations du verbe aller dans les français régionaux diffèrent de celles du français standard, tant sur le plan de leurs contextes que sur le plan de leurs formes. Ce projet vise deux objectifs : d’abord, dépouiller, par l’intermédiaire de l’outil informatique INTEX les différents contextes morphosyntaxiques du verbe aller dans le roman Pélagie-la-Charrette d’Antonine Maillet, et ensuite, intégrer ces résultats au logiciel sous la forme d’un dictionnaire selon le cadre méthodologique développé par Maurice Gross au LADL (Laboratoire d’Automatique Documentaire et linguistique). Ce travail se veut un premier pas vers la création d’un dictionnaire INTEX du français acadien. Nous présenterons les formes graphiques du verbe aller telles qu’elles se présentent dans les corpus oraux et écrits ainsi que les graphes construits dans INTEX pour les décrire. Nous aborderons enfin le dictionnaire des expressions figées du verbe aller construit à partir de ces données.
EN:
The use of the verb “aller” (‘to go’) in regional french often differs from standard French, including different contexts of use and particular forms of the verb. Our project has two goals: first, to find the different morphosyntaxic contexts of the verb “aller” in Acadian French spoken in New Brunswick, using INTEX programs; second to integrate the results into software dictionaries following the methodological framework developed by Maurice Gross of the LADL. This work represents the first stage in a larger project to develop an electronic dictionary of Acadian French with INTEX. In this paper we will present the different graphic forms of the verb that were found in the oral and written corpora and also the graphs built for the description of the morphosyntax of the word. Finally we will present the dictionary of frozen expressions with the verb “aller” found in our corpora.
-
Module NooJ du français. Traitement automatique de corpus de français parlé régional
Gisèle Chevalier and Sylvia Kasparian
pp. 273–290
AbstractFR:
Le traitement automatique des corpus oraux est en plein essor. L’intérêt gagne du terrain, mais les outils restent rares. Dans notre article, nous présentons un outil que nous avons développé pour l’analyse de corpus oraux spontanés en français acadien. Ces variétés de français parlées dans les Provinces maritimes du Canada ont trois niveaux de traits caractéristiques : elles sont orales, régionales et mixtes. Notre défi fut celui d’adapter et de créer un module NooJ acadien qui permette le traitement d’un corpus présentant de telles spécificités. Nous présentons ici trois solutions développées avec NooJ : 1) la configuration d’un dictionnaire qui permette la reconnaissance orthographique et lexicale de mots présentant des traits à la fois de français standard, d’acadien traditionnel et de l’anglais ou du vernaculaire; 2) les grammaires développées pour l’analyse des traits morphologiques de la flexion nominale et verbale; 3) un graphe de désambiguïsation pour a, qui représente non seulement la 3e personne du singulier du présent du verbe avoir, mais aussi la 3e personne du pronom personnel féminin singulier en français acadien.
EN:
Automated analysis of oral corpora is still in its infancy. Interest is growing, but tools are still scarce. This paper presents processing tools that we have developed to analyze corpora of spontaneous oral speech in Acadian French. This variety of French spoken in the Maritime Provinces of Canada has three levels of characteristics: oral, regional, and mixed language traits. The challenge was to adapt an existing processing tool, NooJ, to find solutions to the problems presented by our corpora. We will present three different solutions developed with NooJ: (1) the configuration of dictionary entries that allows users to relate the orthographic and lexical representations of a word coming from standard French, traditional Acadian, English, or the vernacular; (2) grammars developed to process the morphological characteristics of nominal and verbal inflections; and (3) a disambiguation graph for the ambiguous form a, which is the 3SG pronoun in Acadian French as well as the 3SG.PRES of the auxiliary avoir.