Résumés
Résumé
Le présent article s’inscrit dans une réflexion d’ensemble menée à partir des données dictionnairiques du lexique du français sur la construction des mots à double graphie. La délimitation des constituants graphiques minimaux qui participent à la construction desdits mots et leurs répartitions dans ces données ont été le centre de notre recherche. Cette étude, qui relève de la double graphie, nous a permis de préciser les zones concrètes de difficulté que rencontrent à la fois le sujet scripteur dans son acte de production écrite et le lexicographe dans sa propre place de référence à la normativité orthographique. Notre démarche prend essentiellement appui sur le cadre théorique élaboré par Catach 1989, etc.
Abstract
The present article falls within the scope of broader research into dictionary-related data on the construction of French words with alternative written forms. The goal of the research was to determine the demarcation and distribution of the minimal graphic constituents of these words. This study allowed us to identify the precise difficulties encountered by both writers in the act of textual production and lexicographers concerned with normative spelling. The theoretical framework used was that of Catach 1989.
Corps de l’article
Quelques conseils pratiques
1er conseil. Dans un restauroute, faites attention aux écritures en trompe- l’oeil. Entre ailloli et aïoli, il n’y a aucune différence. Le premier empeste aussi bien votre table que le deuxième. Cela est aussi vrai pour goulache / goulasch / goulash, baeckeofe / bäkeofe et pageot / pajot. En ce qui concerne les boissons alcoolisées, l’essentiel est de consommer avec modération. Prenez note que l’arac n’est, par exemple, pas moins alcoolisé que l’arack ou l’arak. Ils sont tous bourrés de gnôle, de gnaule ou même de gniôle. Ce qui importe là, c’est le goût et l’ouïe. La myopie n’y est plus un handicap.
2e conseil. Dans un restoroute, les traits distinctifs de l’articulation phonétique, tels que fermé / ouvert, antérieur / postérieur, sonore / sourd, ne sont pas pris en compte. Donc, relâchez-vous et demandez un plat d’aiglefin ou d’églefin, de pochouse ou de pauchouse. Le résultat reste le même dans votre assiette. Pour les boissons alcoolisées essayez un verre de mezcal. Rassurez-vous, il n’est nullement plus fort que le mescal. Les garçons malentendants y sont toujours bienvenus.
3e conseil. Si vous avez une forte conviction chrétienne, évitez à tous les coups de prendre un étouffe-chrétien avant de quitter la table. Nous vous conseillons plutôt de prendre un étouffe-coquin. Ils ont, les deux, le même goût. Mais, au moins avec le deuxième, votre divin droit de respirer demeure intact.
4e conseil. Pour être à l’abri des doutes, gardez toujours sur vous votre Livre et un dictionnaire, de préférence le Petit Robert.
1. Introduction
Les dictionnaires de langue sont partiellement, selon le volume d’unités saisies, représentatifs d’un état du lexique d’une langue dans une synchronie donnée. Les différentes marques d’usage comme «régional», «populaire», «argot», «familial», «rare», etc. sont déjà témoins de la portée générale de ces dictionnaires. Même si la représentation des données dans la macrostructure et/ou la microstructure[1] varie constamment d’un dictionnaire à l’autre[2], ces divergences, fondées sur la «politique» éditoriale, ne mettent en doute ni l’existence d’un mot dans la communauté linguistique ni la représentativité des dictionnaires de langue en tant qu’outils pédagogiques. Les données dictionnairiques, durant l’apprentissage d’une langue, qu’elle soit maternelle ou étrangère, sont toutes des références normatives dans tous les cas où persiste le sentiment d’insécurité linguistique (difficultés orthographiques, recherche de constructions récurrentes, etc.).
Ces outils pédagogiques, et normatifs, ne sont cependant pas exempts de signes de doute et d’hésitation chaque fois que l’usage, par le biais du lexicographe, fait entrer de nouveaux mots dans le lexique. Ces signes d’hésitation se présentent à l’entrée dictionnairique par les formes graphiques et/ou correspondances phonétiques variées du mot. L’instabilité de la réalisation graphique de ces mots, issus d’emprunts ou de néologismes, relève souvent des possibilités effectives du système d’écriture. C’est à partir de ces possibilités offertes par le système que l’usage individuel ou collectif peut osciller entre les différentes formes graphiques d’une même unité linguistique. De ce fait sont assez rares les variantes formelles lexicalisées d’un mot qui relèvent de faits phonographiques hors système. Par exemple, la transcription du phonème /r/ par le phonogramme j, et la transcription des phonèmes /ʒ/ et /r/ par le phonogramme h dans le mot marijuana [marirwana / mariʒɥana] et sa variante formelle marihuana sont évidemment hors du système français d’écriture. Parmi les transcriptions phonétiques présentées dans la version électronique du Nouveau Petit Robert 1997 (pré), le seul cas qui correspond au système, c’est celui de marijuana prononcé [mariʒɥana]. Les phénomènes hors système peuvent cependant se grouper dans une sous-classe à part ayant ses propres définitions.
L’étude des variantes formelles ouvre un vaste champ d’observation sur le fonctionnement d’un système d’écriture et peut éclaircir les terrains moins exploités de la lexicographie. C’est sur quoi nous nous penchons dans ce qui suit.
Le pré constitue notre dictionnaire de référence. Durant notre recherche, le pré a aussi été la source principale de nos descriptions phonétiques. Dans le pré, la marque d’usage «Var» précède les formes variantes qui sont citées un peu partout dans les articles dictionnairiques. Sur un total de 60 000 articles, il y a 889 articles qui comportent ladite marque. Dans le souci de traiter le mot sous un seul critère de reconnaissance, nous n’avons pris en compte que les variantes formelles qui sont présentes dans la rubrique «Entrée», qui sont porteuses d’une alternance phonographique et qui sont notées par «Var»[3]. Cela concerne au total 283 entrées. Mais qu’entendons-nous au juste par variantes formelles?
2. Variante(s) formelle(s)
Nous entendons par variantes formelles toutes les représentations graphiques différentes d’une seule unité lexicale d’entrée. Les variantes formelles, dans le sens que nous attribuons à cette expression, ne sont pas des allomorphes. D’après le DLSL 1994 : 24, «On appelle allomorphes les variantes d’un morphème en fonction du contexte»[4]. Cette contextualisation est, à notre connaissance, l’un des critères communs à toutes les approches théoriques qui prennent les allomorphes comme l’objet d’étude[5]. Le critère de contextualisation peut nous informer sur les modalités de formation allomorphique de certaines unités. À titre d’exemple, le préfixe a- se réalise a- dans athématique en raison de la présence de la consonne initiale de la base, et an- devant la voyelle initiale d’une souche telle que organique (anorganique). La contextualisation morphologique peut aussi intervenir. Par exemple, le suffixe -an est l’allomorphe du suffixe -ain quand ce dernier précède le suffixe -ité (humain / humanité, romain / romanité, …). Il est bien évident que les formes lexicales telles que *aorganique et *humainité sont considérées comme erronées.
Par contre, quand nous parlons des variantes formelles d’un mot, nous parlons des formes lexicales qui coexistent et font partie du lexique attesté[6].La notion de variante formelle correspond à ce que Hjelmslev 1966 :149 appelle, généralement et pour toutes les unités linguistiques, la variation :
À l’enregistrement des éléments il faut, en analysant une langue, ajouter un enregistrement de leurs variantes. Il y en a deux espèces : les variétés qui sont reliées à leur entourage par une relation de présupposition réciproque, et les variations qui varient librement et qui n’entretiennent avec leur entourage qu’une relation sans présupposition. […] Du point de vue de la structure de la langue cette division en variantes est générale, c’est-à-dire que, par un calcul préalable, on peut l’appliquer à n’importe quelles grandeurs : toute grandeur a autant de variétés que de possibilités de relation, et chacune de ces variétés peut se diviser en un nombre infini de variations.
C’est ainsi que les alternances des constituants phonographiques des formes variantes d’un lexème peuvent aussi être baptisées alternances arbitraires. Bien que les alternances arbitraires puissent toucher également les constituants morphologiques (ex. bougre / bougresse), seules les variances formelles phonographiques seront traitées dans ce qui suit. Le groupement des unités graphiques alternantes en fonction des phonèmes correspondants nous amène à définir les quatre notions suivantes : l’archigraphème et l’archiphonème d’un côté, et le graphème de base et le sous-graphème d’un autre côté.
– Archiphonème. Il est défini dans le dlsl 1994 : 48 comme «l’intersection des ensembles formés par les traits pertinents de deux phonèmes dont l’opposition est neutralisable». La réalisation effective d’un archiphonème peut donner une variété de phonèmes qui, malgré leur différence, se distinguent nettement d’autres phonèmes de la langue et demeurent dans une zone de stabilité phonétique. Donc, on peut, selon les variétés, désigner les deux phonèmes /a/ antérieur et /ɑ/ postérieur par un seul archiphonème /a/. La correspondance graphique de l’archiphonème est l’archigraphème.
– Archigraphème. L’archigraphème est, selon Catach, Gruaz et Duprez 1986 : 17, «le graphème fondamental, représentant d’un ensemble de graphèmes, qui sont par rapport aux autres ensembles dans un rapport exclusif, correspondant au même phonème ou au même archiphonème». Ainsi, les deux phonèmes /a/ antérieur et /ɑ/ postérieur, appartenant à l’archiphonème /a/, peuvent être transcrits par deux phonogrammes a et â qui appartiennent à l’archigraphème a. On peut en déduire que le rapport entre graphème phonogrammique et archigraphème attribué est alors un rapport d’inclusion.
– Graphème (phonogrammique) de base[7]. La notion de graphème de base désigne en général la réalisation la plus fréquente d’un archigraphème. Ces graphèmes appartiennent au «système de base ou code minimal de transcription du français, nécessaire à l’expression écrite d’un scripteur débutant»[8]. Dans le même ouvrage, l’auteur présente trois niveaux de constituants phonographiques : le niveau 1 contient 45 graphèmes de base, le niveau 2 comprend 70 graphèmes (dont les 45 graphèmes de base) et le niveau 3, constitué à la fois de graphèmes de base, de graphèmes et de sous-graphèmes, contient 130 graphèmes phonographiques[9].
– Sous-graphème. La définition du sous-graphème est négative. Catach, Gruaz et Duprez 1986 : 10-31 propose quatre critères de reconnaissance du graphème de base. Ces quatre critères sont : 1° la fréquence, 2° le degré de cohésion, de stabilité, d’autonomie, 3° le degré de rapport direct avec le phonème, et 4° le degré de rentabilité ou de créativité linguistique. Le phonogramme qui ne répond pas à ces critères est un sous-graphème. L’auteur cite comme exemple le mot solennel [sɔlanεl], dans lequel le phonème /a/ est transcrit par le phonogramme en. Du fait que la relation phonographique e /a/ se présente dans moins de 5 à 6 unités du lexique, le en est considéré comme sous-graphème[10]. Ajoutons qu’un sous-graphème est souvent composé d’unités graphiques qui relèvent de niveaux différents : des signes adscrits comme le tréma, les accents (ex. ü dans Saül [sayl] et aî dans paître [pεtr]), des phonogrammes consonantiques ou vocaliques géminés (ex. la séquence zz dans les grizzli / grizzly [grizli] et la séquence oo dans l’alcool [alkɔl]), etc. Au vu de l’échange constant et hautement abondant des documents écrits de notre temps, la liste présentée dans ledit ouvrage ne peut pas être, à notre sens, une liste close. Une recherche de détail dans les dictionnaires nous convainc de cela.
3. Alternance des constituants phonographiques des variantes formelles
L’examen des rapports statistiques entre les trois paramètres archigraphème, formes variantes et phonogramme alternant fait apparaître certaines tendances générales dans les rapports phonographiques des phonèmes transcrits avec des phonogrammes alternants. La question principale est ici de savoir si ces tendances générales s’observent aussi dans l’ensemble du système.
Dans le domaine des phonogrammes alternants, deux types de variation sont à distinguer : 1° le groupe phonographique alternant transcrit un phonème identique. Nous l’examinerons en 3.1. Les unités graphiques à alternance zéro dans les formes variantes seront également traitées dans cette partie; 2° le groupe phonographique alternant transcrit deux phonèmes distincts. Nous en parlerons en 3.2.
Précisons que dans le pré, la forme variante est citée le plus souvent après la transcription phonétique. Dans certains cas, cela provoque une ambiguïté sur la correspondance phonographique exacte des phonogrammes alternants. Que peut-on dire sur l’homophonie ou la non-homophonie des formes variantes luffa [lufa] et loofa, puisque la séquence graphique oo est transcrit /ɔ/ dans looch [lɔk], /u/ dans look [luk], /ɔɔ/ dans zootechnie et enfin /oo/ dans zootechnicien [zootεknisjε͂]? Dans ces cas, la distinction entre les graphèmes et les sous-graphèmes phonographiques peut mettre en relief les correspondances phonémiques dominantes de certaines séquences graphiques. Notre jugement sur l’homophonie ou la non-homophonie des phonogrammes alternants porte particulièrement sur ces correspondances dominantes.
3.1 Alternance des phonogrammes homophones
3.1.1 Phonogrammes vocaliques
Le pré contient 100 entrées[11] dont la variante comporte une alternance vocalique. Les archigraphèmes contenant des phonogrammes vocaliques qui font partie des groupes alternants sont : A, E, I, O, U, EU, OU, AN, IN et ON. Nous présentons dans le Tableau 1 de l’Annexe le premier regroupement des unités lexicales concernées. Dans ce tableau, que nous invitons le lecteur à examiner en détail, les phonogrammes alternants sont présentés selon l’archigraphème correspondant.
L’examen de la distribution des données fait apparaître les faits suivants :
1° La distribution des archigraphèmes dans les formes variantes se présente dans l’ordre décroissant suivant : E dans 47 formes variantes, I dans 12, EU dans 10, O dans 8, A dans 6, AN dans 4, ON dans 4, OU dans 4, IN dans 3 et U dans 2 formes variantes.
Ce taux de distribution n’est en accord que partiellement avec les résultats des recherches faites sur la distribution des phonèmes du français[12]. Ces recherches ont révélé, par exemple, que les voyelles les plus fréquentes du français sont : /A/, /E/, /I/ et /ə/ caduc. On peut constater que, parmi ces voyelles, /E/ et /I/ uniquement se trouvent en tête de notre liste. L’archiphonème vocalique /A/, comme archiphonème le plus fréquent du français, n’est présent que dans 6 formes variantes, et le /ə/ n’est nullement le correspondant d’un phonogramme alternant.
La question qui peut s’imposer tout de suite est de savoir s’il y a une correspondance entre le nombre des phonogrammes alternants et le nombre des formes variantes. À l’exception de l’archigraphème E, qui contient le nombre le plus élevé à la fois de phonogrammes alternants et de variantes formelles, et malgré une distribution relativement équilibrée entre ces deux facteurs, la réponse à cette question ne peut être que négative[13]. À titre d’exemple, les archigraphèmes I et U correspondent chacun à deux phonogrammes alternants. Cependant, le premier se trouve dans douze formes et le deuxième dans deux formes variantes. Il faut alors reformuler autrement la question et chercher la réponse dans une autre zone de distribution.
L’écart important entre le taux de fréquence des phonogrammes vocaliques dans la langue en général et dans les formes variantes est, nous semble-t-il, dû à la manifestation accentuée des dispositifs graphiques des archigraphèmes dans le dernier cas. Les extensions de ces dispositifs, qui varient constamment d’un archigraphème à l’autre, n’ont aucun rapport avec la fréquence de l’archigraphème concerné dans la langue. À titre d’exemple, l’archigraphème A, l’archigraphème vocalique le plus fréquent du français, se concrétise sous six formes graphiques différentes : 3 graphèmes (a, à, â) et 3 sous-graphèmes (em, en, on). Vu sous cet angle, l’archigraphème IN, se trouvant au douzième rang de la fréquence des voyelles, couvre 5 graphèmes (in, im, en, ain, ein) et 4 sous-graphèmes (în, aim, yn, ym)[14]. Cette observation nous amène à examiner la distribution des graphèmes et des sous-graphèmes dans les phonogrammes alternants afin de déduire, s’il est possible, une tendance générale dans ce domaine.
2° La distribution des graphèmes et des sous-graphèmes dans les phonogrammes alternants va comme suit : 26 graphèmes (dont 14 graphèmes de base) et 26 sous-graphèmes forment l’ensemble des constituants graphiques des phonogrammes alternants. Dans le cadre d’un archigraphème, l’alternance de ces constituants peut se diviser en trois types :
– L’alternance graphème / graphème. Ce type d’alternance contient les 22 couples alternants homophones suivants : e/é, é/ai, e/è, è/ê, è/ai, e/ei, e/ai, é/è, e/ë, eu/e, a/â, i(e)/y, au/ô, o/au, u(e)/û, ou/û, an/en, in/ein, in/ain, on/om, im/em, am/em. Ces couples se manifestent dans 66 formes variantes.
– L’alternance graphème / sous-graphème concerne les 22 couples homophones suivants : é/ee, é/ée, é/hé, é/eh, é/oe, é/ae, ai/aî, e/ea, e/oe, e/he, a/ea, a/ah, a/ha, y/hy, o/ho, u/hu, eu/heu, eu/euh, ou/hou, oû/aou, on/un et om/um. Ces couples se répartissent dans 33 formes variantes.
– L’alternance sous-graphème / sous-graphème ne se réalise que dans les 2 couples homophones suivants : aie/aye et ö/oe. Dans notre liste, il y a seulement deux formes variantes qui les contiennent.
Ces résultats exposent clairement la portée dominante des graphèmes par rapport aux sous-graphèmes. Les premiers sont présents dans 60 couples de phonogrammes alternants, alors que les deuxièmes se présentent seulement dans 23 couples alternants. Le graphique 1 présente la distribution des graphèmes et des sous-graphèmes vocaliques dans les formes variantes.
3.1.2 Phonogrammes consonantiques
Le pré contient 139 entrées dont la variante comporte une alternance de phonogrammes consonantiques. Les archigraphèmes qui contiennent ces phonogrammes sont : C, T, N, CH, S, Z, L, F, R, G, P, GN, J, M et X.
Dans le Tableau 2, aussi dans l’Annexe, le premier regroupement des phonogrammes consonantiques alternants est présenté selon l’archigraphème correspondant. L’examen de la distribution des données fait apparaître les faits suivants :
1° La distribution des archigraphèmes dans les formes variantes se présente dans l’ordre décroissant suivant : C dans 41 formes variantes, T dans 25, N dans 18, CH dans 11, S dans 9, L dans 8, Z dans 8, F dans 5, R dans 5, G dans 3, P dans 2, GN dans 2, J dans 2, M dans 1 et X dans 1 forme variante.
Le taux de distribution de ces données montre clairement que les phonèmes correspondant aux archigraphèmes les plus fréquents dans les formes variantes ne le sont pas dans la langue en général. À titre d’exemple, on peut désigner le phonème /k/, représenté par l’archigraphème C, qui est en tête de notre liste et qui n’est rangé qu’au septième rang de la fréquence des consonnes du français[15]. D’un autre côté, l’archiphonème /R/, représenté par l’archigraphème R, qui a la fréquence la plus élevée en français, se met au neuvième rang pour sa fréquence dans les formes variantes.
D’ailleurs, à l’exception de l’archigraphème C[16], qui contient le nombre le plus élevé à la fois de phonogrammes alternants et de variantes formelles, le nombre des phonogrammes alternants que chaque archigraphème peut saisir n’est pas directement en relation avec le nombre des formes variantes concernées.
Ainsi, l’archigraphème T contient 2 phonogrammes alternants qui sont distribués dans 29 formes variantes. Mais cela n’est pas le cas de l’archigraphème S, qui, ayant 4 phonogrammes alternants, n’est présent que dans 9 formes variantes. À nouveau, la distorsion entre la fréquence des phonogrammes alternants dans les formes variantes par rapport à leur fréquence dans la langue en général est facilement observable.
Comme on l’a vu dans la partie précédente, si le champ d’observation se focalise uniquement sur la distribution des constituants phonographiques de différents niveaux dans les phonogrammes alternants, les faits dominants apparaissent. C’est ce dont nous nous occupons dans ce qui suit.
2° La distribution des graphèmes et des sous-graphèmes dans les phonogrammes alternants fait que 23 graphèmes, dont 18 de base et 21 sous-graphèmes, forment l’ensemble des constituants graphiques des phonogrammes alternants. Dans le cadre d’un archigraphème, l’alternance de ces constituants peut se diviser en trois types :
– L’alternance graphème / graphème. Ce type d’alternance concerne 9 phonogrammes alternants : c/k, c/qu, qu/k, f/ph, s/ss, s/c, ss/c, z/s (intervocalique), j/ge. Ces couples se manifestent dans 44 formes variantes.
– L’alternance graphème / sous-graphème concerne les 23 phonogrammes alternants suivants : c/kh, c/ch, c/cc, qu/cqu, gu/gh, k/kh, k/ck, k/ch, ss/sc, ch/sh, ch/sch, f/ff, gn/gni, g/gh, l/ll, m/mm, n/nn, p/pp, t/th, t/tt, r/rr,x/ct, z/x. Ces couples se distribuent dans 83 formes variantes.
– L’alternance sous-graphème / sous-graphème se réalise avec le couple rr/rrh dans 2 formes variantes de notre liste.
Grâce à ces remarques, on peut voir que la distribution des graphèmes (40 unités) est largement supérieure à celle des sous-graphèmes (23 unités). Bien que ce résultat soit généralement en accord avec celui de la distribution des graphèmes et des sous-graphèmes dans les phonogrammes vocaliques de la partie précédente, il convient de préciser que le poids des graphèmes est plus important dans le dernier cas : 60 graphèmes contre 22 sous-graphèmes[17].
Le graphique 2 présente la distribution des graphèmes et des sous-graphèmes consonantiques dans les formes variantes.
3.1.3 Phonogrammes transcrivant des semi-voyelles
Le pré contient 16 entrées dont la variante comporte une alternance de phonogrammes qui transcrivent des semi-voyelles. Les archigraphèmes qui contiennent ces phonogrammes sont I, Y, IL(L) pour le phonème /j/[18] et W pour le «phonème» /w/[19].
Dans le Tableau 3, nous avons présenté le premier regroupement des unités lexicales concernées. L’examen de la distribution des données fait apparaître que les 7 couples de phonogrammes alternants qui transcrivent le phonème /j/ sont distribués dans 14 formes variantes. Les couples alternants i/y et ï/y sont les couples les plus fréquents[20]. Ils se trouvent chacun dans 4 formes variantes. Les 5 autres couples s’observent dans 6 formes variantes. Ajoutons que les graphèmes se trouvent dans tous les couples alternants.
La seule variante qui contient un graphème et un sous-graphème est i/j. Ce couple se trouve dans 2 formes variantes. Le phonème /w/, qui se trouve dans deux seules formes variantes, est transcrit une fois par le couple ou/w et une fois par le couple ou/o. Dans les deux couples, comme on peut le constater, le graphème ou alterne avec deux sous-graphèmes w et o.
3.1.4 Alternance avec l’élément zéro
Avant de parler de l’alternance des phonogrammes non homophones, il convient de parler d’un autre cas d’homophonie de formes variantes. Celui où les formes variantes homophones se distinguent par la présence ou l’absence d’unités graphiques non fonctionnelles ou bien, selon la terminologie de C. Gruaz, les «graphons».
Les deux graphons vocaliques concernés sont e et i. Le Tableau 4 présente la distribution de ces graphons dans des formes variantes.
Ces unités graphiques sont des «graphons», car leur troncation n’a pas la moindre influence sur la prononciation globale du mot. Le e qui se trouve à la position finale des 7 formes variantes citées n’est ni le e diacritique et ni le e du féminin. Il n’est pas non plus le e de convention dans le sens où son absence ne signale pas une «faute» de français, ce qui serait le cas, par exemple, de *form. Le deuxième graphon dans ce domaine est le i qui, se trouvant à l’initiale du seul mot ixième, sert de voyelle d’appui pour prononcer le nom de la consonne X. Cela est également le cas du e géminé dans le mot tee-shirt [tiʃœrt] dont la variante est t-shirt. En ce qui concerne les graphons consonantiques, le T est le graphon le plus fréquent. Du fait qu’il est muet et qu’il se trouve à la position finale des mots concernés, il peut faire allusion à un morphogramme, c’est-à-dire un graphème porteur d’une information dérivative et instable dans sa relation avec l’oral (ex. t final dans la série dérivative abricot/abricoté/abricotier). Or, l’existence de formes variantes et l’absence de forme dérivée liée à ces mots précisent clairement son statut de graphe à alternance zéro. Cela est valable aussi pour le graphe G dans les mots cités dans ce tableau.
3.2 Alternance des phonogrammes non homophones
La possibilité de correspondance unique de plusieurs graphèmes à un seul phonème a été la base de la réalisation des formes variantes homophones. En revanche, la relation bijective entre les phonogrammes alternants et les phonèmes transcrits contribue à un changement d’image acoustique des formes variantes (ex. hourra [·ura] / hurrah [·yra]). Les phonèmes transcrits par les phonogrammes alternants, qu’ils soient vocaliques ou consonantiques, partagent constamment plusieurs traits phonétiques. Le nombre des phonogrammes alternants, celui des formes variantes et un certain nombre de régularités phonétiques qui apparaissent dans le domaine seront les nouveaux paramètres à examiner dans ce qui suit.
3.2.1 Phonogrammes vocaliques
Les phonogrammes vocaliques du français qui participent à cette alternance sont d’un nombre assez limité. L’observation des données dictionnairiques fait apparaître un seul couple alternant régulier qui est ou/u. Ce couple alternant et les formes variantes concernées sont présentés dans le Tableau 5[22].
Comme on peut le remarquer, les deux voyelles alternantes /y/ et /u/ se distinguent, tout en gardant les traits communs fermé et labial de leur articulation, par l’opposition antériorité / postériorité du point d’articulation. Mais avant d’en parler, présentons un cas d’ambiguïté de relation phonographique dans la transcription phonétique présentée dans le pré.
Dans les formes variantes tendouri [tɑ͂duri] / tandoori, loser [luzoer] / looser, luffa [lufa] / loofa, la correspondance phonique du sous-graphème oo peut être le /u/. Cette correspondance n’est pas généralisable dans la mesure où le même sous-graphème transcrit le phonème /ɔ/ dans looch [lɔk], et les phonèmes géminés /ɔɔ/ et /oo/ dans les mots zootechnie [zɔɔtεkni] et zootechnicien [zootεknisjε͂]. Cette correspondance phonographique incertaine a déjà sa trace dans la transcription du phonème /u/ par le o dans loser [luzœr] et par le u dans luffa [lufa].
À ce propos, la question de l’emprunt devient le facteur le plus important par le fait que le système du français ne présente aucune solution pour décider de l’homophonie ou de la non-homophonie de ces phonogrammes alternants. Cela peut aussi être confirmé par l’absence de sous-graphème dans les phonogrammes alternants non homophones du français.
3.2.2 Phonogrammes consonantiques
Dans les données du français, les phonogrammes alternants s’opposent majoritairement par le trait phonétique sourd / sonore. Cette opposition est présente dans trois des quatre couples alternants : /s/ : /z/, /k/ : /g/, /f/ : /v/. La suite /dʒ/ se distingue de la consonne /ʒ/ par sa complexité, qui consiste en une double articulation consécutive d’une consonne occlusive et d’une consonne fricative. La répartition de ces couples dans les formes variantes est présentée dans le Tableau 6.
Le fait de transcrire les phonèmes d’une langue par les moyens graphiques d’une autre langue cause souvent des cas fort ambigus. Prenons comme exemple le phonème d’emprunt /x/. Les phonogrammes destinés à transcrire ce phonème sont d’une variété étonnante. Ce phonème est transcrit par le j dans azulejo [asulexo], jerez [xeʀεs], jota [xɔta], par le kh dans khamsin [xamsin] et par le ch dans loch [lɔk / lɔx].
Du fait que, pour le dernier mot, les auteurs du pré ont réservé deux prononciations, et que la séquence phonographique ch transcrit aussi le phonème /ʃ/, la correspondance phonique du ch de chamsin, qui est citée comme variante de khamsin, reste tout à fait ambiguë.
3.2.3 Alternances multiples des phonogrammes
Par définition, et dans le cadre d’un couple synonymique, nous désignons par «alternance multiple» toute alternance d’un groupe de phonogrammes avec un seul phonogramme ou avec l’élément zéro. Le groupe phonographique alternant contient toujours une seule voyelle et, de ce fait, il correspond à une seule syllabe. Dans l’écriture du français, on peut citer les deux couples sconse [skɔ͂s] / skunks et tchao [tʃao] / ciao qui sont enregistrés dans le pré. Comme on peut le constater, les deuxièmes formes ne correspondent en aucun cas, dans le système français, aux transcriptions phonétiques données pour les premières formes.
4. Conclusion
Les résultats acquis dans la présente recherche mettent l’accent sur la pertinence de la notion de graphème dans le système d’écriture du français. Nous avons examiné cette unité minimale de la forme de l’expression écrite sous le seul aspect de sa correspondance avec l’oral. La fonction phonographique de cette unité relève exclusivement du système dont il est issu. Conformément aux parcours faits par Catach, pour les correspondances graphiques des 31 phonèmes[24], le français possède un ensemble de 130 phonogrammes[25]. Cela confirme qu’en français, on a plus de graphèmes que de phonèmes. Cependant, ce rapport excédentaire graphique s’observe plutôt dans les unités vocaliques[26].
Comme on le sait, le nombre des voyelles du français est plus élevé que celui des lettres qui sont, comme on le croit habituellement, censées les transcrire (à savoir a, e, i, o et u). C’est la source de la multiplication des phonogrammes vocaliques composés de plusieurs graphes. Les phonogrammes en question, qui présentent souvent divers outils graphiques pour transcrire les mêmes phonèmes, sont une des sources de l’ambiguïté des rapports phonographiques dans certaines données de l’écriture du français.
En ce qui concerne la variante formelle des phonogrammes consonantiques, le fait dominant s’observe plutôt dans les phonogrammes géminés. Dans de tels cas, les critères morphologiques ne peuvent pas être des critères déterminants. Par quels critères morphologiques le mot originel est-il écrit avec un seul n et le mot émotionnel avec deux nn? Et cela sans parler des cas où la correspondance phonique des graphèmes géminés demeure incertaine (ex. immortel [imɔrtεl] et immoral [i(m)mɔral]). Cela n’est, à notre sens, dû qu’au rapport graphique excédentaire dans l’écriture du français. L’irrégularité particulière du rapport entre consonne doublée et phonème correspondant entraîne un nombre élevé de fautes d’orthographe. Selon les résultats généraux des relevés de fautes d’orthographe que B. Eslais a fait sur 1000 copies de Certificat d’études primaires, sur 3000 mille copies de Baccalauréat et sur 1500 copies de Propédeutique, les consonnes doubles se trouvent en tête de liste (Catach 1989 : 55).
En se limitant à un seul aspect phonographique des outils graphiques, peut-on parler des productions écrites erronées, mais motivées, des apprenants du français en tant que langue étrangère et/ou langue maternelle comme les formes variantes non lexicalisées? Même si notre réponse est, a priori, affirmative, un vaste champ de recherche sur les données empiriques reste à exploiter.
Nous postulons que cette recherche doit se focaliser essentiellement sur la notion de graphème, au lieu de celle de lettre, qui demeure inapte à représenter toute la complexité du rapport phonographique du système du français. Cette recherche peut être instructive à plus d’un titre. Cette approche nous permet : 1° de mettre en relief les différents aspects orthographiques des variantes arbitraires des formes lexicales des dictionnaires de langue et, de là, d’ouvrir la porte d’une observation sur la divergence des pratiques lexicographiques; 2° de préciser concrètement les zones de difficulté que traversent les apprenants du français durant leur apprentissage de l’écriture; 3° de rendre compte des mécanismes sous-jacents de l’écriture. Les résultats concrets de cette recherche jalonneront le chemin d’une éventuelle rectification de l’orthographe, les difficultés liées à l’apprentissage et à l’enseignement de celle-ci n’étant nullement négligeables.
Parties annexes
Annexe
Annexe
Notes
-
[1]
Selon Rey-Debove 1971 : 21, «On appellera Macrostructure l’ensemble des entrées ordonnées […]. On appellera Microstructure l’ensemble des informations ordonnées de chaque article […]».
-
[2]
À titre d’exemple, les mots écrits jeune, jeunement, jeunet, jeunot, jeunesse, rajeunir, rajeunissant et rajeunissement occupent huit entrées dictionnairiques dans le Nouveau Petit Robert 1997, alors que dans le Dictionnaire de la langue française Lexis 1994, les sept derniers mots sont groupés dans la partie microstructurelle d’une seule entrée qui est le mot jeune. On peut aisément allonger la liste d’autres divergences observées dans différents dictionnaires.
-
[3]
Ajoutons que la conjonction «ou» remplace parfois la marque «Var» (ex. chabrol [ʃabrɔl] ou chabrot [ʃabro]). Sur le même principe, nous ne l’avons pas prise en compte non plus.
-
[4]
Dubois et coll. 1994 Dictionnaire de linguistique et des sciences du langage, Paris, Larousse.
-
[5]
Cf. Gruaz 1987 : 50, Gardes-Tamine 1998 : 66 et Corbin 1991 : 285. Les critères d’ordre sémantique ou étymologique peuvent cependant être pris en considération afin d’identifier les allomorphes. On lit dans le Robert Méthodique 1989 : XVII : «La notion d’allomorphe lexical relève d’une perspective historique; en synchronie, les allomorphes lexicaux ne sont que des synonymes (même sens, forme différente). […] En ce qui concerne les allomorphes en distribution complémentaire, qui dépendent du contexte, on a considéré que ce qui était valable pour les mots l’était pour les morphèmes».
-
[6]
Peut-on établir une certaine relation entre les formes variantes et le registre? À notre sens, il paraît excessif de faire intervenir la notion de registre afin de préciser la place des formes variantes qui se distinguent par une seule alternance phonographique dans la langue. Le maintien des formes graphiques d’un mot dans une période de son évolution, ou l’enregistrement croisé des formes graphiques de mots d’emprunt et de leurs équivalents formels dans la langue, fournissent des explications plus adéquates dans un tel cas.
-
[7]
Un graphème phonogrammique est une unité minimale de l’écriture orthographique qui transcrit un phonème. Dans cet article, nous l’appelons simplement graphème ou phonogramme.
-
[8]
Catach, Gruaz et Duprez 1986 : 36.
-
[9]
Ibid. : 10-15.
-
[10]
Ibid. : 14-15.
-
[11]
Dans le cas où le groupe phonographique alternant se trouvait dans une série dérivative, nous ne l’avons compté qu’une seule fois (ex. au /ô dans taule / tôle, qui se trouve également dans taulier / tôlier et taulard / tôlard).
-
[12]
Cf. Haton et Lamotte 1971, cité dans Catach, Gruaz et Duprez 1986 : 51-53.
-
[13]
En allant de l’unité graphique vers l’unité phonique, on observe une équivalence dans la distribution des phonogrammes dans les formes variantes. En effet, on constate que les 16 phonogrammes alternants qui correspondent aux phonèmes à un seul timbre (à savoir /i/, /ɑ͂/, /ɔ͂/, /u/, /ε͂/, /y/) se répartissent dans 29 formes variantes (soit en moyenne 2 formes variantes pour chaque couple alternant). Ce taux n’est pas loin de la distribution des 32 phonogrammes alternants qui transcrivent les voyelles à deux timbres (c’est-à-dire : /A/, /O/, /E/, /EU/) dans 73 formes variantes. Curieusement, on aurait presque le même taux de distribution si on tenait compte de la distribution globale des 47 phonogrammes alternants dans les 102 formes variantes.
-
[14]
Cf. Catach, Gruaz et Duprez 1986 : 14-15, 53.
-
[15]
Cf. Haton et Lamotte 1971, cité dans Catach, Gruaz et Duprez 1986 : 51-53.
-
[16]
Ce qui était aussi le cas de l’archiphonème /E/ pour les phonogrammes vocaliques alternants.
-
[17]
Dans Catach, Gruaz et Duprez 1986 : 14-15, 42 sous-graphèmes vocaliques sont cités contre 27 sous-graphèmes consonantiques.
-
[18]
L’apparition du /j/ à la frontière morphématique fait de ce phonème un phonème de jonction. Ce phonème peut correspondre directement à un phonogramme (ex. notariat [nɔtarja]) ou non (ex. criard [krijar] ). De toute façon, seul [j] final de morphème, représentant actuel de l’ancien phonème [λ] (dit l mouillé, ou palatal), a le statut de véritable phonème; dans les autres contextes, comme dans les deux derniers exemples, il est considéré à strictement parler comme une variante prévocalique de la voyelle /i/.
-
[19]
Le phonème /w/ peut être transcrit par d’autres phonogrammes, qu’ils soient simples (ex. u de aquarelle [akwarεl]) ou composés (ex. ou de couard [kwar]). Cependant, dans un grand nombre de cas, le phonème /w/ fait partie des phonèmes transcrits par un groupe phonogrammique binaire. Les oi de voici [vwasi], oy de côtoyer [kotwaje] et oe de moellon [mwalɔ͂] en sont des exemples. Bien qu’il n’y ait pas une relation bijective entre chaque composant de ces groupes phonogrammiques et les phonèmes transcrits, le /w/ garde, à notre sens, bel et bien son statut de phonème. Cette position prend appui sur les critères distributionnels de reconnaissance des unités linguistiques, à savoir plus petite unité distinctive et plus petite unité commune. Ainsi, du fait que, dans les données du lexique du français, le /w/ peut être la plus petite unité distinctive ([wε͂] / [vε͂] dans le couple oint /vin) ou la plus petite unité commune du couple ([pwɑ] / [wε͂] dans le couple poids /oint), nous le considérons comme un phonème à part entière. Un autre point de vue fait de [w] ainsi que de [ɥ] de simples variantes prévocaliques des voyelles /u/ et /y/ respectivement, indépendamment de leur statut syllabique.
-
[20]
À propos de la distribution de la correspondance phonique de ces phonogrammes dans les textes français, Catach, Gruaz et Duprez 1986 : 39 précise que «La semi-voyelle qui apparaît dans pied, noyer, rail [raj], est notée à près de 86 % par I, qui devrait donc être retenu (mais il apparaît déjà ailleurs) comme archigraphème. La spécificité des deux autres graphèmes (ILL, 10 % d’occurrences dans les textes, Y, 3 % environ) nous les a fait inclure comme archigraphèmes».
-
[21]
Sous la rubrique étymologique, les auteurs du pré ont désigné pique et ardant comme les constituants morphologiques du mot. Il est intéressant de savoir que le mot ardant ne se trouve nulle part dans le dictionnaire et que le renvoi du mot ardant, à l’entrée dictionnairique, a été écrit ardent. Donc, nous traitons le t final comme un graphon à alternance zéro.
-
[22]
Rappelons que dans le pré, les formes variantes sont citées après la transcription phonétique de l’entrée sans aucune précision phonétique. Ainsi, en toute prudence, nous nous sommes permis de donner la transcription phonétique correspondant au phonogramme concerné. C’est le cas, par exemple, du u de guru, auquel nous avons attribué la transcription /y/ dans [gyry].
-
[23]
Le h aspiré est transcrit par /·/.
-
[24]
Cf. Catach, Gruaz et Duprez 1986 : 37.
-
[25]
Ibid. : 14-15.
-
[26]
Dans ce système d’écriture, 72 phonogrammes vocaliques transcrivent les 11 voyelles, et les 17 consonnes ne sont en correspondance qu’avec 49 phonogrammes (Catach 1986, Gruaz et Duprez : 37).
Références
- Catach, N. 1989 Les délires de l’orthographe en forme de dictionnaire, Paris, Plon.
- Catach, N. et coll. 1981 Orthographe et lexicographie : les mots composés, Paris, Nathan.
- Catach, N., C. Gruaz et D. Duprez 1986 L’orthographe française : traité théorique et pratique, Paris, Nathan.
- Corbin, D. 1991 «Introduction : la formation des mots, structures et interprétation», Lexique 10 : 7-30.
- Cronier, S. 1997 Implémentation d’une base de données dans le cadre de l’analyse du traitement des formants de mots dans le Grand Dictionnaire Encyclopédique Larousse, Mémoire de DEA, Université Charles de Gaulle, Lille III.
- Dubois, J. et coll. 1994 Dictionnaire de linguistique et des sciences du langage (DLSL), Paris, Larousse.
- Gardes-tamine, J. 1998 La grammaire, 1. Morphologie, lexicologie, Paris, Armand Colin.
- Gruaz, C. 1986 «Valeurs endoplanes et valeurs exoplanes des graphèmes français», CNRS, Liaison-HESO 14 : 49-51.
- Gruaz, C. 1987 Le mot français, cet inconnu, Publications de l’Université de Rouen.
- Gruaz, C. 1990 Du signe au sens, pour une grammaire homologique des composants du mot, Publications de l’Université de Rouen.
- Gruaz, C. 1994 «La linguistique de l’écrit est-elle scientifique?» CNRS, Liaison-HESO 23-24 :7-27.
- Gruaz, C. 1995 «Le programme EUROLEXIQUE : structure et créativité du vocabulaire français contemporain», dans Ces mots qui sont nos mots, Mélanges d’histoire de la langue française, de dialectologie et d’onomastique offerts au Professeur J. Chaurand, Cahiers de l’Institut Charles-Bruneau, Charleville-Mézières.
- Hjelmslev, L. 1966 Le langage, Paris, Minuit.
- Hjelmslev, L. 1968 Prolégomènes à une théorie du langage, Paris, Minuit.
- Hjelmslev, L. 1985 Nouveaux essais, Paris, Presses Universitaires de France.
- Rey-debove, J. 1971 Étude linguistique et sémiotique des dictionnaires français, Paris, Mouton.
- Rey-debove, J. et coll. 1997 Version électronique duNouveau Petit Robert, Dictionnaire alphabétique et analogique (pré), Paris, HAVAS interactive.
- Yaguello, M. 1990 Histoires de lettres, Paris, Seuil, collection Point-Virgule.