Article body

Introduction

Le terme « multimodal » (et ses dérivés) a connu ces récentes années un usage exponentiel dont la diffusion se fait vraisemblablement l’écho de la multiplication des travaux consacrés à ce sujet, ou tout au moins l’intégrant dans une analyse plus large dans les domaines de la didactique, des nouvelles technologies, ou de la géographie par exemple. Cette augmentation signale également, d’une part, son appropriation progressive par d’autres champs scientifiques que la médecine ou les sciences de l’information, qui ont très tôt fait usage de ce terme, et souligne d’autre part, comme l’indiquait Colletta en 2000, que « des rapprochements s’effectuent entre les gestualistes, les linguistes et phonéticiens, et également les psycholinguistes travaillant sur l’acquisition du langage » (paragr. 23).

Nous verrons par la suite (Section 1) comment cette diffusion en fait, si ce n’est un terme « à la mode », un lemme d’une grande plasticité sémantique. Ainsi, il est susceptible de ne pas renvoyer aux mêmes phénomènes paralinguistiques et sémiotiques selon les disciplines. Ceci appelle à une certaine prudence dans son usage, d’autant que le caractère polysémique est accentué par une acception variable du préfixe « multi- ».

En tant que domaine de recherche scientifique, il permet de saisir la complexité de la réalité humaine et de la communication qui recourt, intentionnellement ou non, à une multiplicité de canaux et autres supports sémiotiques pour se réaliser et faire sens. La section 2 se propose de montrer en quoi appréhender la réalité de l’activité enseignante par ce prisme offre l’occasion de rappeler, si besoin était, que les phénomènes verbaux ne constituent qu’une partie des ressources et stratégies mises en oeuvre pour transmettre savoir et savoir-faire. Comment ceux-ci sont-ils complétés, relayés, soutenus, voire éventuellement contredits par les autres modalités ? En quoi le message global s’en trouve-t-il modifié ? Par ailleurs, et la section 3 se penchera plus précisément sur ces questions : peut-on observer un effet de l’intégration du numérique dans les classes sur la multimodalité kinésique ? À quel niveau ? Ce sera l’objet de notre dernière partie.

1. Considérations épistémologiques et sémantiques

Nous verrons que le terme « multimodalité » et ses dérivés ont connu un usage de plus en plus important depuis les années 1950. Cette hausse des occurrences doit nous interroger sur le sens attribué à cette notion.

1.1. Un terme à la mode ?

Observer les occurrences sémantiques offre un aperçu de l’intérêt que suscite un terme, et pour ce qui est du monde scientifique, cela reflète en quelque sorte la dynamique de certains sujets de recherche. Ainsi, une requête réalisée à l’aide du moteur de recherche scientifique « Google Scholar », pour les termes multimodal(ité)/multimodal(ity), indique une certaine évolution depuis 1950, période à laquelle apparaît la première occurrence de ces termes, au moins pour les pages en anglais (voir tableau 1).

Tableau 1

Occurrence des termes multimodal(ité)/multimodal(ity) depuis 1950

Occurrence des termes multimodal(ité)/multimodal(ity) depuis 1950

-> See the list of tables

Si cette requête contient certains biais; la recherche a été réalisée avec Google Scholar uniquement et les résultats concernent uniquement la présence de ces termes dans les titres des ouvrages/articles. Les données récoltées offrent toutefois l’opportunité de souligner l’évolution de l’usage des lemmes retenus. Le tableau 1 met en valeur le tournant des années 2000 qui voient se développer de manière exponentielle des articles/ouvrages se prévalant de traiter ce sujet, toutes disciplines confondues : informatique, médecine, géographie, sciences du langage, etc.

Car si les sciences du langage et de l’éducation se sont aujourd’hui penchées sur le sujet, notre recherche sémantique indique qu’il a en premier lieu été traité dans des contributions relevant de la biologie/médecine, puis progressivement par les sciences de l’information et les sciences humaines (géographie, psychothérapie, sociologie, linguistique). On peut donc reconnaître au terme une certaine « plasticité » (Marquillo-Larruy, 2003) qui peut avoir plusieurs conséquences. D’une part, elle peut entraîner une forme de lutte de territoire entre plusieurs domaines de recherche, au point que certains chercheurs puissent se dire « gênés » par l’usage du terme multimodalité dans le cadre de travaux traitant des échanges en présentiel, en ce qu’ils le considèrent déjà « dans d’autres contextes pour parler du numérique[1] ». D’autre part, cette plasticité doit inviter à une réflexion contextualisée du terme employé puisqu’il ne renvoie pas nécessairement à la même réalité.

1.2. Une plasticité à interroger

Ainsi, dans le Dictionnaire de géographie (Baud, Bourgeat et Bras, 2008) les termes multimodal/intermodal, conçus comme synonymes, renvoient aux modes de transport (p. 535-536), là où, en linguistique, Enfield (2005, cité dans Stivers et Sidnell, 2005) voit deux modalités vocale/aurale et visuospatiale. D’ailleurs, au sein même d’un domaine, celui de la linguistique, l’acception diffère selon l’approche retenue. Bien que, de manière générale, « le noyau fondamental reste la réception/compréhension/production – en contexte réel de communication – du sens » (Lebrun, Lacelle et Boutin, 2012, p. 3), l’étymologie du terme n’est pas envisagée de manière similaire. Pour certains auteurs référents de la multimodalité dans le domaine de la sémiotique sociale, le terme indique la pluralité de modes et concerne « les dimensions visuelles, aurales, incorporées et spatiales de l’interaction et des contextes et des relations entre elles[2] » (MODE, 2012) et Stein (2008, p. 871) de considérer la multimodalité, toujours dans cette approche sémiotique, comme intégrant le « discours, l’écriture, l’image, le geste et le son[3] »; notons au passage la disparition de la dimension spatiale d’une définition à l’autre en sémiotique sociale. Pour Kerbrat-Orecchioni (2012), dans une approche linguistique des interactions, le terme multimodalité relève des ressources plurisémiotiques (unités linguistiques, voco-prosodiques et mimo-gestuelles) et de diverses modalités (c.-à-d. canaux de communication : auditif, visuel, tactile).

Ainsi, il semblerait que « mode », dans la conception retenue par le projet MODE, renvoie uniquement à ce que Kerbrat-Orecchioni (2012) nomme les unités plurisémiotiques, alors que pour Stein (2008), le canal visuel (donc la modalité) est envisagé dans la référence aux images. Et les modalités, telles que conçues par Kerbrat-Orecchioni (2012) et Enfield (2005), ne se superposent pas, l’une intègre le canal tactile là où l’autre préfère mettre l’emphase sur la dimension spatiale.

Nous nous apercevons donc que la plasticité du terme s’accompagne d’adaptations qui modifient peu ou prou la conception retenue et sont susceptibles d’induire un glissement sémantique notable. Aussi, un usage « sauvage » du terme, qui ne s’accompagnerait pas d’une explicitation de l’acception retenue[4] serait à même de vider progressivement la notion de sa substance et de n’en faire qu’une coquille vide. Le risque est d’autant plus important que l’usage du terme s’étant accru avec le temps, cela laisse envisager un effet de mode potentiellement néfaste pour la recherche au sens où la perspective multimodale annoncée serait principalement cosmétique.

Qui plus est, outre la racine, c’est le préfixe multi- qui interroge depuis quelque temps les scientifiques. Est-il opportun de se satisfaire du terme multimodal(ité), quitte à lui reconnaître une signification non contenue étymologiquement dans le préfixe, comme le soutiennent les membres du projet MODE lorsqu’ils considèrent l’existence de « relations » entre les dimensions ? Doit-on lui préférer les termes intermodalité (Kuhl et Meltzoff, 1984; Richer, Rabaud et Lannoy, 2015) ou transmodalité (Cappellini, 2014; Horner, Selfe et Lockridge, 2015; Murphy, 2012) pour souligner au-delà de l’existence d’une pluralité de modalités/modes, l’interaction en jeu entre ces modalités/modes ? Toutefois, dans quelle mesure le préfixe trans- serait approprié pour signaler l’interaction sachant que, étymologiquement, trans- « marque le passage, le changement » (Rey, 1998, p. 3889) ? Ainsi retrouve-t-on logiquement ce sens dans la notion « transmodal moment » (Horner et al., 2015), que les auteurs emploient pour évoquer le passage d’une modalité à une autre, sans que la question de l’interaction soit explicite ? En outre, il convient de noter que le changement induit de facto une dimension chronologique dans le passage d’une modalité à une autre alors qu’il existe parfois une synchronicité des réalisations multimodales. Or, pour rendre plus explicitement le fait que le sens d’un énoncé est rendu certes par une multiplicité de modalités et de ressources plurisémiotiques, mais également par les interactions entre elles (Watzalwick, Hermick Beavin et Jackson, 1972, p. 47), il convient, nous semble-t-il, de retenir le terme intermodalité qui, en dépit de son usage fréquent dans les travaux sur la mobilité (Richer et al., 2015), aurait pour avantage d’évoquer spécifiquement l’interaction entre les modalités. Trois termes pourraient ainsi être considérés dans une relation de complémentarité et de non-exclusivité les unes par rapport aux autres. Nous les définissons ainsi :

  • Multimodale : renvoie à l’existence d’une pluralité de modalités/ressources sémiotiques, sans qu’il y ait nécessairement (mise en) dialogue ou interaction entre elles. Nous l’utiliserons également comme terme englobant « neutre »;

  • Intermodale : indique une situation multimodale dans laquelle les modalités/ressources sémiotiques sont analysées dans leur interaction. Le sens de l’énoncé est/se construit dans ce dialogue;

  • Transmodale : réfère à une situation multimodale qui implique le passage d’une modalité à une autre : passer d’une modalité visuelle à une modalité tactile, par exemple. Si l’on peut éventuellement reconnaître une possible (mise en) interaction entre les modalités pour qu’il y ait changement, nous estimons que la question de l’interaction n’y est pas centrale.

2. Multimodalité et enseignement-apprentissage

La multimodalité est consubstantielle aux événements didactiques. Pour le bien de notre démonstration, nous distinguerons dans les paragraphes suivants la multimodalité dans l’organisation des interactions didactiques puis dans les pratiques de transmission.

2.1. Multimodalité et interactions didactiques

Les travaux menés par le collège invisible (Winkin, 1981) ont véritablement permis de se défaire du tropisme logocentrique dans la conception des interactions humaines. Même si philosophes et chercheurs ont très tôt montré le rôle des gestes dans le discours (Kendon, 2004), il va de soi que les progrès techniques et technologiques ont facilité la prise en compte des phénomènes kinésiques et vocaux, ainsi que des éléments situationnels dans l’étude des interactions. Goffman (1981), dans son ouvrage Façons de parler évoquait cela en ces termes :

Personne n’ignore que, lorsqu’un individu en présence d’autrui répond à un événement, les coups d’oeil qu’il lance, ses regards, ses changements de position sont porteurs de toutes sortes de significations, implicites et explicites.

p.7-8

Les travaux en analyse de la conversation, de par leur intérêt « naturel » pour les interactions, se sont intéressés assez tôt à comprendre le rôle des réalisations non verbales dans l’économie des échanges, donc celui de leur organisation multimodale. Ainsi, de nombreuses études ont montré dans une conception multimodale comment le sens se construisait dans les interactions (Goodwin, 2000; Stivers et Sidnell, 2005). Toutefois, dans le contexte didactique, et bien que la question du corps de l’enseignant dans la classe connaisse un regain d’intérêt depuis une quarantaine d’années, peu d’études ont porté spécifiquement sur sa place dans les interactions per se[5] (de Landsheere et Delchambre, 1979; Ferrao-Tavares, 1999). Or, force est de constater que le déroulement des interactions didactiques en classe, tout aussi spécifiques soient-elles (Altet, 1994; Cicurel, 2011; Mondada, 1995), n’en demeure pas moins consubstantiellement multimodal.

Nous prendrons pour exemple deux aspects des échanges en classe : l’organisation des tours de parole et la gestion des interactions. Bouchard (2005) a montré que la spécificité des interactions didactiques rendait inopérant le modèle d’alternance des tours de parole tel que défini par Sacks, Schegloff et Jefferson (1974). Parce que ces échanges possèdent une dimension polylogale, Bouchard (2005) considère que tous les participants peuvent être qualifiés de ratifiés et sont en quelque sorte en droit de prendre la parole, même si un élève est parfois davantage destinataire par une interpellation de l’enseignant. Dès lors, l’organisation des tours de parole est susceptible de suivre plusieurs réalisations multimodales – voire intermodales lorsque la parole et la posture s’ajoutent au lever de main, l’un venant soutenir l’autre pour rendre plus explicite le désir d’intervenir – qui s’appuient sur des éléments syntaxiques et prosodiques, constitutifs d’une sorte de partition que chacun est en mesure de lire avec plus ou moins de rigueur. Mondada (2009) montre ainsi comment des élèves manifestent verbalement et physiquement leur volonté de prise de parole. La sélection par l’enseignant du locuteur suivant peut s’effectuer par la parole ou le geste (Mondada, 1995), mais aussi par le regard (Foerster, 1990), voire par une conjonction de plusieurs modes tels que le verbal, le regard, le hochement de tête et l’orientation du corps (Azaoui, 2015a). Nos analyses montrent toutefois que le respect de cette organisation multimodale des tours de parole est parfois relégué à l’arrière-plan au profit de l’intérêt perçu des interventions. Ainsi, comme nous l’avons étudié ailleurs en détail (Azaoui, 2015a, 2015b), les normes interactionnelles attendues en classe peuvent temporairement être suspendues pour admettre une intervention usurpatrice alimentant le contenu de la leçon. De fait, contrairement à ce qu’avance Mondada (1995, p. 66) : « un savoir […] formulé en violant les règles de la prise de parole, n’est pas retenu en tant que tel » et ne se vérifie pas dans tous les contextes; la progression du cours prenant parfois le pas sur le respect des normes interactionnelles.

C’est d’ailleurs pour gérer au mieux ces normes interactionnelles que certaines ressources multimodales sont essentielles. Le chevauchement de paroles est une caractéristique des échanges en classe et l’enseignant cherche bon an, mal an, à les réguler. Dans le feu de l’action, il doit ainsi tenter de se dédoubler, non seulement pour orchestrer les échanges, pour veiller au respect des normes interactionnelles, mais également afin de construire une relation énonciative privilégiée avec chacun de ses interlocuteurs. Il met alors en oeuvre ce que nous avons nommé « ubiquité coénonciative », une compétence multimodale que l’on retrouve aussi bien en contexte de classe en présentiel (Azaoui, 2015b) qu’en situation de visioconférence (Azaoui, 2017) et que nous définissons comme la capacité à être le coénonciateur de plusieurs individus à la fois quasi simultanément grâce à la réalisation d’actes multimodaux à valeur locutoire et/ou illocutoire (Azaoui, 2015b). L’analyse intégrée des phénomènes verbaux/posturo-mimo-gestuels renseigne sur la structuration de la communication : à qui l’enseignant s’adresse-t-il et à quel moment ? Toutefois, nous avons aussi observé que la prise en compte du regard dans l’analyse, en tant que possible indicateur de l’interlocuteur ratifié (Kerbrat-Orecchioni, 1990), introduisait une forme de confusion quant à l’identité réelle de l’interlocuteur privilégié puisque cela produisait vraisemblablement un trope communicationnel (Kerbrat-Orecchioni, 1990).

2.2. Multimodalité et pratique de transmission

Ces enjeux énonciatifs s’inscrivent dans une réalité globale de transmission de savoirs, de savoir-faire et de savoir-être. Cicurel (2011) définit cet agir professoral comme l’ensemble des actions verbales et non verbales que met en oeuvre l’enseignant dans une visée de transmission. Des travaux dans divers champs scientifiques ont en effet montré, tout particulièrement depuis une cinquantaine d’années (Goldin-Meadow, 2005; Ferrao-Tavares, 1999; McCafferty et Stam, 2008; Moulin, 2004), la dimension non verbale de la pratique enseignante, qui inclut aussi bien les phénomènes vocaux que kinésiques (Tellier et Cadet, 2014). Ceux-ci participent à plusieurs degrés à la compréhension du message transmis par l’enseignant de langues ou de sciences, à la mémorisation du lexique, à l’organisation des activités présentées, mais aussi, par des jeux posturaux et proxémiques, à la construction d’une relation interpersonnelle et de la dimension psychoaffective, notamment lors du processus de différenciation (Azaoui, à paraître).

Si l’on s’intéresse à l’étayage fourni par l’enseignant, l’exemple suivant permet d’observer comment il recourt à diverses ressources non verbales orchestrées de sorte à servir son intention pédagogique.

Le caractère intermodal des corrections et explications grammaticales suivantes en classe de français langue première apparaît assez nettement. Manuel, élève de sixième (première année de collège) âgé de 11 ans répond à l’enseignante, mais commet une erreur d’accord verbal (voir tableau 2).

Tableau 2

Échange verbal entre l’enseignante et son élève Manuel[6]

Échange verbal entre l’enseignante et son élève Manuel6

-> See the list of tables

L’intervention de l’enseignante correspond à ce que Py (2000) a nommé une séquence d’évaluation normative (SEN) durant laquelle un locuteur expert intervient sur le dire de son interlocuteur sans que celui-ci ait signalé son désir d’être corrigé. Ce que met en évidence cette SEN, et que Py n’avait pas documenté, c’est le rôle qu’y tiennent la prosodie et la mimo-gestuelle. Au moment de reprendre la proposition de Manuel (« tomb:::- »), l’enseignante fronce les sourcils (voir figures 1a et 1b), exprimant ainsi la prise de conscience de cet élément non conforme. Simultanément, elle effectue une emphase prosodique sur la flexion verbale pour indiquer l’élément corrigé, emphase qu’elle accompagne d’un hochement de tête vertical (voir figures 1e et 1g).

Figure 1

Mimiques faciales et feedbacks correctifs

Mimiques faciales et feedbacks correctifs

-> See the list of figures

Ensuite, il convient de signaler que le stroke[7] des gestes produits (voir figures 2 et 3) lors des commentaires métalinguistiques est concomitant avec les éléments clés de l’explication : indice grammatical motivant l’accord (« les ») et correction grammaticale (flexion verbale « -èrent »). Ces occurrences sont en cohérence avec l’approche mcneillienne (McNeill, 2005) puisque le stroke est concomitant avec l’élément clé prononcé.

Figure 2

Accompagnement gestuel explicatif 1

Accompagnement gestuel explicatif 1

-> See the list of figures

Figure 3

Accompagnement gestuel explicatif 2

Accompagnement gestuel explicatif 2

-> See the list of figures

L’étayage intermodal de l’enseignante nous paraît tout à fait cohérent avec son objectif. Nous savons en effet que plus nous utilisons de canaux de communication, plus il est vraisemblable qu’il y aura convergence entre l’intention recherchée dans la transmission du message et sa réception par l’élève en question, car « c’est vraisemblablement à partir de cette coalition d’indices sonores et visuels que vous interprétez les paroles du locuteur et que vous lui attribuez une ou des intention(s) » (Colletta, 2004, p. 15).

C’est également ce que nous retrouvons dans l’extrait suivant tiré d’une séance de français langue seconde au secondaire. Suite à l’explication de la règle du c cédille, Antonio, un élève espagnol fait part de sa découverte.

Tableau 3

Échange verbal entre l’enseignante et Antonio

Échange verbal entre l’enseignante et Antonio

-> See the list of tables

Le corpus présenté montre que l’enseignante, gênée par la prononciation qu’Antonio fait du son [z], fait appel à cinq différentes ressources multimodales de correction :

  1. découpage syllabique du mot (tours 4-9);

  2. commentaires métalinguistiques accompagnés de gestes (aux tours 16 et 18, elle produit des gestes déictiques qui indiquent dans un premier temps l’oreille pour confirmer que ce n’est pas là que se situe la source de la difficulté, puis, dans un second temps, la bouche pour signaler que c’est à ce niveau que se joue la correction);

  3. mise en exergue prosodique du son non conforme : cho/ZE/ (tour 24);

  4. exercice de phonétique combinatoire basé sur un phénomène d’assimilation (/b/ + /z/) visant à faciliter la prononciation du /z/;

  5. accompagnement gestuel de la production de l’élève. Dans cet exemple, l’enseignante produit un geste iconique (elle trace une ligne de sa main gauche) qui lui permet d’accompagner la progression de la prononciation du son /z/ effectuée par Antonio.

À ces ressources, il convient également d’en ajouter une autre qui ne participe pas directement à la régulation phonologique, mais au processus de différenciation dans lequel s’inscrit cet échange puisque l’enseignante se rapproche d’Antonio pour individualiser la correction. Le comportement proxémique de la professeure participe ainsi à cet étayage, car il facilite la compréhension des indications et le travail collaboratif : elle est attentive au moindre changement de prononciation de son élève, lequel peut s’appuyer sur chaque indice visuel et auditif transmis par l’enseignante.

3. Intégration des outils numériques et effet sur la multimodalité

L’on peut convenir que les propos précédents donnent à voir comment l’enseignant utilise spontanément son corps, la proxémie et sa voix, au mieux grâce à une conscientisation de ces ressources par le biais de formations. Toutefois, l’utilisation plus ou moins encouragée par l’institution de divers outils numériques en classe nous invite à nous demander en quoi cet usage modifie certaines actions multimodales de l’enseignant dans sa classe.

3.1. Un multi-agenda augmenté

Les nouveaux équipements numériques acquis par les établissements accordent aux enseignants un « pouvoir d’agir » (Clot, 2008) plus et mieux. Ce dernier s’accompagne dans le même temps d’un devoir d’agir, car les outils mis à disposition fonctionnent comme des contraintes douces d’enseigner en intégrant les TICE. Leur usage s’ajoute à ce que Bucheton et Soulé (2009) nomment le multi-agenda de l’enseignant, pour décrire la multiplication des tâches que celui-ci doit réaliser dans sa classe : gestion du groupe, du tableau, de la discipline, distribution des documents, etc. Cette réalité requiert, comme nous le disions précédemment, des compétences multimodales particulières qui exigent que l’enseignant soit en mesure de se démultiplier pour mener parfois simultanément ces activités multiples tout en maintenant l’interaction avec ses élèves (Azaoui, 2015a, 2017). Or, la gestion de nouveaux outils numériques demande à ce que l’enseignant intègre ces éléments dans son agenda déjà chargé. L’outil numérique apparaît alors comme un nouvel interactant dans les échanges de classe puisque l’enseignant peut être amené à être polarisé par l’ordinateur ou sa tablette (p. ex. : pour des raisons techniques ou pour l’organisation de son activité).

Avoir équipé, tant bien que mal et de manière inégale selon les établissements et les niveaux (1er ou 2nd degré), les salles de classe d’ordinateurs a de facto introduit un élément potentiellement perturbateur dans la routine des enseignants. Alors que l’ordinateur était initialement souvent restreint à un usage administratif (faire l’appel), ou à une fonction audio, selon les dotations des établissements, les vidéoprojecteurs et leur utilisation ont progressivement permis de projeter des films ou d’autres supports pédagogiques. Bien qu’a priori basiques, des manipulations diverses sont toutefois nécessaires pour débuter le visionnage (mise en marche, extinction des lumières, fermeture des rideaux, etc.). La vidéoprojection des documents, pratique répandue chez la majorité des enseignants (Ahr et Moinard, 2017; Inspection générale de l’Éducation nationale, 2015), requiert de l’enseignant des allers-retours fréquents vers l’ordinateur relié au vidéoprojecteur. Dès lors, tout comme a pu le faire en son temps l’introduction du lecteur cassette, l’ordinateur exerce sur l’enseignant une contrainte dans son organisation matérielle et spatiale, et notamment sur son comportement proxémique.

3.2. L’ordinateur, une contrainte proxémique

Les travaux princeps de Hall (1966) ont permis de cerner l’importance de considérer la proxémie dans l’appréhension des espaces urbains et des relations interpersonnelles. Ils ont timidement été suivis, dans le domaine éducatif, d’études permettant d’en souligner le rôle en contexte d’apprentissage (Azaoui, à paraitre, sous presse; de Landsheere et Delchambre, 1979; Ferrao-Tavares, 1999; Forest, 2006; Moulin, 2004).

Nous avons montré comment les déplacements étaient dictés par plusieurs motivations pédagogiques : organisation des temps de la leçon, réaction à une demande d’élève, gestion des interactions, différenciation. Il est toutefois possible de considérer en plus de ces contraintes celle que constitue l’utilisation de l’ordinateur fixe par l’enseignant, comme en témoignent les observations de cours de sciences et vie de la terre (SVT) ou de langues (espagnol, anglais), ainsi que l’analyse de l’entretien d’autoconfrontation menée avec l’enseignante-stagiaire de SVT. Suite à une question relative à son rapport à l’espace-classe, cette dernière partage spontanément son agacement lié à l’ordinateur :

Enseignante SVT :

Je me sens toujours accrochée au bureau et aux outils et tout ça parce que j’ai l’impression que je dois toujours aller bidouiller un truc, changer un document écrire quelque chose. Et ça me permet pas enfin, j’ai beaucoup de mal à ben voilà à avoir du temps à passer entre les élèves et à aller voir un petit peu plus loin quoi […]. J’ai passé mon heure au bureau parce que j’avais des vidéos, des machins, des trucs comme ça.

Par ces propos, l’enseignante a conscience de la contrainte matérielle que représente l’ordinateur. Il est toutefois également possible d’y lire plutôt qu’une impossibilité, une incapacité à se détacher du bureau où se trouve l’ordinateur. Symboliquement lieu du savoir, le bureau se veut rassurant à plusieurs égards puisqu’il est traditionnellement celui de l’enseignant, pour aller à la rencontre des élèves qui constituent potentiellement une difficulté légitime pour une stagiaire. Cela étant dit, l’ordinateur est un obstacle à une gestion plus libre de l’espace-classe et à la construction d’une relation interindividuelle avec ses élèves. L’observation d’extraits de son cours tend à confirmer ses dires. Elle franchit rarement le périmètre réduit autour de son bureau fixe, assez imposant en classe de sciences et vie de la terre, certes pour se sentir davantage en sécurité, mais aussi pour faciliter la manipulation fréquente de l’ordinateur.

En effet, dans son cours comme dans celui d’autres enseignants observés, la projection polarise les déplacements de l’enseignant qui est amené, selon l’évolution de l’exercice ou de l’activité, à modifier régulièrement les documents projetés. S’il y a déplacement lors de la mise en route des activités, il est donc effectué près de l’ordinateur pour pouvoir y accéder rapidement lorsque nécessaire. Ainsi, une enseignante d’anglais, expérimentée, doit-elle retourner cinq fois à son ordinateur dans un laps de temps de 3 minutes 40 secondes pour effectuer ces changements nécessaires à son cours ? Durant ces actions, les échanges avec ses élèves sont momentanément interrompus sur le plan visuel (puisque son regard est orienté davantage vers l’écran de l’ordinateur ou l’image projetée ou parce qu’elle tourne le dos à ses élèves pour s’éviter un long détour afin d’accéder à l’ordinateur) et verbal dans la mesure où l’enseignante, concentrée sur ce qu’elle doit réaliser, suspend l’interaction avec ses élèves.

Conclusion

Nous le voyons, la réalité à laquelle le terme multimodal renvoie innerve constamment les pratiques professorales et les interactions de classe. Dans une conception sémiotique plus large, il conviendrait également de retenir les nombreux affichages muraux et les supports pédagogiques tels que les manuels, qui construisent une forme de mise en abîme de la multimodalité puisque, a fortiori lorsque ces derniers sont numériques, ils sont eux-mêmes multimodaux (écriture, dessins, tableaux, graphiques, audios, liens hypertextes, etc.). L’intégration des TICE vient accroître et modifier l’appréhension que l’enseignant peut avoir de son corps dans sa dimension pédagogique et dans son rapport à l’espace-classe.

Or, que ce soit l’utilisation d’une multimodalité kinésique et/ou « numérique » ou plus globalement sémiotique, la formation des enseignants en France lui consacre peu de temps (essentiellement, si ce n’est que pour la question des TICE). Éventuellement, cela s’effectue au détour d’une question jugée plus centrale telle que l’autorité, véhiculant ainsi l’idée que le corps n’aurait pas d’intérêt dans la transmission des savoirs. Cela peut s’expliquer notamment par le fait que, tout autant que les étudiants, l’institution est prioritairement intéressée par la réussite aux concours qui n’incluent rien sur ce sujet ou par la validation du stage, dont les critères d’évaluation n’incluent pas explicitement ce qui relèverait de compétences multimodales. D’ailleurs, même pour ce qui est de l’intégration du numérique, il est attendu que l’enseignant stagiaire « utilise les outils et réseaux mis en place dans l’établissement/l’école » (Ministère de l’Éducation nationale, 2015), et non pas sache les intégrer à ses préparations en cohérence avec ses objectifs pédagogiques. Tout ce qui relève donc de la manipulation et de l’intégration des TICE dans son multi-agenda est au mieux implicite, sinon vraisemblablement mésestimé par l’institution. Pour ce qui est du corps et de la voix, malgré quelques initiatives, ces ressources sont malheureusement les grands absents des maquettes de la formation dispensées dans les Écoles supérieures du professorat et de l’éducation (Azaoui et Tellier, 2018).

Au final, un défi que devrait enfin relever la formation dispensée aux enseignants est celui de prendre en compte la multimodalité dans toute sa complexité et diversité. Cela signifie prendre en compte avec tout le sérieux que le sujet mérite la multimodalité présente, si ce n’est consubstantielle à la littératie. La multimodalité dans sa globalité est plurielle, polymorphe et polysémique. Elle traverse par ailleurs toutes les disciplines enseignées et recouvre toutes les étapes du travail du professeur : de la conception des séquences à leur mise en oeuvre. Ne pas former les enseignants à cette question, et donc, par extension, ne pas enseigner les clés de compréhension de cette complexité multimodale aux élèves constituerait une gageure.