Corps de l’article

1. Introduction

Les chercheurs s’intéressent aux effets d’interaction dans les modèles statistiques depuis plusieurs décennies (Cronbach et Snow, 1977 ; Hwang, Ho et Lee, 2010 ; Kenny et Judd, 1984 ; Marden et Muyot, 1995 ; Schumacker et Marcoulides, 1998). Tel qu’illustré dans la figure 1, une variable d’interaction « affecte la direction ou la force de la relation entre une variable indépendante et une variable dépendante » (Baron et Kenny, 1986, p. 1174, traduction libre). Une variable d’interaction peut aussi être considérée comme une variable modératrice et elle se distingue d’une variable médiatrice. Le premier type répond aux questions « quand et dans quelles circonstances ? » l’effet X-Y se produit, alors que le second renvoie aux questions « comment et pourquoi ? » l’effet X-Y existe (pour plus d’informations, voir Baron et Kenny, 1986).

Figure 1

Modélisation d’une interaction entre variables observées

-> Voir la liste des figures

À l’instar de Marsh, Wen, Nagengast et Hau (2012), nous utilisons le modèle de régression linéaire multiple afin d’illustrer le concept d’interaction. Pour simplifier la démonstration, imaginons une situation où une variable dépendante Y est prédite ou estimée à l’aide des variables indépendantes X1 et X2. Mathématiquement, cette relation s’écrit :

En éducation, il n’est pas rare de procéder à une analyse de régression où une variable indépendante présente des valeurs qui peuvent varier en fonction d’une autre variable indépendante. Par exemple, Aiken et West (1991) modélisent une interaction entre le niveau d’éducation du père et celui de la mère afin de prédire les aspirations d’un enfant dans son cheminement scolaire. De la sorte, en présence d’une interaction entre les variables indépendantes X1 et X2, le modèle de régression présenté à l’équation 1 peut être réécrit de la façon suivante :

Les chercheurs sont aussi appelés à évaluer des effets d’interaction dans des modèles d’équations structurelles. Ces modèles sont une extension de l’analyse factorielle confirmatoire et ont comme objectif principal d’évaluer la relation existant entre différents construits théoriques, qui prennent la forme de variables latentes. Ce type de variable n’est pas directement observable et il doit être inféré à l’aide de variables manifestes (par exemple, les items d’un test). Pour imager cette idée, Borsboom (2008) écrivait la chose suivante : «  general intelligence, spatial ability, attitudes, and self-efficacy [qui sont des exemples de variables latentes] are not in people’s heads. When we open up a person’s head, we find a sort of gray jelly, not psychological variables  » (p. 42).

Bien que les modèles d’équations structurelles puisent leur origine de plusieurs sources (Bollen, 1989), c’est la forme développée au début des années 1970 (Jöreskog, 1970) et ayant évolué de manière importante au cours des dernières décennies (Matsueda, 2012) qui nous intéresse dans cet article. Même si la question de l’interaction entre variables latentes dans le cadre de modélisations par équations structurelles intéresse les chercheurs depuis longtemps (Aiken et West, 1991 ; Cohen et Cohen, 1975), cet objet de recherche s’est surtout imposé au cours des années 1990 et 2000 (Byrne, 2010, 2012 ; Kline, 2011 pour la 3e édition et 1998 pour la 1re édition). Depuis, deux types d’approches ont vu le jour : 1- les approches impliquant des produits d’indicateurs (product indicator approaches) (exemples : approches avec contraintes, avec contraintes partielles ou sans contraintes) et 2- les approches par distribution analytique (distribution analytic approaches) (exemples : Latent Moderated Structural Equations-LMS et Quasi-Maximum de Vraisemblance-QML) (Marsh et coll., 2012). Dans le premier type d’approche, la variable d’interaction est une variable latente comportant des indicateurs (variables manifestes). Ces indicateurs sont formés en multipliant les indicateurs des variables latentes qui sont en interaction. En revanche, les approches par distribution analytique, notamment la méthode LMS, ont été développées dans l’optique d’éliminer la nécessité de faire le produit d’indicateurs pour former la variable latente d’interaction (Klein et Moosbrugger, 2000). De la sorte, dans le second type d’approche, la variable d’interaction ne comporte pas d’indicateurs ; elle est formée en multipliant directement les deux variables latentes qui sont en interaction. De plus, par contraste avec le premier type d’approche, les approches par distribution analytique prennent en considération la non-normalité des variables latentes et de leurs indicateurs (Marsh et coll., 2012). Pour avoir un portrait exhaustif des méthodes relevant de ces approches, il est conseillé de consulter le chapitre rédigé par Marsh et ses collaborateurs (2012). De plus, une comparaison détaillée des deux types d’approches est disponible dans l’étude de Kelava et ses collaborateurs (2011).

La présente exemplification méthodologique

Le présent article vise à illustrer aux chercheurs novices comment procéder à l’analyse d’effets d’interaction impliquant des variables latentes en utilisant le plus récent type d’approche, soit celui par distribution analytique. En cohérence avec cet objectif, la structure du présent article est une exemplification méthodologique. Ce type de texte vise à « fournir des exemples de description de méthodologies spécifiques ainsi que de la présentation des résultats associés à celles-ci. […] Il existe très peu de publications consacrées spécifiquement à ce type de texte » (Revue des sciences de l’éducation, 2015). La méthode QML n’étant disponible dans aucun logiciel statistique à ce jour (pour obtenir un programme permettant d’utiliser cette méthode, voir Klein et Mùthen, 2007, p. 9), la présente exemplification méthodologique focalisera sur l’application de la méthode LMS avec le logiciel Mplus (Muthén et Muthén, 1998-2012).

2. Contexte théorique

La logique permettant de modéliser l’interaction en régression linéaire multiple, et présentée en introduction, est applicable à l’analyse de données à l’aide d’un modèle d’équations structurelles. Pour simplifier la démonstration, imaginons une situation où la variable latente endogène η, donc qui est causée par d’autres variables latentes, présente trois indicateurs (Y1, Y2 et Y3) et où les variables latentes exogènes ξ1, ξ2 et ξ3, donc qui ont un effet sur une autre variable latente, présentent respectivement quatre, deux et quatre indicateurs (X1, X2, …, X10). Dans cet exemple, un effet d’interaction est modélisé entre ξ1 et ξ3. La figure 2 présente ce modèle d’équations structurelles où les carrés représentent des variables manifestes (par exemple, les items à un test) et les cercles sont les variables latentes.

Figure 2

Modèle structurel théorique (η et ξ sont des traits latents ; λx, λy et ϒ sont des coefficients de saturation (factor loadings) ; Ф est la corrélation entre deux traits latents exogènes ; et ζ, ε et δ sont des erreurs de mesure stochastiques)

-> Voir la liste des figures

Le modèle avec interaction prend la forme suivante :

À notre connaissance, il n’existe aucune exemplification méthodologique rédigée en français s’adressant à des chercheurs novices sur le plan des analyses d’équations structurelles. Il est de notre avis qu’un tel article sera utile pour les professeurs-chercheurs, mais également pour les étudiants aux cycles supérieurs. Une exemplification méthodologique, rédigée en anglais, a récemment été effectuée pour ce type de modèle en s’appuyant sur des données empiriques dont l’objet de recherche ne relève pas du domaine de l’éducation ainsi que sur une simulation Monte Carlo (Maslowsky, Jager et Hemken, 2015). Cependant, cette dernière présente une erreur méthodologique quant à l’explication de l’effet de la présence de données asymétriques (voir la phrase en caractères gras dans le passage suivant) :

By definition, the skew of a chi-square distribution is sqrt(8/k) where k represents degrees of freedom. We used a chi-square distribution with df = 1 in our study, therefore the skew of the simulated distribution was equal to 2.83. We are not able to describe effects of other values of skew given that we simulated only the chi-square distribution with 1 degree of freedom, but we expect that the degree of bias in the LMS estimates increases with increasing skew in a chi square distribution.

Maslowsky et coll., 2015, p. 7

En fait, lors de leur simulation Monte Carlo, bien que les chercheurs précisent ne pas avoir vérifié l’effet de l’asymétrie pour une distribution de khi-carré comptant plus d’un degré de liberté (ddl ˃ 1), ils avancent l’hypothèse que plus la distribution du khi-carré sera asymétrique, plus les résultats obtenus avec la méthode LMS risquent d’être biaisés. Néanmoins, si l’on se fie à l’équation proposée pour calculer l’asymétrie de la distribution du khi-carré (√(8/k), où k = nombre de ddl), on constate que plus le nombre de degrés de liberté augmente, moins la distribution est asymétrique. Leur hypothèse n’est donc pas fondée. Outre cette erreur, l’article permet tout de même de répondre à certaines limites de la méthode LMS, notamment l’absence d’indices d’adéquation et de coefficients standardisés pour le modèle d’équations structurelles impliquant une variable d’interaction.

Sur le plan méthodologique, la présente exemplification méthodologique poursuit deux objectifs : (i) expliciter les étapes à suivre pour procéder aux analyses d’interaction avec variables latentes et interpréter l’effet d’interaction significatif et (ii) suggérer une façon efficace de présenter les résultats. Sur le plan théorique, le modèle analysé est original et contribue à faire avancer les connaissances actuelles en ce qui a trait à la motivation des filles dans les cours d’éducation physique au secondaire. La théorie des buts d’accomplissement (Ames, 1992 ; Ames et Archer, 1988) et la théorie des besoins psychologiques de base (Ryan et Deci, 2000, 2002) positionnent le climat motivationnel (maitrise et performance) et la satisfaction des besoins psychologiques (compétence, autonomie et appartenance) comme des éléments précurseurs des buts d’accomplissement. Plusieurs chercheurs ont donc supposé l’existence d’un effet d’interaction entre ces variables (Blecharz, Luszczynska, Tenenbaum, Scholz et Cieslak, 2014 ; Ciani, Middleton, Summers et Sheldon, 2010 ; Cury, Laurent, de Tonnac et Sot, 1999 ; Girard, Chouinard et St-Amand, 2015 ; Sarrazin, Tessier et Trouilloud, 2006). Néanmoins, à notre connaissance, une seule étude a vérifié empiriquement cette hypothèse en éducation physique et portait sur l’évaluation des interactions entre le climat motivationnel et le sentiment de compétence pour prédire l’adoption de buts de maitrise (Girard et coll., 2015). Aux fins de la présente exemplification, l’objectif est d’évaluer l’effet d’interaction entre le climat de performance (l’enseignant valorise la compétition, l’habileté supérieure, les résultats obtenus et l’évaluation normative, Ames et Archer, 1988) et la satisfaction du besoin d’appartenance (besoin qu’a l’individu d’être en lien avec les personnes qui l’entourent, de sentir que celles-ci s’intéressent à son bienêtre et d’avoir le désir de prendre soin d’elles, Baumeister et Leary, 1995) en cours d’année scolaire pour prédire l’adoption de buts de performance-approche (l’élève cherche à surpasser les autres et évalue son rendement selon des critères normatifs ou en se comparant à autrui, Elliot et Church, 1997) par les filles en fin d’année, et ce, en considérant leur sentiment de compétence (jugement global qu’un individu porte sur lui-même par rapport à un domaine d’activité donné, Harter et Connell, 1984).

3. Approche théorique

Pour procéder au développement théorique, une portion des données tirées de la thèse doctorale de Girard (2016) sera utilisée. Lors de l’analyse des effets d’interaction dans la thèse originale, l’échantillon n’a pas été scindé selon le sexe des élèves. Or, aux fins de la présente exemplification, seul l’échantillon des filles a été retenu et le modèle analysé ne représente qu’une portion des variables issues des deux théories à l’étude.

3.1 Sujets et considérations éthiques

Après approbation éthique, six écoles secondaires publiques et trois collèges privés francophones de la grande région de Montréal ont accepté de participer à l’étude. L’échantillon de convenance est constitué de 434 filles (âge moyen = 13,76 ans et écart-type = 0,90) de première à troisième secondaire (secondaire 1 = 70 % ; secondaire 2 = 13,8 % et secondaire 3 = 16,1 %). Le consentement écrit a été obtenu de la part de chacune des participantes et de leurs parents.

3.2 Instrumentation et déroulement

Les données présentées ont été recueillies lors de deux temps de mesure (février et mai 2014) à l’aide d’un questionnaire à items autorapportés. Le climat motivationnel et la satisfaction des besoins ont été mesurés au temps 1 et les buts d’accomplissement au temps 2. Les élèves se prononçaient sur une échelle de type Likert à cinq niveaux (1 = fortement en désaccord et 5 = fortement en accord). Les échelles utilisées ont été validées dans des études préalables et montraient des mesures de consistance interne acceptables.

L’échelle francophone à quatre items (α = 0,79) du Significant Others’ Goal Involving Roles in Sport Questionnaire-SOGIRSQ (Le Bars, Ferron, Maïano et Gernigon, 2006) a servi à mesurer la perception d’un climat motivationnel de performance (exemple : Cette année, dans mes cours d’éducation physique, mon enseignant encourage surtout les meilleurs.). Deux items (α = 0,72) de l’Échelle des besoins fondamentaux en contexte sportif (Gillet, Rosnet et Vallerand, 2008) ont servi à mesurer la satisfaction du besoin de compétence (exemple : Cette année, dans mes cours d’éducation physique, j’ai le sentiment de bien réussir.). L’échelle à quatre items utilisée (α = 0,83) dans la thèse de Galand (2001) a servi à mesurer la satisfaction du besoin d’appartenance (exemple : Cette année, dans mes cours d’éducation physique, j’aime mon groupe.). L’échelle à trois items (α = 0,91) tirée du Questionnaire francophone sur les buts d’accomplissement dans le domaine du sport et de l’exercice-QFBASE (Riou et coll., 2012) a servi à mesurer les buts de performance-approche poursuivis par les adolescentes (exemple : Généralement, dans mes cours d’éducation physique, mon but est de surpasser les autres.).

3.3 Préparation des données, analyses et vérifications préliminaires

Comme les données utilisées ont déjà servi dans un précédent projet (Girard, 2016), certaines analyses et vérifications préliminaires n’ont pas été reproduites, notamment les analyses factorielles exploratoires et le traitement des données manquantes. La méthode de maximum de vraisemblance par régression linéaire disponible dans AMOS 22 a été utilisée pour compléter la base de données originale. Ces analyses sont présentées plus en détail dans la thèse de Girard (2016, p. 67).

La théorie des grands échantillons (large-sample theory, Lehmann, 1999), dont sont issus les modèles d’équations structurelles, s’appuie sur le postulat de normalité multivariée (Byrne, 2012). Une condition essentielle, mais non suffisante, pour vérifier ce postulat réside dans l’évaluation de la normalité univariée (DeCarlo, 1997). En plus de procéder à l’analyse graphique des distributions, les valeurs d’asymétrie et d’aplatissement pour chacun des traits latents sont obtenues avec SPSS à partir des scores composites, c’est-à-dire en faisant la moyenne des items pour chacun des traits latents. Les données d’asymétrie et d’aplatissement sont aussi disponibles dans Mplus, mais seulement pour les variables observées, c’est-à-dire pour chacun des items. Comme il n’y a toujours pas de consensus quant aux seuils acceptables (Kline, 2011), en règle générale, plus la valeur absolue s’éloigne de 0, plus on peut supposer des problèmes de non-normalité. À cet effet, un test de significativité statistique peut être obtenu en divisant la statistique (asymétrie ou aplatissement) par son erreur-type. Une valeur supérieure à 1,96 (en valeur absolue) indique une déviation de la distribution normale significative au seuil de 0,05.

Même si Mplus ne permet pas d’obtenir d’indice de normalité multivariée (Byrne, 2012), dans les recherches menées en sciences sociales, il n’est pas rare que les traits latents ne respectent pas le postulat de normalité multivariée. Byrne (2012) précise d’ailleurs qu’il serait plus prudent de tenir pour acquis que ce postulat n’est pas respecté lors du choix de la méthode d’estimation. D’autant plus que l’ajout d’une variable d’interaction, tel qu’énoncé dans le cadre théorique, contrevient inévitablement au postulat de normalité. Lors de l’utilisation de la méthode LMS, des données fortement asymétriques pourraient, entre autres, biaiser l’estimation des paramètres et générer des effets d’interaction significatifs alors qu’ils ne devraient pas l’être (Cham, West, Ma et Aiken, 2012 ; Klein et Muthén, 2007). De la sorte, il est préférable d’utiliser d’emblée une méthode d’estimation robuste qui est disponible dans Mplus (Muthén et Muthén, 1998-2012). Plus précisément, lors de l’analyse d’effets d’interaction, Wang et Wang (2012) suggèrent d’utiliser la méthode du maximum de vraisemblance robuste (MLR), car elle corrige les tests statistiques et les erreurs-types des indicateurs pour la non-normalité (Trautwein, Marsh, Nagengast, Lüdtke, Nagy et Jonkmann, 2012). Dans le logiciel Mplus, d’autres méthodes d’estimation robustes sont aussi disponibles (par exemple. MLM, WLSMV, pour plus d’informations, voir Wang et Wang, 2012). Deux logiciels ont servi aux analyses : SPSS (versions 22 et 23) et Mplus (version 7.4).

Contrairement aux approches impliquant des produits d’indicateurs, la méthode LMS ne nécessite aucune transformation préalable des données. Néanmoins, pour obtenir les coefficients standardisés dans le fichier de résultats, il est nécessaire de standardiser les données avant de procéder à l’analyse en ajoutant une commande à cet effet dans la syntaxe (DEFINE: STANDARDIZE noms des variables à standardiser). Toutes les syntaxes utilisées dans la présente exemplification sont disponibles en annexe.

3.4 Évaluation du modèle d’équations structurelles sans la variable d’interaction

D’abord, le modèle d’équations structurelles doit être évalué sans inclure la variable d’interaction afin d’obtenir les indices d’ajustement du modèle, car ces derniers ne sont pas fournis dans le fichier de résultats lors de l’ajout de la variable d’interaction (Muthén, 2012). En effet, dans la syntaxe spécifiée pour évaluer l’effet d’interaction (TYPE = RANDOM et ALGORITHM = INTEGRATION), l’ajout de l’algorithme d’intégration numérique fait en sorte que la méthode de maximum de vraisemblance fournira des erreurs-types (standard errors) robustes, mais empêche le calcul des indices d’adéquation du modèle, à l’exception des valeurs du log-likelihood (Wang et Wang, 2012). Ce sont ces dernières qui serviront à évaluer l’adéquation du modèle impliquant la variable d’interaction.

Le modèle de mesure (voir figure 3) est analysé séparément du modèle structurel afin de pouvoir identifier à quelle portion du modèle sont attribuables les problèmes de spécification (Mueller et Hancock, 2008). À cette étape, il est possible de vérifier la validité convergente et discriminante des traits latents. Pour satisfaire la première condition, chaque indicateur devrait contribuer sensiblement de la même façon (faible étendue des pondérations factorielles standardisées) à l’explication du trait latent. Pour satisfaire la seconde condition, les corrélations entre les traits latents devraient être inférieures à 0,70 (Kline, 2011). Dans un deuxième temps, le modèle structurel est analysé (modèle A, voir figure 4).

Plusieurs indices d’ajustement permettent d’évaluer si un modèle s’ajuste convenablement aux données de l’échantillon. Dans la plupart des études, on retrouve au moins les cinq indices d’ajustement suivants : (i) khi-carré, (ii) CFI, (iii) TLI, (iv) SRMR et (v) RMSEA. En règle générale, le test du khi-carré (χ2) ne doit pas être significatif. Néanmoins, cet indice est sensible à la taille de l’échantillon et au non-respect de la loi normale, il est donc possible que le test du khi-carré soit significatif même si l’ajustement s’avère acceptable. C’est pourquoi d’autres indices sont aussi considérés (Byrne, 2010 ; Kline, 2011 ; Perry, Nicholls, Clough et Crust, 2015 ; Tabachnick et Fidell, 2007 ; West, Finch et Curran, 1995). Le CFI (comparative fit index) n’est pas influencé par la taille de l’échantillon. Il estime l’amélioration de la qualité d’ajustement du modèle par rapport au modèle d’indépendance. Un bon ajustement est indiqué par une valeur supérieure à 0,95 (Hu et Bentler, 1999 ; Kline, 2011). Pour le TLI (Tucker-Lewis Index, 1973), une valeur de 0,95 indique un bon ajustement du modèle. Pour le SRMR (standardized mean square residual), une valeur inférieure à 0,05 suppose un bon ajustement du modèle (Byrne, 2010 ; Hu et Bentler, 1999). Finalement, le RMSEA (root mean square error of approximation) corrige la tendance du khi-carré à rejeter le modèle. Une valeur plus petite que 0,08 indique un ajustement acceptable, une valeur inférieure à 0,05 indique un très bon ajustement et une valeur inférieure à 0,01 fait preuve d’un excellent ajustement du modèle (Byrne, 2010 ; Jöreskog et Sörbom, 1996). Pour assurer la fiabilité de cet indice, l’intervalle de confiance (Low 90-High 90) doit être peu étendu et la probabilité PCLOSE (closeness of fit) doit être supérieure à 0,50 (Byrne, 2010 ; Jöreskog et Sörbom, 1996).

3.5 Évaluation et interprétation de l’effet d’interaction

Un second modèle (modèle B, voir figure 5) est analysé en ajoutant la variable d’interaction (commande XWITH dans la syntaxe). Cette étape permet d’obtenir les coefficients de saturation (factor loadings) et de déterminer si la relation avec la variable d’interaction est significative. Avec la méthode LMS, l’effet d’interaction peut être interprété de façon similaire à celui des modèles de régression linéaire (Aiken et West, 1991) en utilisant les graphiques Excel disponibles sur le site internet (http://www.jeremydawson.co.uk/slopes.htm) de Dawson (2014). Pour terminer, la portion de variance expliquée par la variable d’interaction est obtenue en soustrayant le R2 du modèle A à celui du modèle B.

3.6 Évaluation du modèle d’équations structurelles avec la variable d’interaction

Même si la méthode LMS disponible dans Mplus ne permet pas d’obtenir les indices d’ajustement du modèle quand une variable d’interaction est impliquée (Kelava et coll., 2011 ; Wang et Wang, 2012), deux étapes faciles permettent de vérifier l’adéquation du modèle : (i) obtenir les indices d’ajustement du modèle sans la variable d’interaction (modèle A) et (ii) calculer le D du test du rapport de vraisemblance logarithmique (log-likelihood ratio test) en utilisant l’équation D = -2[(log-likelihood du modèle A) – (log-likelihood du modèle B)], où le log-likelihood correspond à la valeur H0 (H0 value) dans le fichier de résultats (Klein et Moosbrugger, 2000 ; Muthén, 2012). Ce test permet de comparer si le modèle plus parcimonieux (modèle A, sans interaction) s’ajuste moins bien aux données que le modèle plus complexe (modèle B, avec interaction). Si le modèle A présente des indices d’ajustement acceptables et qu’il présente un moins bon ajustement que le modèle plus complexe, on peut conclure que le modèle avec interaction montre aussi un ajustement acceptable aux données (Satorra, 2000 ; Satorra et Bentler, 2010). Pour déterminer si le test est significatif, on se fie à la valeur du D qui s’interprète à l’aide de la distribution du khi-carré. La différence entre le nombre de paramètres libres estimés (free parameters) des modèles B et A agit à titre de degrés de liberté. Si le test est significatif, on peut conclure que le modèle B s’ajuste mieux aux données que le modèle A. Dans la situation où le test n’est pas significatif, il n’est pas possible de déterminer si le modèle B s’ajuste de manière équivalente ou moins satisfaisante aux données que le modèle A : on peut seulement conclure que le modèle A ne s’ajuste pas moins bien aux données que le modèle B (Maslowsky et coll., 2015). Le tableau 1 récapitule les étapes à suivre pour procéder à l’analyse d’interactions avec variables latentes dans Mplus.

Tableau 1

Étapes à suivre pour appliquer la méthode LMS dans Mplus

Étapes à suivre pour appliquer la méthode LMS dans Mplus

-> Voir la liste des tableaux

3.7 Présentation des résultats

Par souci de rigueur et de clarté, la présentation des résultats se fait dans le même ordre que les étapes suggérées pour effectuer les analyses : (i) résultats des analyses et vérifications préliminaires dans un tableau (corrélations, moyennes et écart-type, données d’asymétrie et d’aplatissement et mesures de consistance interne)  ; (ii) figures présentant les coefficients standardisés du modèle de mesure et du modèle d’équations structurelles sans la variable d’interaction, indices d’ajustement et R2 du modèle A ; (iii) figure présentant les coefficients standardisés du modèle avec la variable d’interaction, R2 du modèle B, portion de variance expliquée par l’ajout de la variable d’interaction et graphique de l’effet d’interaction significatif  ; (iv) résultat du test du rapport de vraisemblance logarithmique témoignant de la qualité d’ajustement du modèle.

4. Développement théorique

Le tableau 2 présente les statistiques descriptives (corrélations, moyennes et écarts-types), les informations relatives à la normalité des données (asymétrie et aplatissement) et les mesures de consistance interne (alpha de Cronbach et omega de McDonald) calculées à partir des données de l’échantillon de convenance utilisé dans la présente exemplification.

Tableau 2

Corrélations, moyennes (écart-type), asymétrie, aplatissement, alpha de Cronbach et omega de McDonald des variables du modèle

Corrélations, moyennes (écart-type), asymétrie, aplatissement, alpha de Cronbach et omega de McDonald des variables du modèle

Note. E.T. = erreur-type ; **p ˂ 0,01

-> Voir la liste des tableaux

La matrice de corrélations révèle une association négative entre le climat de performance et la satisfaction des besoins de compétence et d’appartenance chez les filles ainsi qu’une association positive entre ce climat et l’adoption de buts de performance-approche. On remarque une forte association positive entre la satisfaction de leurs besoins de compétence et d’appartenance. Néanmoins, c’est seulement la satisfaction du besoin de compétence qui entretient une relation positive significative avec l’adoption de buts de performance-approche. Au niveau univarié, plusieurs des valeurs s’éloignent de 0 supposant un non-respect de la loi normale. Finalement, les échelles utilisées montrent une bonne consistance interne : elles atteignent toutes le seuil de 0,70.

Le modèle de mesure (voir figure 3) montre des indices d’ajustement appréciables : χ2(59) = 117,45, p ˂ 0,001 ; CFI = 0,96 ; TLI = 0,95 ; SRMR = 0,05 ; RMSEA = 0,05 [0,04-0,06, p = 0,60]. À la lecture du fichier de résultats, les données d’asymétrie (valeurs absolues oscillant entre 0,34 et 1,58) et d’aplatissement (valeurs absolues entre 0,04 et 2,01) de chacun des items s’éloignent de 0. Ce sont les valeurs associées à l’item Q3.2 qui sont les plus élevées. Par ailleurs, cet item est celui qui explique le moins bien (coefficient de détermination multiple = 0,24) le climat de performance. En effet, lors d’analyses factorielles confirmatoires, idéalement, chaque indicateur devrait expliquer une proportion élevée (coefficient de détermination multiple ˃ 0,50) de la variance du trait latent auquel il est associé (Kline, 2011). Comme l’objectif n’est pas de valider un instrument de mesure et que les valeurs de l’alpha de Cronbach sont acceptables en incluant cet item (α = 0,71), il est conservé.

Figure 3

Coefficients standardisés du modèle de mesure

-> Voir la liste des figures

Deux traits latents montrent une moins bonne validité convergente : le climat de performance (expliqué plus fortement par l’indicateur Q7.2) et la satisfaction du besoin d’appartenance (expliquée plus faiblement par l’indicateur Q24.2). De plus, la forte corrélation positive (r = 0,80) observée entre la satisfaction des besoins de compétence et d’appartenance suppose une moins bonne validité discriminante de ces traits latents. De par leur nature conceptuelle, il n’est pas étonnant que ces construits, bien que distincts, soient fortement corrélés. En effet, selon la théorie des besoins psychologiques de base (Ryan et Deci, 2000, 2002), tout individu cherche à combler trois besoins : la compétence, l’autonomie et l’appartenance. Même si leur manifestation et leur intensité peuvent varier, la quête de la satisfaction de ces trois besoins est innée et universelle, c’est-à-dire qu’elle est présente chez les individus de toutes les cultures et de tout âge. Des corrélations de même ordre (de 0,52 à 0,86) entre les échelles servant à mesurer la satisfaction des trois besoins psychologiques ont d’ailleurs déjà été observées dans des études préalables (Tian, Han et Huebner, 2014 ; Vlachopoulos, Ntoumanis et Smith, 2010). Qui plus est, il est attendu que les corrélations entre traits latents soient plus élevées que les coefficients de corrélation de Pearson (Vlachopoulos et coll., 2010).

Le modèle sans interaction (modèle A) obtient les mêmes indices d’ajustement que le modèle de mesure. La figure 4 présente les coefficients standardisés obtenus. La perception d’un climat de performance (ϒ = 0,25(0,07), p ˂ 0,001) et la satisfaction du besoin de compétence (ϒ = 0,48(0,15), p ˂ 0,01) prédisent positivement l’adoption de buts de performance-approche. La relation entre la satisfaction du besoin d’appartenance et l’adoption de buts de performance-approche n’est pas significative (ϒ = -0,28(0,16), p = 0,07). Le modèle sans la variable d’interaction explique 15,9 % de la variance de l’adoption de buts de performance-approche par les filles en fin d’année scolaire.

Figure 4

Coefficients standardisés du modèle sans la variable d’interaction (modèle A)

-> Voir la liste des figures

La figure 5 présente les coefficients standardisés obtenus pour le modèle impliquant la variable d’interaction. La perception d’un climat de performance (ϒ = 0,29(0,07), p ˂ 0,001) et la satisfaction du besoin de compétence (ϒ = 0,46(0,15), p ˂ 0,01) prédisent positivement l’adoption de buts de performance-approche. La relation entre la satisfaction du besoin d’appartenance et l’adoption de buts de performance-approche n’est pas significative (ϒ = −0,30(0,16), p = 0,051), mais la variable d’interaction (climat de performance X appartenance) entretient une relation positive avec l’adoption de buts de performance-approche (ϒ = 0,17(0,05), p ˂ 0,001). Le modèle avec la variable d’interaction explique 20,7 % de la variance de l’adoption de buts de performance-approche par les filles en éducation physique. L’ajout de la variable d’interaction explique donc 4,8 % de variance supplémentaire.

Comme la méthode LMS pourrait générer des erreurs de type I si les données sont fortement asymétriques, le modèle a aussi été testé avec le logiciel AMOS 23 (approche sans contraintes impliquant des produits d’indicateurs avec stratégie du double-centrage de la moyenne, Marsh et coll., 2012 ; Wu, Wen, Marsh et Hau, 2013 ; Lin, Wen, Marsh et Lin, 2010) et l’effet d’interaction (climat de performance X appartenance) s’est aussi avéré significatif.

Figure 5

Coefficients standardisés du modèle avec la variable d’interaction (modèle B)

-> Voir la liste des figures

La figure 6 permet d’interpréter l’effet d’interaction significatif observé : quand les filles perçoivent un faible climat de performance dans leurs cours d’éducation physique, celles qui ressentent une forte satisfaction de leur besoin d’appartenance risquent d’adopter, dans une moins grande mesure, des buts de performance-approche. Par contraste, les filles ressentant une plus faible appartenance à leur groupe risquent d’adopter davantage des buts de performance-approche, c’est-à-dire qu’elles chercheront à se comparer aux autres et à vouloir les surpasser. Néanmoins, la perception d’un fort climat de performance, peu importe le degré de satisfaction du besoin d’appartenance, les encouragerait à poursuivre ce type de buts.

Figure 6

Effet d’interaction entre le climat de performance et la satisfaction du besoin d’appartenance pour prédire l’adoption de buts de performance-approche par les filles

-> Voir la liste des figures

Le test du rapport de vraisemblance logarithmique (D = -2[(-7090,25) – (−7084,70)] = 11,10 ; nombre de paramètres libres du modèle B – nombre de paramètres libres du modèle A = 46 - 45 = 1) étant significatif (D(1) = 11,10, ˂ 0,001), il est possible de conclure que le modèle B (avec interaction) présente un meilleur ajustement que celui du modèle A (sans interaction).

5. Discussion des résultats

Pour la première fois en français, la présente exemplification méthodologique conduisait le lecteur pas à pas dans l’application d’une démarche rigoureuse pour évaluer des interactions impliquant des variables latentes. Bien que les approches impliquant des produits d’indicateurs soient applicables dans différents logiciels statistiques, par contraste avec la méthode LMS, celles-ci sous-tendent des étapes différentes. Outre la nécessité de créer une variable latente d’interaction formée de produits d’indicateurs, les chercheurs doivent, notamment, appliquer la stratégie du double-centrage de la moyenne (Lin et coll., 2010) et procéder à une transformation mathématique supplémentaire pour calculer la solution standardisée appropriée de la variable d’interaction (Marsh et coll., 2012). Qui plus est, la façon d’interpréter l’effet d’interaction significatif proposée dans le présent article ne peut pas être utilisée avec les approches impliquant des produits d’indicateurs. En effet, comme le nouveau trait latent est formé de produits d’indicateurs, la valeur de la variable d’interaction ne représente pas réellement le produit des deux variables latentes impliquées dans l’interaction. De la sorte, seul le signe (positif ou négatif) peut servir à l’interprétation de l’interaction, ce qui constitue, à notre avis, une limite importante des approches impliquant des produits d’indicateurs. À la lumière de la présente exemplification et en cohérence avec les conclusions de Maslowsky et coll. (2015), l’utilisation de la méthode LMS comporte de sérieux avantages, notamment l’élimination de biais liés au modèle de mesure et la simplicité de l’ajout d’une variable d’interaction dans le modèle d’équations structurelles.

Bien que l’exemplification méthodologique effectuée présente certaines similitudes avec celle de Maslowsky et coll. (2015), notamment sur le choix de la méthode et du logiciel utilisés, elle s’en distingue sur certains points. D’abord, les données empiriques utilisées ne relèvent pas du même domaine de recherche (éducation versus psychologie). Qui plus est, dans leur développement théorique, les auteurs ne précisaient pas la façon dont la normalité des données avait été vérifiée et ne présentaient pas les figures des modèles analysés ni les coefficients standardisés obtenus à chacune des étapes, à l’exception des valeurs obtenues pour la variable d’interaction. Finalement, même si la figure servant à l’interprétation de l’interaction significative apparait dans l’article, la façon de l’obtenir n’est pas explicitée par les auteurs. Par contraste avec la présente exemplification, ces derniers ont aussi procédé à une simulation Monte Carlo. Néanmoins, tel qu’énoncé précédemment, une erreur méthodologique a été relevée au regard de l’interprétation des résultats.

Sur le plan théorique, les résultats présentés dans la présente exemplification contribuent à l’avancement des connaissances scientifiques en observant pour la première fois un effet d’interaction significatif entre le climat de performance et la satisfaction du besoin d’appartenance pour prédire l’adoption de buts de performance-approche par les filles en éducation physique. Les résultats montrent que dans un faible climat de performance, la satisfaction du besoin d’appartenance des filles diminuerait leur désir de se comparer aux autres et de vouloir gagner à tout prix. De la sorte, la satisfaction du besoin d’appartenance contribuerait à diminuer la compétition entre les élèves. Néanmoins, si les filles perçoivent que leur enseignant valorise ce type d’attitudes (fort climat de performance), répondre à leur besoin d’appartenance ne serait pas suffisant pour enrayer leur adoption de buts de performance-approche. Bien que ce type de buts puisse parfois s’avérer positif pour la motivation des élèves en éducation physique, la poursuite de buts de performance-approche peut aussi générer de l’anxiété ou le développement d’attitudes négatives à l’endroit des cours d’éducation physique (Papaioannou, Zourbanos, Krommidas et Ampatzoglou, 2012).

Pour les enseignants désirant répondre au besoin d’appartenance des élèves, diverses stratégies peuvent être mises en place : offrir des occasions de développer ou de renforcer des amitiés, planifier des activités coopératives nécessitant un réel travail d’équipe, varier les façons de former les équipes en favorisant l’inclusion de tous, etc. (Ekkekakis et Backhouse, 2014 ; Fox et Lindwall, 2014 ; Zarrett, Sorensen et Cook, 2015). Qui plus est, dans l’optique de diminuer la perception d’un climat de performance par les élèves, il serait souhaitable d’orienter les activités de manière à encourager les élèves à se surpasser eux-mêmes et à évaluer leur compétence selon leur amélioration et leur progression personnelle plutôt qu’en se comparant aux autres ou à une norme préétablie.

Bien que menée avec rigueur, la présente exemplification comporte certaines limites. D’abord, comme la relation entre la satisfaction du besoin d’appartenance et les buts de performance-approche n’était pas significative, il peut être questionnable d’avoir supposé la présence d’un effet d’interaction impliquant cette variable. Néanmoins, l’évaluation de cette interaction nous paraissait justifiée sur le plan théorique. Ensuite, même si dans Mplus les covariances entre les variables indépendantes sont d’emblée considérées dans l’analyse, lors de l’ajout d’une variable d’interaction, il est impossible d’ajouter des covariances entre cette variable et les variables indépendantes. Pourtant, les approches impliquant des produits d’indicateurs reconnaissent que la variable d’interaction a de fortes chances d’être corrélée aux variables utilisées pour la créer et permettent l’évaluation de ces covariances. Il est donc de notre avis que l’impossibilité d’évaluer les covariances entre la variable d’interaction et les autres traits latents comporte une limite de cette méthode. Finalement, comme nous n’avons pas procédé à une simulation Monte Carlo, nos résultats sont difficilement généralisables.

6. Conclusion

Compte tenu de l’importance pour les professeurs-chercheurs et les étudiants aux cycles supérieurs en sciences de l’éducation d’être en mesure d’évaluer des effets d’interaction impliquant des variables latentes, le présent article explicitait, pour des chercheurs francophones novices, chacune des étapes à effectuer pour procéder à ce type d’analyse selon la méthode LMS en utilisant le logiciel Mplus. Dans la phase de préparation, aucune transformation des données n’est nécessaire, mais il importe de vérifier le postulat de normalité. Pour avoir accès aux coefficients standardisés, il suffit de standardiser les données en le spécifiant dans la syntaxe. Ensuite, le modèle de mesure doit être évalué sans inclure la variable d’interaction. Quand le modèle de mesure est considéré comme étant satisfaisant, il est possible de procéder à l’analyse du modèle d’équations structurelles, toujours sans inclure la variable d’interaction afin d’obtenir les indices d’adéquation du modèle ainsi que le pourcentage de variance expliquée. Dans un deuxième temps, la variable d’interaction peut être ajoutée au modèle. Il est alors possible de vérifier la portion de variance expliquée par l’ajout de la variable d’interaction et de vérifier l’adéquation du modèle en utilisant le test du rapport de vraisemblance logarithmique.

Par rapport aux approches impliquant des produits d’indicateurs, cette méthode comporte certains avantages, mais des études comparant formellement les deux types d’approches (impliquant des produits d’indicateurs et par distribution analytique) et les différents logiciels contribueraient à mieux documenter ces différences. L’utilisation de simulations Monte Carlo permettrait de généraliser les résultats. Qui plus est, il serait intéressant de refaire le même exercice avec une approche par distribution analytique dont il n’était pas question dans le présent article, soit la Generalized Structured Component Analyses-GSCA (Hwang, Ho et Lee, 2010 ; Hwang et Takane, 2004). Finalement, les données ayant servi dans le présent article relevaient du champ de l’éducation physique et de la santé. Des données provenant de différentes disciplines relevant des sciences de l’éducation et permettant l’analyse de modèles plus complexes seraient à considérer pour mener de futures exemplifications méthodologiques sur l’analyse d’interactions avec variables latentes.