Résumés
Résumé
L’argument principal de cet article est que ce que nous voyons est fonction des méthodes que nous utilisons. Au moyen d’une série d’exemples, nous suggérons que nos connaissances sont régulièrement déviées de leur course par les limites mêmes des cadres méthodologiques utilisés pour l’analyse de données. Chacun des exemples présente une comparaison des méthodes simples et bien connues et d’autres méthodes qui intègrent une plus large gamme d’influences ou qui clarifient l’objet d’étude. Or, lorsque ces dernières sont utilisées, les résultats obtenus changent. Cette constatation donne à penser que les résultats composant la littérature de recherche dans plusieurs domaines pourraient être transformés par l’application de méthodes qui prennent explicitement en compte le temps et l’espace social ; de même, le recours à des méthodes plus appropriées pourrait permettre de résoudre certains conflits entre théories ou de lever certaines des limites de celles-ci. Les exemples couvrent un éventail de questions, depuis les différences entre données transversales et longitudinales, la construction de modèles pour remplacer les équations, l’influence des contextes sociaux sur le comportement individuel, l’importance du temps dans la modélisation des événements, jusqu’aux nuances dans la compréhension de la complexité des processus interdépendants au cours de la vie.
Summary
The fundamental point of this paper is that methods change what we are able to see. Using a series of examples, this paper suggests that the course of substantive literatures are regularly set off course by the limitations built into widely used methodological frameworks used to analyze data. In each example, simpler and/or better known methods are compared to methods which either incorporate a broader range of possible influences or clarify the issue at hand, and consequently essential findings change. These findings suggest either that the inertial state of findings in research literatures could be redefined or redirected by the application of methods which take into account more clearly the effects of time and place, or that given theories may be transformed by methods which resolve conflicting or limiting features of theoretical debate. Examples cover a wide range of issues, from longitudinal vs. cross-sectional data, to the specification of models to replace equations, to the influence of social context on individual behavior, to the importance of time in the modeling of events, to the nuances of capturing the complexity behind inter-dependent processes over the life course.
Resumen
El punto fundamental de este artículo es que los métodos cambian y que son posibles de ver. Utilizando una serie de ejemplos, este artículo sugiere que el curso de la literatura sustantiva es regularmente desviado por las limitaciones construidas dentro de marcos metodológicos que son conmúnmente utilizados para el análisis de datos. En cada ejemplo, simple y /o mejor conocido método son comparados a otros métodos que incorporan una amplia variación de influencias posibles o clarifican la cuestión, y consecuentemente las conclusiones esenciales cambian. Estas conclusiones sugieren que el estado inerte de las conclusiones en la literatura de investigación puede ser redefinido, o redirigido para la aplicación de métodos los cuales toman en cuenta más claramente los efectos del tiempo y el lugar, o que las teorías dadas pueden ser transformadas por métodos los cuales resuelven contradictoriamente o limitativamente factores del debate teórico. Los ejemplos cubren una amplia gama de preguntas, de datos longitudinales frente a los transversales, de la especificación de modelos para remplazar ecuaciones, de la influencia del contexto social sobre el comportamiento individual, de la importancia del tiempo sobre la modelización de eventos, de los matices que capturan la complejidad detrás de la interdependencia de los procesos durante el curso de la vida.
Corps de l’article
La sociologie bénéficie d’un large éventail de perspectives méthodologiques. Fidèle à sa position structurellement marginale par rapport à d’autres disciplines mieux financées ainsi que par sa récente histoire, la sociologie a la chance singulière de ne pas reposer sur un seul et unique paradigme méthodologique. En effet, la sociologie se trouve dans une position privilégiée de recevoir l’influence simultanée des innovations méthodologiques d’une variété d’autres disciplines, elles-mêmes influencées par des traditions et cultures méthodologiques intrinsèques (Wheaton, 2001). Si tel est bien le cas, les sociologues sont peut-être mieux à même de comprendre les rapports entre les techniques disponibles pour l’analyse que les spécialistes d’autres disciplines connexes.
En dépit de cet avantage paradoxal — découlant de ce peut paraître un désavantage —, la diffusion des innovations méthodologiques dans la discipline fait face à d’inévitables résistances. Souvent, notre première réaction à une nouvelle méthode est le scepticisme par rapport à la nécessité ou à la valeur de l’apprentissage d’une nouvelle approche pour comprendre les données. Un exemple du passé illustrera cette affirmation. Durant les années 1970, la régression logistique était traitée comme une approche nouvelle, une étape au-delà du modèle plus sécurisant et plus familier de la régression des moindres carrés (ordinary least squares regression, représentée par l’abréviation courante ols). Une réaction courante consistait à montrer comment cette dernière (avec une variable dépendante dichotomique, appelée le « modèle de probabilité linéaire ») pouvait approximer les résultats de la régression logistique lorsque la probabilité moyenne de l’événement étudié se situait entre 0,2 et 0,8 (Knoke, 1975 ; Goodman, 1976 ; Cleary et Angel, 1984). Toutefois, la diffusion de la régression logistique la rendit familière et la réticence initiale quant à son utilisation parut de moins en moins justifiée. Le seul effet de ce détour fut un délai dans l’utilisation d’un modèle généralement plus approprié, ce qui pouvait conduire à des erreurs dues à l’application d’une approximation.
J’ai été frappé par la résistance à l’égard des nouvelles méthodes, et donc à l’égard des nouvelles façons de penser les analyses. Cette résistance s’exprime dans quelques formules typiques, telles que « les solutions techniques ne résolvent rien », ou « les découvertes importantes font surface même avec des méthodes moins fiables » ou encore « les nouvelles méthodes ne changent pas le résultat de toute façon ». Bien qu’il semble très compréhensible de vouloir simplifier une tâche complexe et incorporer les nouveautés dans le contexte de ce que nous savons déjà, je suis sidéré devant de telles affirmations, qui peuvent avoir des conséquences pernicieuses sur l’état des connaissances dans les sciences sociales.
Je démontre ci-dessous le danger que représente l’hypothèse voulant que les méthodes ne changent pas ce que nous « savons », en utilisant une série d’exemples. La même conclusion ressort de tous les exemples : changer de méthode change ce que l’on voit. Bien que tous mes exemples signalent des différences dans le traitement de donnés quantitatives, ma thèse est plus générale et s’applique également aux différences dans les méthodes qualitatives.
Afin de me concentrer sur les implications de chacun des exemples cités et de ne pas encombrer la poursuite de mon objectif principal, je renoncerai à une discussion détaillée des questions techniques.
Perspectives générales
Plusieurs leçons peuvent être tirées de ces exemples et je les résume ainsi :
L’avancement des connaissances est dévié de sa course par l’application inappropriée ou inadéquate des méthodes, et de tels effets peuvent être persistants.
Négliger la position temporelle et la séquence des événements accroît significativement le risque d’obtenir des résultats trompeurs.
Il est toujours préférable de penser en termes de modèle plutôt que d’équations, même lorsque l’analyse ne porte que sur un seul résultat.
Malgré la croyance générale contraire, l’effet des variables qui se situent à des niveaux différents de la réalité sociale peut non seulement être estimé, mais peut se révéler indispensable pour notre compréhension des processus sociaux à chacun de ces niveaux.
Les trajectoires de vie constituent un type de contexte conférant une signification aux interactions dans l’environnement social à n’importe quel moment donné et pour les mêmes raisons citées précédemment, elles ne peuvent être ignorées.
Il est possible de saisir la complexité et la subtilité avec les méthodes quantitatives à condition qu’on fasse rigoureusement l’appariement entre idées et modèles mis à l’épreuve.
Deux autres postulats donnent forme à mes exemples. Premièrement, je crois que l’intuition est plus souvent une entrave qu’un atout dans la recherche sociale. L’approche intuitive est considérée comme plus compréhensible, donc plus crédible, plus facilement communicable et conséquemment elle tend à avoir préséance comme critère pour juger la valeur de nouvelles idées. C’est la queue qui remue le chien : l’intuition n’est que la somme de ce que nous savons jusqu’ici. Deuxièmement, dans le cadre de la démarche visant à déceler et à mesurer adéquatement la subtilité et la complexité du monde empirique, la règle dite du « rasoir d’Occam » — selon laquelle l’explication la plus simple est la plus susceptible d’être juste — peut devenir une forme de sujétion. Le problème est que la règle de parcimonie peut empêcher la recherche et la saisie potentielle et qui ne disparaîtra pas pour autant. Le « rasoir d’Occam » est souvent évoqué trop tôt et trop facilement dans le cours de la recherche, empêchant une pleine considération des solutions de rechange. En dernière analyse, nous ne savons pas si la meilleure explication devrait être la plus simple, mais nous savons qu’elle devrait être celle qui s’applique le plus généralement. Souvent, ces considérations se confrontent dans la recherche.
Exemple 1 : Des données transversales aux données longitudinales
Nous commençons par une démonstration de la différence provenant de l’utilisation de données transversales et de données longitudinales, en utilisant les données de la Toronto Mental Health and Stress Study (Turner et Wheaton, 1991). Les études transversales prédominent toujours dans la recherche, parce qu’elles fournissent des résultats plus rapidement et qu’elles sont moins coûteuses que les études longitudinales. Nous acceptons les résultats provenant des études transversales principalement en raison d’un accord implicite, étant donné leur prédominance. Mais ces études présentent des problèmes bien connus, comme par exemple l’ambiguïté des hypothèses causales lors de l’utilisation de données transversales.
Notre exemple porte sur une évaluation courante de l’effet (standardisé) de la qualité de la vie matrimoniale sur la dépression, faite à partir de données transversales. J’ai utilisé le logiciel lisrel 8.5 (Scientific Software International, 2001) pour produire les résultats qui suivent, bien que le modèle complet de mesure pour chacun des concepts ne soit ni démontré ni discuté. Il suffira d’indiquer que nous disposons de plusieurs indicateurs pour mesurer aussi bien la qualité de la vie matrimoniale que la dépression ; nous ne nous préoccupons ici que des relations entre les deux variables latentes qui mesurent ces deux concepts.
La figure 1(a) fournit une représentation transversale de la relation entre la qualité de la vie matrimoniale et la dépression (basée uniquement sur les données du temps 2 de l’étude). Le modèle illustre l’hypothèse selon laquelle une faible qualité de la vie matrimoniale causerait la dépression, mais non pas le contraire. Notons ici l’impact négatif substantiel (β = -0,27) de la qualité de la vie matrimoniale sur la dépression. La crédibilité de cette hypothèse dépend bien entendu directement du postulat d’une causalité unidirectionnelle. Il va de soi que ce postulat ne peut être facilement examiné au moyen de données transversales ; par contre, s’il est erroné, l’importance de l’effet estimé peut être trompeuse. L’utilisation de deux analyses de régression ols, en utilisant successivement la dépression et la qualité de la vie matrimoniale comme variables dépendantes, ne résoudra pas le problème, puisque ces équations excluent toute rétroaction causale.
Le contrôle de l’incidence d’une dépression antérieure, au moyen de données longitudinales (dans ce cas-ci, de 12 à 18 mois plus tôt), permet d’éviter la confusion possible entre l’effet de la qualité de la vie matrimoniale et l’effet d’une causalité inverse. Cette spécification de l’effet de la dépression sur la qualité de la vie matrimoniale suppose qu’un effet cumulatif se déploie dans le temps. Plus précisément, il s’écoule un certain temps avant que la dépression ne mine la qualité de la vie matrimoniale, car il faut un certain temps avant que le soutien du conjoint envers son partenaire dépressif ne s’amenuise.
Dans ce contexte, l’effet estimé de la qualité de la vie matrimoniale sur la dépression est réduit de moitié, ce qui suggère la possibilité d’une relation partiellement erronée. La figure 1(b) est éloquente à ce sujet : l’impact de la qualité de la vie matrimoniale sur la dépression est partiellement imputable au fait que la dépression est assez stable dans le temps, et que la dépression semble aussi affecter de façon négative la qualité de la vie matrimoniale. Il importe ici de souligner que, si nous l’avions voulu, nous aurions encore pu réaliser cette analyse en utilisant une régression ols.
Mais il reste toujours un effet essentiel que nous avons négligé dans ce modèle : il est possible que nous surestimions l’effet décalé de la dépression sur la qualité de la vie matrimoniale si l’état initial de cette dernière n’est pas pris en compte. Cela nous amène à l’examen du modèle complet sur deux temps, dans la figure 1(c). Le contrôle de la qualité de la vie matrimoniale au temps 1 démontre l’absence d’un effet décalé de la dépression initiale sur la qualité de la vie matrimoniale au temps 2, en dépit de l’hypothèse courante qu’un conjoint dépressif engendrera un mariage plus chancelant. En d’autres termes, le modèle partiel nous aurait conduit à une conclusion erronée à propos de la réciprocité causale. Le modèle du schéma 1(c) suggère que la qualité de la vie matrimoniale a bel et bien un effet net sur la dépression (β =-0, 12, ce qui est significatif), mais l’importance de cet impact demeure modeste comparativement à celui obtenu par l’approche transversale.
Jusqu’ici, je me suis concentré sur la relation entre la qualité de la vie matrimoniale et la dépression. Mais se pourrait-il que cette relation soit trompeuse dans les deux directions en raison de l’exclusion de certaines variables qui influeraient à la fois sur la dépression et sur la qualité de la vie matrimoniale ? Ces variables pourraient correspondre à des facteurs socioéconomiques, à des facteurs reliés à l’histoire de vie des personnes, à l’âge des enfants, et aux effets indirects de l’emploi. La figure 1(c) démontre que l’erreur caractérisant l’équation relative à la qualité de la vie matrimoniale peut être corrélée à l’incidence de la dépression au temps 2 (par l’intermédiaire d’un effet indirect basé sur la qualité de la vie matrimoniale), et donc aussi à l’erreur relative à la dépression. La reconnaissance de cette corrélation entre erreurs nous permet d’estimer l’influence de causes communes non mesurées dans cette relation. Nous ajoutons ce paramètre au schéma 1(d).
Lorsque nous considérons la corrélation des erreurs entre les deux équations (correlated error across equations), l’effet net de la qualité de la vie matrimoniale sur la dépression disparaît. À ce stade, les résultats indiquent une absence de causalité dans l’une ou l’autre direction entre la qualité de la vie matrimoniale et la dépression. Donc, l’impact de la qualité de la vie matrimoniale sur la dépression est probablement faussé, c’est-à-dire qu’il reflète des processus de causalité à long terme qui conduisent à la fois à une moindre qualité de la vie matrimoniale et à une augmentation de la dépression. Il est certes possible de contrôler certains facteurs antécédents qui ont été mesurés directement ; lors de l’analyse transversale, le problème est que nous devons alors prendre pour acquis que toutes ces causes communes sont anticipées et mesurées dans les données.
La figure 1(e) ajoute une autre variation. Ce modèle inclut la possibilité d’un effet réciproque et immédiat entre la qualité de la vie matrimoniale et la dépression. La littérature courante à propos des modèles longitudinaux suppose soit que les effets sont tous deux décalés (cross-lagged), soit qu’ils sont simultanés. Mais les relations que nous essayons de déceler ici présentent des décalages différents (lags), déterminés par la nature du processus causal ; une spécification erronée des décalages pourrait engendrer des résultats tout à fait trompeurs (Pelz et Lew, 1970). Ainsi j’ai voulu démontrer, avec les schémas 1(b) et 1(c), un premier effet « instantané », soit celui de la qualité de la vie matrimoniale sur la dépression, et un second effet « décalé », soit celui de la dépression sur la qualité de la vie matrimoniale, afin d’illustrer que les modèles qui essayent d’incorporer la réciprocité causale ne sont pas forcément liés à l’hypothèse des « décalages égaux » (equal lags) pour les deux effets. En fait, c’est la théorie — et non les paramètres statistiques — qui nous sert ici de repère.
Duncan (1969) a fait, il y a bien longtemps déjà, cette remarque au sujet des modèles longitudinaux : il existe plusieurs spécifications équivalentes pour un modèle tout juste identifié — où, comme ici, le nombre de paramètres est tout juste égal au nombre d’informations indépendantes disponibles pour estimer ces paramètres — et toutes ces spécifications modélisées reproduiront exactement la matrice des covariances. Ainsi, je soutiens que l’effet possible de la dépression sur la qualité de la vie matrimoniale prend un certain temps à se manifester, et que même si la dépression s’atténue, son effet sur la qualité de la vie matrimoniale peut perdurer.
En fait, les résultats de la figure 1(e), qui découlent du postulat d’effets réciproques simultanés entre la qualité de la vie matrimoniale et la dépression au temps 2, sont les mêmes que pour le modèle précédent, ce qui n’a rien de surprenant, étant donné la prise en compte de la corrélation des erreurs caractérisant les deux équations. En d’autres termes, il importe peu que nous qualifions l’effet de la dépression sur la qualité de la vie matrimoniale comme décalé ou immédiat, puisque dans l’un et l’autre cas, le problème des variables absentes du modèle persiste. Quelle que soit la spécification du modèle que nous privilégions, nous concluons toujours qu’il n’y a aucun effet intrinsèque de la qualité de la vie matrimoniale sur la dépression ou vice-versa.
Exemple 2 : Penser en termes de modèles, plutôt que d’équations
La recherche se base habituellement sur l’examen de résultats spécifiques. Ceux-ci sont présentés sous forme d’équation (par exemple, une régression) prédisant une variable dépendante donnée, en utilisant une gamme de variables indépendantes qui ont toutes le même statut et dont les effets sont comparés entre eux. Pourtant, la recherche dont le but est de rendre compte des valeurs possibles d’une variable dépendante à partir d’un groupe relativement indéterminé de variables indépendantes ne peut conduire qu’à des interprétations fondamentalement ambiguës. Le problème est que les variables indépendantes ne sont pas toutes créées égales. En effet, certaines de ces variables dépendent d’autres variables indépendantes, ce qui implique un processus à plusieurs étapes menant à la variable sous examen. En conséquence les coefficients, qui reflètent seulement les effets directs de chacune d’entre elles indépendamment des autres, ne sont pas comparables, puisque chaque variable indépendante dans le modèle voit ses effets être en partie absorbés par les variables médiatrices se retrouvant également dans le modèle.
La distinction entre une équation et un modèle est manifeste lorsque le modèle est représenté par un système d’équations, dans lequel les variables dépendantes dans une ou plusieurs équations apparaissent aussi comme des variables indépendantes dans d’autres équations. Dans un tel cas, une équation constitue simplement une partie d’un modèle qui exige une spécification plus poussée. L’avantage du modèle explicite est simple : il clarifie l’interprétation, alors qu’une seule équation est forcément ambiguë, puisqu’elle ne peut produire des informations suffisantes pour marquer les liens entre les variables indépendantes. Le chercheur peut en effet avoir en tête les relations entre ces variables et déjà penser en termes de modèle. Si tel est le cas, il devrait clarifier ce modèle et l’employer comme point de référence. Mais si le chercheur n’a pas de modèle à l’esprit, l’approche de l’équation unique peut engendrer des interprétations erronées des coefficients à cause de tout ce qu’elle omet.
L’étude des processus sert de base à toute interprétation des résultats de l’estimation des équations, et les modèles, si simples soient-ils, attestent ces processus. En effet, les modèles obligent à distinguer entre variables médiatrices et variables antérieures. Sans cette distinction, la littérature scientifique serait affaiblie par l’ambiguïté des résultats. Ce problème se manifeste souvent lorsque certaines des variables contrôlées dans une équation sont en réalité des variables médiatrices. Lorsque cela se produit, une partie de l’effet causal valide de ces variables est interprétée, à tort, comme erronée (Alwin et Hauser, 1975).
Un exemple illustrera le problème. L’auteur d’un article en épidémiologie — qui demeurera anonyme — postule que le revenu de ménage est une variable de contrôle pour l’étude de l’impact de la monoparentalité sur les problèmes de comportement de l’enfant, en utilisant à cette fin une approche à une seule équation. La figure 2(a) constitue la meilleure représentation graphique de cette approche : nous avons deux variables indépendantes, qui sont corrélées tout en ayant un effet distinct sur la variable dépendante. Si nous limitons notre examen aux coefficients de l’équation unique pour prédire les problèmes de comportement, nous aurons tendance à mettre l’accent sur ces coefficients comme estimés de l’effet net de chaque variable, indépendamment de l’autre. Mais cette approche demeure profondément ambiguë La corrélation entre le statut de monoparentalité et le revenu du ménage exige une interprétation plus poussée. En effet, cette corrélation signifie que nous ignorons si c’est le revenu du ménage qui cause la monoparentalité, ou si le statut de monoparentalité détermine plutôt le revenu de ménage, ou si la causalité joue dans les deux sens. Notre décision à ce sujet est incontournable et elle aura un impact déterminant sur l’interprétation des résultats. Si nous acceptons la corrélation dans toute son ambiguïté, nous courrons le risque de sous-estimer, ou de surestimer l’impact réel de la monoparentalité sur les problèmes de comportement.
L’introduction de variables de contrôle dans l’équation implique le recours à une argumentation spécifique, et le modèle que représente la figure 2(b) est à cet égard bien supérieur à celui de la figure 2(a). Dans cette deuxième version du modèle, le revenu de ménage, considéré comme variable de contrôle, ne modifie notre représentation de l’effet du statut de monoparentalité que s’il prédit à la fois la probabilité de problèmes de comportement et celle de la monoparentalité. C’est seulement dans ces circonstances qu’une partie de la relation entre ces deux variables se révélera erronée. Les résultats de ce modèle suggèrent que l’effet réel de la monoparentalité sur les problèmes de comportement est égal au coefficient net de régression, soit 0,10.
En fait, le revenu de ménage est fort probablement influencé négativement par le statut de monoparentalité, quand on compare les familles à deux parents à celles qui n’en comptent qu’un seul. C’est pourquoi la figure 2(c) spécifie différemment le rôle du revenu du ménage comme variable médiatrice de l’impact de la monoparentalité sur les problèmes de comportement. Ce modèle indique que le revenu du ménage pourrait faire partie du problème de la monoparentalité, et non pas en être la cause. Dans ce cas, l’effet réel de la monoparentalité semble très différent de l’impression donnée par son coefficient de régression (également connu sous le nom d’« effet direct »). Si le modèle présenté au schéma 2(c) est juste, alors l’effet total de la monoparentalité est en réalité égal à la combinaison de ses effets direct et indirect sur les problèmes de comportement, c’est-à-dire 0,10 + (-0,3 × -0,4) = 0,22. Si ce modèle est valide, nous arrivons à une conclusion différente au sujet de l’importance de la monoparentalité.
Il est important de voir, à partir de cet exemple, que l’équation de régression pour les problèmes de comportement demeure la même dans chacun des trois modèles — elle ne peut donc pas nous indiquer lequel de ces modèles est juste. La différence entre la figure 2(a) et les schémas 2(b) et 2(c) est que les deux derniers modèles requièrent une deuxième équation pour évaluer le modèle, une équation qui précise ce que nous pensons être la nature de la relation entre les deux variables indépendantes. Tous ces modèles peuvent évidemment se révéler trop simples, dans la mesure où le revenu de ménage est dans un modèle cause et dans l’autre effet de la monoparentalité. Si tel est le cas, nous devons utiliser des données longitudinales pour mieux cerner la dynamique causale entre ces variables.
Doit-on blâmer l’approche utilisant une équation unique pour ce problème ? Bien que la responsabilité de l’interprétation revienne au chercheur, j’estime que la confiance dans l’usage d’une seule équation alimente, dans plusieurs domaines de recherche, l’ambiguïté dans l’interprétation des coefficients de régression. En somme, l’équation unique ignore des éléments essentiels dans l’interprétation des effets, alors que le modèle nous force à être explicites. L’approche utilisant des modèles présume qu’il vaut mieux être erroné qu’ambigu. À l’heure actuelle, le sort des connaissances dans plusieurs domaines dépend du rôle qu’on accorde à certaines variables qu’on peut considérer soit comme antécédentes (et donnant lieu à un effet de sélection) ou comme médiatrices (et donc parties de l’explication d’un effet causal réel). C’est pourquoi les modèles de causalité demeureront indispensables.
Exemple 3 : Estimer et interpréter la stabilité au fil du temps
Plusieurs perspectives théoriques reposent sur le postulat d’une stabilité des phénomènes sous étude. Par exemple, il s’avérerait inutile de lier des environnements sociaux stables à des réponses affectives très instables, car des sentiments passagers doivent répondre à des facteurs situationnels qui agissent à court terme ; ils ne changent pas de manière suffisamment permanente pour qu’on puisse les relier aux modifications des dispositifs les plus stables des environnements sociaux.
L’appariement phénoménologique des causes et des effets est plus souvent exprimé en théorie qu’au plan méthodologique, mais une telle question peut avoir des impacts majeurs, quoique subtils, sur la plausibilité empirique d’une perspective théorique. Ainsi, pour la théorie de la personnalité, la personnalité demeure stable dans la durée et à travers diverses situations, ou alors le concept même de personnalité devient problématique. La notion de détresse, habituellement mesurée au moyen d’une échelle basée sur les sentiments de dépression et d’anxiété souvent utilisée dans l’étude sociale de la santé mentale, apparaîtra comme un moins bon indicateur de problèmes de santé mentale « sérieux » si elle varie facilement et souvent (Dohrenwend et Dohrenwend, 1969).
La simple corrélation « test-retest » est à la base du « coefficient de stabilité », une mesure de fiabilité d’une variable à travers le temps qui s’imposait comme norme de la stabilité durant les années 1960 et 1970. Les modèles d’équations structurales permettent toutefois la séparation de la mesure de la stabilité de celle de la fiabilité, deux concepts qui sont confondus dans les corrélations « test-retest » et qui conduisent à une sous-estimation de la stabilité. (Heise, 1970 ; Wheaton et al., 1977). Ces équations structurales se distinguent en effet entre variables observées et variables latentes ; ces dernières sont par définition exemptes d’erreur de mesure, y compris les erreurs dues au manque de fiabilité des mesures. C’est la stabilité des variables latentes elles-mêmes qui est en question dans le modèle des équations structurales.
Le modèle à trois temps représenté dans la figure 3 fournit des estimations de la « stabilité véritable » de la satisfaction générale à l’égard de la vie (life satisfaction) sur une période de quatre ans ; ils sont tirés de l’Enquête canadienne sur la qualité de vie. Soulignons ici les différences notables quant à la stabilité estimée selon qu’on utilise les variables latentes (formes ovales dans la figure 3) ou les mesures observées (formes carrées et coefficients de stabilité qui se trouvent au bas de la figure). Nous obtenons selon le cas une impression très différente de la satisfaction générale à l’égard de la vie dans la population. Si la stabilité se situe autour de 0,45, on peut penser que la satisfaction est seulement modérément stable dans le temps et qu’elle est donc relativement indépendante des différences fondamentales entre individus quant à leur position dans la stratification sociale. Mais si la stabilité se situe plutôt au-delà de 0,8, nous serions tentés de conclure que nous mesurons des différences fondamentales dans les expériences de vie des individus, et d’accorder plus de poids à une interprétation qui met l’accent sur les inégalités sociales et sur les différences persistantes entre les positions dans la structure sociale.
Plus généralement, la simple différence entre la stabilité observée et la « véritable » stabilité peut avoir des conséquences sur la portée des perspectives théoriques importantes. La critique de la notion de personnalité en psychologie, par exemple, s’est développée à partir du constat de corrélations « test-retest » faibles, un résultat qui ne cadre pas avec la notion fondamentale de personnalité (Mischel, 1968). Mais les preuves de l’inexistence de la personnalité peuvent elles-mêmes être fragiles, dans la mesure où elles sont basées sur un modèle inadéquat d’estimation de la stabilité. Il est vrai que la remise en question de la notion de personnalité est contrée par le fait que les mesures sont souvent construites de façon très fiable, ce qui limite les erreurs d’interprétations de la corrélation « test-retest ». Mais cela laisse encore trop de place à l’erreur, et ne fournit pas une base solide pour juger de la plausibilité de concepts spécifiques reliés à la personnalité. L’estimation de la « véritable » stabilité des concepts au moyen d’équations structurales permet donc de poser correctement la question de leur valeur théorique, particulièrement dans les cas où l’efficacité de plusieurs concepts doivent être comparés.
Le scepticisme quant à l’importance des résultats relatifs à des phénomènes subjectifs, comme la satisfaction générale à l’égard de la vie, la santé mentale ou le bien-être, peut refléter en partie leur présumée instabilité. Si au contraire ils apparaissent comme des phénomènes stables, ils deviennent les indicateurs essentiels des coûts et des bénéfices des divers arrangements sociaux. Dans ce cas, une différence dans l’approche méthodologique a un impact direct sur le plan théorique.
Exemple 4 : Reconsidération de l’effet différent du mariage selon le genre
L’exemple précédent suggère que la littérature scientifique peut errer un certain temps quand elle utilise des méthodes inadéquates. Souvent, l’usage persistant de ces méthodes est dû à leur caractère intuitif qui leur confère un ascendant sur de nombreux auditoires.
Il existe une abondante littérature sur les différences entre les genres quant à l’impactdu mariage sur le bien-être. Cette question a occupé une large place dans le discours public pendant plus d’un quart de siècle ; son évocation dans des contextes innombrables et différents a produit une panoplie tout aussi importante de conclusions divergentes au sujet du mariage ou du genre. Selon une des conclusions typiques de ces travaux, les hommes retirent plus d’avantages du mariage que les femmes. Mais c’est encore là un cas où l’intuition échoue quand on compare ces conclusions aux résultats produits grâce à des méthodes rigoureuses.
Kim Hall (1999) a réalisé récemment une méta-analyse de cette littérature, basée sur 213 évaluations indépendantes des paramètres pertinents, tirées de 78 études échelonnées entre les années 1930 et les années 1990. Pour illustrer plus précisément cette question, la figure 4 présente quelques résultats probables des niveaux moyens de dépression pour quatre groupes : les hommes et les femmes qui n’ont jamais été mariés, les hommes et les femmes mariés.
Hall montre que nous ne pouvons pas comprendre cet effet correctement en utilisant ce qu’elle appelle l’approche des « contrastes séquentiels » (sequential contrast approach), représentée à la figure 4. Cette approche utiliserait d’abord un « test-t » de la différence chez les célibataires (en opposant les femmes célibataires aux hommes célibataires), suivi d’un « test-t » de la différence chez les personnes mariées (en opposant les femmes mariées aux hommes mariés) afin d’arguer en faveur d’un effet spécifique de genre. En fait, une grande partie de la littérature dans ce secteur va dans ce sens. Cette approche des « contrastes séquentiels » montre que les femmes célibataires sont plus dépressives que les hommes célibataires par un point, et que cette différence entre les genres n’est pas significative. L’examen des personnes mariées révèle toutefois que l’écart entre les genres grimpe à 2 points, et devient significatif, suggérant que les femmes sont plus dépressives que les hommes seulement quand elles sont mariées. Le problème de ces tests, c’est qu’ils n’évaluent pas directement l’hypothèse en jeu ; ils reflètent plutôt les différences entre genres au sein des catégories d’état matrimonial, ils ne permettent donc pas de conclure à une différence entre les genres quant à l’impact du mariage sur la santé mentale.
L’hypothèse d’un effet spécifique du mariage sur le genre ne peut être mise à l’épreuve qu’au moyen d’une évaluation qui prend en compte tous ces éléments : il faut calculer la différence des taux de dépression entre les femmes mariées et célibataires et la comparer à la même différence chez les hommes. En d’autres termes, il faut estimer un seul effet d’interaction entre le genre et l’état matrimonial, qui correspond au « gain différentiel ». La figure 4 représente comment on peut réaliser cette évaluation toute simple. L’amélioration de la santé mentale liée au mariage est mesurée par la diminution moyenne de la dépression chez les femmes, soit 3 points. Cette diminution se chiffre à 4 points chez les hommes, ce qui se traduit par un gain différentiel de -1 chez les femmes, c’est-à-dire qu’elles ont un point de moins que les hommes. Mais lorsque le test approprié est utilisé — dans ce cas-ci, un test du « gain différentiel » — la différence des différences peut ne pas être significative, même si une différence significative entre les genres apparaît chez les personnes mariées. En d’autres termes, il n’y a aucune preuve ici d’un effet spécifique du genre, même si les « test-t » sur les « différences séquentielles » suggéraient le contraire. Ce type de résultats survivent-ils assez régulièrement pour affecter toute une littérature ? Dans la méta-analyse de Hall, seulement 14 des 213 évaluations des gains différentiels sont significatives, et l’effet moyen se chiffrait à un maigre 0,016.
Notons que la principale différence entre l’approche des « contrastes séquentiels » et l’approche des « gains différentiels » est le nombre de tests requis pour évaluer l’hypothèse. L’approche des « gains différentiels » requiert une évaluation unique de l’interaction entre le genre et l’état civil. Les tests séquentiels peuvent tout au plus montrer une certaine cohérence avec les résultats escomptés en vertu de l’hypothèse, parce qu’ils se fondent sur un contraste entre les différences de genre dans des catégories d’état civil. La production d’indications cohérentes avec une hypothèse et la mise à l’épreuve de celle-ci sont deux choses distinctes.
D’autres raisons complexes, qui ne relèvent pas de la méthodologie, peuvent renforcer et prolonger l’utilisation des méthodes inappropriées. Ces raisons incluent : 1) le fait que ce qui existe déjà dans le discours public et académique est automatiquement considéré comme véridique — l’inertie discursive ; 2) la correspondance de certaines idées avec l’air du temps, avec divers agendas politiques et sociaux ; 3) le fait que des résultats « dérangeants » ou inhabituels tendent à être rejetés plus facilement ; et 4) une confusion conceptuelle involontaire quant à la façon dont une idée devrait être explicitée et examinée.
La méta-analyse de Hall nous fournit un indice de l’importance de ces autres raisons. Elle montre que si l’hypothèse principale d’une étude est celle d’un gain différentiel selon le sexe, cette étude a beaucoup plus de chances de confirmer cette hypothèse. Les résultats des études visant des objectifs plus larges, comme les travaux sur l’impact des facteurs sociaux sur la santé mentale, infirment invariablement l’hypothèse du gain différentiel. On peut voir là l’effet de biais chez les chercheurs, ou chez ceux qui évaluent les manuscrits pour fin de publication scientifique, ou encore une combinaison des deux.
Mon conseil est simple : nous devons être plus audacieux dans notre travail, afin de contrer l’inertie qui s’attache aux résultats de recherche usuels, et nous devons prêter attention à la façon dont nous traduisons nos idées dans des modèles et des méthodes qui doivent être appropriés à leur examen.
Exemple 5 : Étudier l’effet des strates sociales au moyen des modèles linéaires hiérarchiques (MLH)
Une littérature abondante et très cohérente établissant un lien entre la classe sociale et la santé mentale s’est développée au cours des soixante dernières années (Faris et Dunham, 1939 ; Miech et al., 1999). Les conclusions habituelles dans ce domaine sont que l’éducation (ou le revenu ou le statut professionnel) est inversement liée aux problèmes de santé mentale. Bien que les chercheurs aient d’abord utilisé des données agrégées pour se pencher sur la question, l’attention se dirigea au fil des ans vers la classe sociale de l’individu. La mesure de la position individuelle dans les échelles de stratification sociale était couramment utilisée, au cours de la dernière moitié du siècle dernier, dans la recherche sur les inégalités sociales. Plusieurs raisons expliquent pourquoi il en fut ainsi, y compris la facilité de mesurer les classes sociales au plan individuel.
Mais une autre raison a certainement poussé dans cette même direction. Tout au long du xxe siècle, les principes théoriques et les argumentations méthodologiques sur les dangers encourus lorsque des données agrégées sont utilisées pour inférer des relations sur le plan individuel ont conduit à un consensus : il serait impossible de faire de telles inférences, à cause du problème de « l’erreur écologique ». Le développement récent de modèles linéaires hiérarchiques (mlh), aussi connus sous le nom de modèle multiniveaux (Mason et al., 1983 ; Raudenbush et Bryk, 2002), a justement fourni un cadre et une méthode pour estimer les effets de l’appartenance à des unités sociales agrégées (le quartier, l’école, le milieu de travail, la communauté) sur les membres de ces unités (habituellement les individus).
Quand nous prenons en compte les classes sociales distinctes dans l’étude des questions liées aux inégalités sociales, il devient nécessaire de déterminer si la classe sociale, mesurée à ces deux niveaux distincts, a deux effets parallèles, fonctionnant en quelque sorte dans des univers distincts, ou si au contraire cette relation est conjointe et conditionnelle, c’est-à-dire que l’effet de la classe sociale d’un niveau donné dépend de la position de classe à l’autre niveau. Wheaton et Clarke (2002) ont récemment fait l’hypothèse que les effets du faible niveau socioéconomique individuel sur les risques de maladie mentale seront redoublés par le fait de vivre dans un voisinage aussi caractérisé par un faible niveau socioéconomique — une forme de péril accru qu’ils appellent « le désavantage redoublé ». La seule manière de tester cette hypothèse est d’utiliser un modèle linéaire hiérarchique pour évaluer l’interaction entre le niveau socioéconomique individuel et celui du voisinage.
La figure 5 montre les résultats de l’estimation d’une telle interaction à partir des données de l’Enquête nationale sur les familles et les ménages. Dans le cas présent, la variable de contexte est le niveau de pauvreté au niveau du comté, et la mesure du niveau socioéconomique individuel est le revenu du répondant. La ligne de régression pointillée du milieu se rapproche des effets moyens du revenu quand l’hétérogénéité des effets de celui-ci due à la variation du niveau de pauvreté des comtés n’est pas prise en compte (c’est-à-dire au niveau moyen de pauvreté des comtés). Lorsque nous examinons l’interaction entre les niveaux d’analyse, qui permet de faire varier l’impact du revenu selon le contexte socioéconomique ambiant (défini ici comme dépassant la moyenne d’un écart type en plus ou en moins), nous découvrons de grandes différences quant à cet impact sur les problèmes de santé mentale. La figure 5 montre que les individus qui vivent dans des comtés où le niveau de pauvreté est faible — c’est-à-dire dans des milieux avantagés au plan socioéconomique — connaissent les effets les plus faibles de leur revenu individuel : quoiqu’il y ait un certain bénéfice à la croissance de celui-ci, cet avantage est atténué par rapport à celui qui prévaut dans les milieux défavorisés. Il est intéressant de noter que les plus grands bénéfices liés à un niveau de revenu individuel plus élevé interviennent dans les comtés où la pauvreté est la plus marquée. En d’autres termes, être bien nanti dans un milieu où la plupart des gens ne le sont pas offre les conditions les plus favorables pour éviter la dépression. En même temps, il est également clair que cet effet plus marqué du revenu individuel dans les milieux les plus pauvres signifie que la dépression affecte le plus souvent les individus pauvres vivant dans des milieux pauvres, ce qui correspond bien à une situation de « désavantage redoublé ».
Le modèle linaire hiérarchique utilisé ici met en relief un ensemble diversifié d’impactsde la classe sociale individuelle qui ont traditionnellement été confondus les uns avec les autres dans la littérature sur les classes et la santé mentale. Pour le dire autrement, il y a plus d’effets de la classe sociale dans certains contextes que dans d’autres. Cette trouvaille est susceptible de rediriger notre attention vers des questions qui sont spécifiques aux milieux de faible niveau socioéconomique. De plus, les résultats de ces analyses linéaires hiérarchiques permettent d’identifier une question qui n’est pas abordée dans la littérature : les bénéfices au plan de la santé mentale d’une amélioration de la position socioéconomique dépendent des contrastes entre les divers niveaux contextuels, ce qui suggère des effets opposés à l’hypothèse courante de la privation relative.
Exemple 6 : Comment l’analyse du contexte au moyen du MLH permet de changer ce que nous « savons » à propos de la façon dont les individus s’en tirent
Depuis les années 1970, l’hypothèse des facteurs modérateurs du stress (stress-buffering), selon laquelle certaines ressources modéreraient ou annuleraient les effets du stress, domine la littérature sur le sujet. Les chercheurs se sont penchés sur les types de ressources qui peuvent jouer ce rôle (Pearlin et Aneshensel, 1986 ; Thoits, 1995). Aujourd’hui, les recherches ont démontré que la solution sociale ainsi qu’un sentiment de contrôle sur sa vie agissent comme modérateurs du stress. Les preuves généralement bien acceptées de ce processus reposent sur un effet d’interaction entre la source de stress et la présence ou l’absence de ces ressources modératrices, qui se traduit par une diminution significative de l’effet de stress qui correspond à l’augmentation de ces modérateurs (Wheaton, 1985).
L’évolution de la littérature sur le stress au cours des deux dernières décennies a fait surgir un certain nombre de questions quant à la définition même du caractère stressant des sources potentielles de stress. Wheaton (1998) affirme que le contexte social définit en partie le potentiel menaçant d’un facteur de stress, et que cette question a préséance sur celle des types de ressources amenuisant l’impact du stress. Le problème est que certains événements habituellement considérés comme stressants, tels que le divorce ou la perte d’un emploi, peuvent ne pas s’avérer stressants du tout dans certaines circonstances. Il faut exclure ces cas avant de nous demander ce qui atténue le niveau de stress, sans quoi nous faussons notre mesure du stress en généralisant abusivement l’impact stressant des événements.
La figure 6 présente deux exemples d’estimation d’une interaction entre le sentiment de contrôle sur sa vie et un facteur de stress récent. Le modèle à deux variables pour la dépression de type ces-d offre des résultats tout à fait typiques de ce que l’on trouve dans la littérature sur les modérateurs du stress : les personnes qui ont un faible sentiment de contrôle sur leur vie souffrent beaucoup plus de dépression lorsqu’elles sont victimes d’un crime que les personnes jouissant d’un fort sentiment de contrôle de leur vie : dans ce dernier cas, l’événement n’influence pas la propension à la dépression et la différence entre les deux catégories est de 0,31. Le modèle à trois variables tient compte de la proportion des foyers du quartier dont le revenu du ménage dépasse 50000 $ comme troisième élément, en utilisant un modèle mlh. Les résultats démontrent qu’être une victime de crime n’a aucun effet sur l’incidence de dépression dans les quartiers plus pauvres, quel que soit le sentiment de maîtrise sur sa vie. En d’autres termes, être victime d’un crime dans ces quartiers s’avère moins menaçant et ne constitue pas une source de stress. En revanche, le sentiment de contrôle sur sa vie influe bel et bien sur l’incidence de dépression dans les quartiers favorisés, où nous remarquons un effet modérateur plus important de cette variable sur le stress que dans le modèle à deux variables.
Donc en tenant compte du statut socioéconomique des quartiers, le sentiment de maîtrise sur sa vie n’agit comme modérateur du stress uniquement que dans les quartiers favorisés. Qui plus est, l’influence du sentiment de contrôle sur sa vie sur la diminution de l’incidence de dépression est sous-estimée dans le modèle général à deux variables, qui ne lui tient pas compte du contexte social.
L’impact d’une perte financière présente un cas très différent : il semble que le sentiment de maîtrise de sa destinée n’a aucun effet sur le stress à la suite d’un tel événement. L’ajout du taux de criminalité du secteur produit des résultats à la fois intéressants et surprenants. Dans les secteurs à faible taux de criminalité, le sentiment de contrôle sur sa vie, qui avait été éclipsé dans le modèle à deux variables, joue le rôle classique de modérateur du stress. On ne peut donc déceler les effets des modérateurs de stress dans certains contextes sans utiliser l’approche mlh. Par contre, lorsque le taux de criminalité est élevé, nous obtenons un résultat à première vue difficile à expliquer : la perte financière augmente davantage le stress relié à une perte financière chez les individus qui ont un sentiment de contrôle de leur vie. Comment est-ce possible ? En fait, Mirowsky et al. (1990) émet l’hypothèse que des niveaux élevés du sentiment de maîtrise sur sa vie peuvent être dysfonctionnels lors de circonstances où les tentatives de contrôle du cours des événements se montrent largement infructueuses. Dans des secteurs où la criminalité est élevée, avoir un fort sentiment de maîtrise sur sa vie peut équivaloir à « se cogner la tête contre les murs ».
Il est intéressant de constater que cet exercice a permis à la fois de confirmer l’hypothèse de départ et de découvrir des résultats étonnants qui requièrent davantage de théorisation. Voilà un cas où on voit très clairement que l’apparente absence d’effets cache en réalité deux effets réels qui jouent en sens contraire dans des contextes différents.
Exemple 7 : Les trajectoires de vie comme contexte : 1- le problème des « relations nulles » entre variables
Nous avons vu avec le dernier exemple que l’absence apparente d’effet masquait des effets sous-jacents opposés, mais agissant dans des contextes différents. Nous examinerons plus en détail cette possibilité dans l’exemple qui suit. Bien que les effets du divorce sur la santé mentale des hommes et des femmes soient bien établis, certaines études ne présentent que des effets à long terme faibles ou nuls. On interprète généralement cela comme une manifestation de l’atténuation, avec le temps, de l’effet du stress et des conflits reliés au divorce. Malheureusement, l’absence d’un effet semble trop souvent facilement interprétable, et une évaluation plus profonde de la relation entre le divorce et la santé mentale des conjoints apparaît inutile. Mais dans quelques cas importants, les apparences peuvent être trompeuses.
La figure 7 présente les résultats d’une étude longitudinale concernant les effets du divorce sur la détresse psychologique, dans laquelle l’intervalle séparant le divorce de la période de détresse psychologique se situe entre 2 et 4 ans. L’étude commence avec un échantillon de répondants mariés au temps 1. La figure 7 compare les personnes divorcées durant la période de 2 à 4 ans avant le temps 2 à celles qui sont demeurées mariées (un troisième groupe, non illustré ici, comprend les personnes divorcées plus récemment). La ligne pointillée sur la figure 7 représente une approximation de la différence moyenne de la détresse psychologique entre les personnes divorcées et celles qui sont toujours mariées au temps 2. Cette comparaison sommaire suggère que l’incidence du divorce n’engendre aucun effet sur la santé mentale. À cet égard, Wheaton (1990) estime que l’effet du divorce sur la détresse psychologique dépendra de la qualité de la vie matrimoniale telle que mesurée au cours des années de mariage. Puisque les données sont longitudinales, il est possible d’évaluer la situation du mariage avant le divorce. Wheaton (1990) anticipe que les individus ayant vécu un mariage heureux ressentiront davantage les effets néfastes du divorce que celles qui décrivaient leur mariage comme étant malheureux. Non seulement ces derniers pourraient-ils ne pas ressentir de détresse psychologique à la suite de leur divorce, mais ils pourraient même voir leur santé mentale s’améliorer par suite d’une diminution de stress : le divorce libère les personnes ayant vécu un mariage malheureux d’une situation stressante, pouvant ainsi diminuer le niveau de détresse psychologique.
Les pentes traduisant les effets du divorce sur la détresse psychologique étaient de 0,93 à la suite d’un mariage heureux et de -0,83 à la suite d’un mariage malheureux, ce qui correspond très étroitement au modèle prévu. En examinant la figure 7, nous pouvons constater la raison pour laquelle la relation globale entre les deux variables est nulle : les effets opposés du divorce sur la détresse psychologique s’annulent lorsque les antécédents de la qualité de la vie matrimoniale des couples ne sont pas pris en considération.
Il est cependant difficile de déterminer quand une relation nulle entre deux variables n’en est pas réellement une. Nous avons vu deux cas dans lesquels des relations nulles masquaient en fait des effets opposés sous différentes conditions. Deux indices nous suggèrent de vérifier l’hypothèse d’effets opposés au moyen d’un modèle incluant une interaction : 1) l’existence d’hypothèses théoriques opposées ; et 2) la présence de résultats incohérents et opposés dans la littérature, surtout quand ces incohérences présentent une régularité empirique.
Exemple 8 : Les trajectoires de vie comme contexte : 2- la saisie de la complexité
Lorsque deux théories se contredisent, la prise en compte de seuils, définissant des zones où chacune d’entre elles peut s’appliquer, permet parfois de les réconcilier sous la forme d’une seule relation non linéaire : par exemple, comme une relation quadratique en forme de « U », qui définit des zones où l’effet global s’exprime tantôt positivement, tantôt négativement.
Prenons l’exemple de l’impact du stress vécu durant l’enfance sur la vulnérabilité au stress à l’âge adulte, où se confrontent deux théories. D’une part, la théorie des « dommages progressifs » suggère que le stress vécu durant l’enfance entraîne plus tard, chez les adultes, une sensibilité accrue au stress. D’autre part, l’hypothèse de la « résilience » suggère que le stress vécu en bas âge prépare les enfants à mieux surmonter le stress qu’ils vivront tout au long de leur vie, tout en diminuant leur seuil de sensibilité. Quelle théorie s’avère juste ? Il est possible que toutes les deux le soient.
Pour examiner cette dernière possibilité, nous construisons un modèle incluant une interaction non linéaire (et non pas l’interaction linéaire habituelle) entre l’exposition cumulative au stress au cours de l’enfance et le niveau actuel de stress à l’âge adulte afin de prédire la santé mentale des adultes. Une telle interaction est-elle trop inimaginable ? Au contraire, je crois qu’elle est en réalité très plausible. Une interaction linéaire signifierait que chaque unité supplémentaire de stress vécu pendant l’enfance provoque les mêmes conséquences pour un niveau de stress donné à l’âge adulte, ce qui semble invraisemblable. Il est plus plausible que nous trouvions des variations entre les divers niveaux de stress durant l’enfance quant à l’effet d’un niveau de stress donné à l’âge adulte ; un tel effet pourrait être décelé en utilisant une interaction non linéaire.
Cette interaction pourrait prendre la forme suivante : des niveaux de stress durant l’enfance allant de faible à moyen augmenteraient l’immunité à l’égard du stress vécu ultérieurement, conformément à l’hypothèse de « résilience », alors des niveaux de stress plus élevés provoqueraient une augmentation de la vulnérabilité au stress à l’âge adulte, conformément à l’hypothèse des « dommages progressifs ». Mais une autre question se pose. L’âge de la personne adulte doit être considéré comme déterminant de l’hypothèse à privilégier. On peut croire que les bienfaits potentiels du stress vécu durant l’enfance ne se manifesteront pas au début de l’âge adulte, au moment où les problèmes de stress sont encore récents, mais plutôt à un âge plus avancé. Nous envisageons donc maintenant une interaction à trois variables, dans laquelle les conséquences du stress sur les individus dépendent simultanément de leur exposition au stress durant l’enfance et de leur âge actuel.
Ce modèle complexe a pour seul but de rendre les données significatives. Les résultats présentés dans les figures 8.1 et 8.2 ne pouvaient pratiquement pas être décelés lorsque des modèles plus simples étaient utilisés. En effet, certaines composantes essentielles des résultats obtenus étaient absentes des modèles les plus simples. Les deux figures présentent les résultats de l’estimation des interactions entre trois variables — le niveau actuel de stress chronique chez l’adulte, les niveaux d’exposition à des stresseurs traumatisants au cours de l’enfance et l’âge adulte — afin d’évaluer la détresse psychologique actuelle. Alors que la figure 8.1 illustre la détresse psychologique à l’âge de 23 ans, la figure 8.2 illustre celle des adultes de 53 ans. Chacune des figures utilise une surface tridimensionnelle pour dépeindre les impacts du stress chronique à différents niveaux de stress vécu durant l’enfance : chaque ligne de la grille allant de la gauche vers la droite représente l’effet prédit du stress chronique pour un niveau donné de stress durant l’enfance. En examinant la figure de l’avant vers l’arrière, nous constatons l’effet changeant du stress chronique sur la détresse, alors que le stress vécu durant l’enfance augmente.
Les effets du stress chronique à 23 ans se conforment principalement à l’hypothèse des « dommages progressifs » : l’effet du stress chronique, qui est stable et positif jusqu’au milieu de la courbe, commence à croître plus rapidement au fur et à mesure que le stress durant l’enfance augmente. À 53 ans (voir la figure 8.2), la situation se complexifie considérablement : avec une période aussi longue entre l’enfance et l’âge actuel, les répercussions du stress vécu durant l’enfance ne sont plus du tout les mêmes. Si l’hypothèse de la « résilience » prédomine en cas de faible exposition au stress au cours de l’enfance, celle des « dommages progressifs » s’applique lors de l’exposition à un stress moyennement élevé ou élevé en bas âge. Les deux théories s’avèrent donc véridiques. Il est à noter que l’effet le plus faible du stress chronique courant se retrouve chez ceux qui ont connu des niveaux de stress intermédiaires durant l’enfance (comme en témoignent les lignes horizontales qui traversent la grille).
La compréhension de la complexité requiert l’examen de modèles qui vont au-delà de ce qui est habituellement considéré dans les analyses quantitatives. Ce que nous ne voyons pas dans les résultats présentés c’est que l’interaction non linéaire entre les variables qui était prévue au départ ne se manifeste que lorsque l’âge est introduit comme troisième facteur. La surface de régression présentée à la figure 8.2 illustre une délicate confluence de forces différentes agissant simultanément pour donner forme à la vulnérabilité au stress à l’âge adulte. Aurions-nous pu, sans utiliser ce modèle complexe, réconcilier ces deux théories ou montrer que le poids de chacune d’entre elles varie au cours de la trajectoire de vie des individus ? Je ne le crois pas.
Exemple 9 : L’analyse du déroulement des événements par rapport à la régression logistique : le temps compte
Allison (1984) a proposé un exemple, devenu classique, des problèmes reliés à l’utilisation de la régression logistique insensible à la dimension temporelle, plutôt que du « modèle du déroulement des événements » (event history model) qui est plus approprié lorsque la séquence de ces derniers s’avère cruciale pour l’analyse. L’expression « modèle du déroulement des événements » est employée principalement dans les sciences sociales, et peut être considérée comme une forme du « modèle de survie », terme utilisé dans plusieurs autres disciplines.
Selon Allison, le suivi des prisonniers après leur libération afin de prédire leur propension à récidiver doit prendre en compte le laps de temps entre les deux événements. Cette dimension est importante parce que nous nous attendons à ce que les déterminants de la récidive jouent plus fortement dans les cas les plus « hâtifs » que dans les cas plus « tardifs ». Si ces deux types de cas sont comptés comme équivalents à la fin d’une période d’observation donnée (comme c’est le cas dans le modèle de la régression logistique), l’estimation de l’influence fondamentale de ces déterminants peut être sérieusement biaisée. En dépit de la diffusion croissante de l’analyse de survie et du modèle du déroulement des événements dans une grande variété de disciplines, on trouve encore des travaux qui font usage de la régression logistique même si la dimension temporelle des événements est importante. Dans certaines disciplines, la régression logistique possède un statut culturel lui conférant une crédibilité même dans des situations où elle est inappropriée.
Non seulement le modèle du déroulement des événements prévoit-il l’occurrence de l’événement, mais il prédit également le moment auquel il se produira au cours d’une période à risque. À l’opposé, la régression logistique permet uniquement de savoir si un événement s’est produit au cours de la période d’observation. Bien que ces deux méthodes ne produisent pas toujours des résultats différents, nous ne devrions pas pour autant supposer que leurs résultats concordent à tout coup. La figure 9 présente deux estimations des risques de souffrir de troubles psychologiques (dépression, anxiété) ou de consommer des drogues et de développer une dépendance pour les individus ayant vécu un traumatisme au cours de leur enfance : la première étant une régression logistique, et la seconde un modèle du déroulement des événements en temps discontinu. La variable dépendante est la date du premier épisode diagnostiqué comme appartenant à la catégorie psychiatrique dsm-iii-r, en utilisant l’instrument um-cidi (Kessler et al., 1994). Les coefficients correspondent aux chances relatives qui sont liées à un traumatisme durant l’enfance ; dans le modèle du déroulement des événements, l’enregistrement des données par personne et par période permet de relier ce traumatisme à l’âge auquel il est survenu dans la vie de l’individu, ainsi qu’à l’âge où commence l’épisode de troubles psychologiques ou d’abus de drogues. Bien sûr, plusieurs individus n’ont pas présenté de tels problèmes, et on parle alors d’observations « censurées ». Lorsque les données contiennent plusieurs observations censurées, les différences entre ces méthodes peuvent être particulièrement importantes.
Cet exemple permet de constater des différences fondamentales quant à l’idée qu’on peut se faire, à partir de ces deux méthodes, des risques de problèmes de santé mentale à la suite d’un traumatisme au cours de l’enfance. La régression logistique sous-estime généralement ce risque. Les différences entre les deux méthodes sont substantielles et pourraient enrichir à la fois notre compréhension théorique du phénomène et les interventions à l’égard des personnes à risques. Par exemple, la littérature stipule actuellement que le divorce des parents entraîne des conséquences plus nuisibles sur la santé mentale des enfants que le décès d’un des parents, alors que les résultats de l’analyse du déroulement des événements nous disent le contraire (notons que les résultats de l’analyse de régression logistique sont en fait compatibles, dans ce cas-ci, avec ceux de l’analyse du déroulement des événements, mais cela est inhabituel dans la littérature scientifique courante). Plusieurs développements théoriques, dans plusieurs champs de connaissance, se sont basés sur ce « fait », en mettant l’accent sur le problème de la présence continue et aléatoire du « parent perdu » dans les cas de divorce. Mais l’estimation des risques, à partir du modèle du déroulement des événements, indique que ce raisonnement est élaboré à partir de résultats erronés. Par ailleurs, le divorce des parents a bel et bien un effet beaucoup plus déterminant sur l’abus de drogues que le décès d’un parent, ce que ne révélait pas le modèle de régression logistique.
La régression logistique peut également conduire à une surestimation du risque. Les résultats suggèrent en effet que la régression logistique exagère le risque de consommer des drogues et de développer une dépendance dans le cas des enfants ayant perdu l’un de leurs parents ou ayant été victimes d’abus sexuel. En réalité, le modèle du déroulement des événements montre que le décès d’un parent réduit à long terme le risque de dépendance aux drogues, alors que la régression logistique affichait le résultat contraire.
Exemple 10 : La régression logistique hiérarchique plutôt qu’individuelle : l’espace compte
Les connaissances qui reposent sur l’usage des régressions logistiques peuvent aussi être problématiques parce qu’on y omet les « effets hiérarchiques ». O’Campo et al. (1997) ont étudié les facteurs de risque associés à la naissance de bébés de petit poids et ont comparé les résultats obtenus avec une régression logistique « individuelle » à ceux obtenus avec une approche hlm incluant des variables sur le quartier dans lequel résident les parents. La littérature sur le sujet s’est le plus souvent fiée principalement aux modèles logistiques pour développer un profil cohérent de ces risques.
Sur le plan individuel, deux des facteurs de risque bien établis dans cette littérature sont l’appartenance « raciale » et l’état civil. Ces facteurs individuels pourraient toutefois être confondus avec des différences sociales entre les quartiers qui influenceraient l’accessibilité aux soins médicaux. O’Campo et al. ont considéré les caractéristiques du quartier (statut socioéconomique, taux de criminalité, entassement, etc.) qui pourraient affecter la distribution des ressources utiles pour la santé, ainsi que le niveau d’organisation sociale dans le quartier (organismes communautaires).
Cet article montre que l’utilisation d’une approche hlm pour la recherche de facteurs de risque associés à la naissance de bébés de petit poids produit des résultats fort différents de ceux que rapporte la littérature courante. Par exemple, cette dernière rapporte que les bébés nés à l’extérieur du mariage ainsi que les bébés afro-américains voient leur risque de souffrir de problèmes de poids augmenter respectivement de 1,87 et de 1,73. Les deux résultats sont significatifs. L’analyse multiniveaux démontre toutefois qu’une fois la richesse du quartier prise en considération dans le modèle, l’ethnie afro-américaine de la mère ne constitue plus une cause déterminante et statistiquement significative des problèmes de poids du nouveau-né. Ceux-ci ne dépendent donc plus de caractéristiques individuelles des parents, telles que l’ethnie, mais bien du manque général de soins médicaux dans le quartier. D’autre part, le modèle multiniveaux fait grimper le risque — pour les naissances hors mariage — de donner vie à un bébé de petit poids de 1,87 à 4,37 lorsque la richesse du quartier est contrôlée. Ainsi, l’impact du statut matrimonial sur le poids des poupons s’avère-t-il sous-estimé dans la littérature.
De plus, un modèle limité sur le plan individuel ne permettrait pas l’étude des interactions entre les niveaux d’analyse. Par exemple, le nombre de groupes communautaires a un effet modérateur sur la relation entre la scolarité de la mère et le faible poids des nouveaux-nés. En général, les femmes issues de quartiers où la participation communautaire est importante ont moins de risques de donner naissance à un bébé de petits poids que celles des quartiers où la vie communautaire est peu dynamique. Voilà donc qui illustre un effet direct du contexte social sur les individus, au-delà des médiations proprement individuelles. De plus, les effets de la scolarité sur la diminution du risque d’accoucher d’un petit bébé s’avèrent plus marqués dans les quartiers moins bien organisés sur le plan communautaire. Le dynamisme de la vie communautaire compense ainsi pour la faible scolarité des mères.
En somme, les résultats obtenus démontrent une fois de plus l’importance cruciale des analyses multiniveaux dans l’atteinte de conclusions appropriées sur les déterminants des situations individuelles. Plus généralement, nous constatons l’importance du temps et de l’espace dans la spécification des résultats que nous obtenons.
Les leçons à retenir
Pour résumer, l’analyse de données peut conduire à de graves erreurs pour différentes raisons, allant de la métaphysique à la politique en passant par notre scepticisme collectif relativement aux innovations et aux idées nouvelles. La question est de savoir comment éviter ces problèmes. La création d’un langage commun, ainsi que d’un recueil commun de compétences et d’apprentissages, demeure une condition nécessaire pour éviter les problèmes décrits dans les exemples précédents. Cela ne suffit toutefois pas.
Ces exemples soulèvent des questions relatives à l’application des méthodes de traitement des données, et leur liste peut constituer un rappel généralement utile. Premièrement, nos exemples ont montré que les méthodes donnent forme à la nature même des phénomènes, mais que cette nature doit clairement guider l’application des méthodes — un principe mertonien bien connu. Dans plusieurs cas, c’est la théorie qui nous a fait faire le premier pas sur le chemin menant à une conclusion plus claire. Mais en même temps, et dans un nombre de cas aussi important, le cadre analytique offert par la méthode a également permis la clarification ou l’élaboration d’une nouvelle théorie.
En second lieu, l’intuition, bien que cachée dans l’inventaire ce que nous « savons », peut représenter une entrave à la connaissance. L’intuition peut, par des détours complexes, favoriser la complaisance dans la mesure où elle constitue une source de savoir instantanément accessible à un large auditoire. En réalité, l’intuition peut voiler les réalités empiriques plutôt que de les révéler. Aller au-delà de l’intuition implique une ouverture à l’égard de manières nouvelles et innovatrices de conceptualiser un problème. Plusieurs outils méthodologiques permettent d’étudier un problème sous des angles nouveaux, mais c’est le chercheur qui doit venir à la montagne, et non l’inverse.
Troisièmement, rappelons que « consensus » et « vérité » ne sont pas synonymes. Bien que l’histoire nous fournisse plusieurs exemples de ce truisme, nous n’appliquons présentement que trop peu cette maxime à l’examen des résultats empiriques les plus courants. Dans quelques cas importants, le cadre complet du discours public sur certaines questions est défini sur la base d’une littérature erronée.
Quatrièmement, et malheureusement, les « technicalités » ont un impact sur les analyses. Des détails techniques peuvent parfois être négligés parce qu’ils apparaissent comme des exigences abstraites de rigueur ; en réalité, ils transforment fondamentalement le produit des analyses.
Cinquièmement, la complexité et la nuance ne sont pas des anathèmes dans les analyses quantitatives. La subtilité de l’interprétation prend diverses formes, y compris des formes quantitatives. Plusieurs des exemples que nous avons examinés mettent fortement en question l’idée que les modèles quantitatifs ne sont utiles que pour les grandes vérités « évidentes ». L’enjeu soulevé par ces exemples ne porte pas sur ce que sont les recherches quantitatives, mais plutôt sur ce dont elles sont capables.
Sixièmement, les exemples présentés ci-dessus nous apprennent que ce qui n’est pas visible peut parfois avoir des conséquences plus graves que ce qui l’est. Nous devons constamment garder en tête la variété des processus sociaux capables de produire ce que nous observons. Nous devons également prendre conscience des postulats simplificateurs, souvent oubliés, qui servent de fondement aux techniques les plus courantes, comme la régression des moindres carrés et la régression logistique. Le « rasoir d’Occam » stipule que nous devons retenir l’explication la plus simple — mais non pas si cette dernière est une illusion qui cache une réelle complexité. Nous devons même considérer des possibilités qui se situent au-delà des résultats obtenus dans les analyses. Si nous ne pouvons déceler de relation entre X et Y, il peut être souhaitable de réfléchir à nouveau aux raisons qui expliquent l’absence de liens entre ces variables.
Septièmement, pour reprendre un thème récurrent dans ces exemples, le temps et l’espace influencent ce que nous trouvons. La question du temps a joué un rôle fondamental dans plusieurs de nos exemples, que ce soit des arguments en faveur des données longitudinales, ou la nécessité d’utiliser des modèles incorporant la dimension temporelle des événements. Le contexte est également important, car il influence directement le comportement individuel et il modifie la pertinence ou la signification des facteurs individuels.
Nous avons essentiellement soutenu, dans cet article, que les méthodes affectent ce que nous voyons et ce que nous savons. Nous couplons cette thèse à une prémisse fondamentale : les formes du discours savant ne se substituent pas simplement l’une à l’autre au fil du temps ; nous nous rapprochons au contraire régulièrement, dans l’histoire de la science, d’une précision empirique de plus en plus grande et de plus en plus généralisable. Les exemples utilisés dans cet article nous avertissent des dangers courus quand on ignore les avancées méthodologiques.
Les sciences sociales jouent un rôle d’expertise et d’information dans la société. Le travail des spécialistes dans ce domaine, pour le résumer simplement, consiste à produire et à évaluer des idées à propos des processus sociaux d’une façon qui maximise leur crédibilité et leur impact. Si les sciences sociales ne peuvent jouer leur rôle correctement, les conseils et les expertises proviendront d’autres sources, vraisemblablement plus douteuses. Les méthodes que nous utilisons et la manière dont nous les utilisons détermineront la justesse de nos conclusions, et en conséquence le degré auquel la société prêtera l’oreille aux spécialistes des sciences sociales.
Parties annexes
Remerciements
Présenté lors du colloque annuel de l’Association canadienne de sociologie et d’anthropologie, Québec, mai 2001. La traduction a été faite par Sophie Mathieu et Paul Bernard.
Bibliographie
- Allison, Paul. D. (1984), Event History Analysis for Longitudinal Event Data, Newbury Park, CA, Sage.
- Alwin, Duane F. et Robert M. Hauser (1975), « The decomposition of effects in path analysis », American Sociological Review,40, p. 37-47.
- Cleary, P. et R. Angel (1984), « The analysis of relationships involving dichotomous dependent variables », Journal of Health and Social Behavior,25, p. 334-348.
- Dohrenwend, Bruce P. et Barbara Snell Dohrenwend (1969), Social Status and Psychological Disorder, New York, Wiley.
- Duncan, Otis Dudley (1969), « Some Linear Models for Two-Wave, Two-Variable Panel Analysis », Psychological Bulletin, 72, p. 177-182.
- Faris, Robert et W.H. Dunham (1939), Mental Illness in Urban Areas, Chicago, University of Chicago Press.
- Goodman, L. (1976), « The relationship between modified and usual multiple regression approaches to the analysis of dichotomous variables », in D. Heise (dir.), Sociological Methodology, p. 83-111.
- Hall, Kimberlee (1999), « Gender, Marital Status, and Psychiatric Disorder : an Examination of Social Causation vs. Social Selection Explanations for the Gender Specific Benefits of Marriage for Mental Health », thèse de doctorat, Département de sociologie, University of Toronto, Ontario, Canada.
- Heise, David R. (1969), « Separating reliability and stability in test-retest correlations », American Sociological Review, 34, p. 93-101.
- Kessler, Ronald C., K.A. McGonagle, S. Zhao, C.B. Nelson, M. Hughes, S. Eshleman, H. Wittchen et K.S. Kendler (1994), « Lifetime and 12-month Prevalence of DSM-III-R Psychiatric Disorders in the United States », Archives of General Psychiatry,51, p. 8-19.
- Knoke, David (1975), « A Comparison of Log-Linear and Regression Models for Systems of Dichotomous Variables », Sociological Methods and Research, 3, p. 416-433.
- Mason, W.M., G.Y. Wong et B. Entwisle (1983), « Contextual Analysis through the Multilevel Linear Model », in S. Leinhardt (dir.), Sociological Methodology, San Francisco, Jossey-Bass, p. 72-103.
- Miech, Richard A., A. Caspi, T.E. Moffitt, B.R. Entner Wright et P.A. Silva (1999), « Low Socioeconomic Status and Mental Disorders : A Longitudinal Study of Selection and Causation During Young Adulthood », American Journal of Sociology,104, p. 1096-1131.
- Mirowsky, Jonh et Catherine E. Ross (1990), « Control or Defense ? Depression and the Sense of Control over Good and Bad Outcomes », Journal of Health and Social Behavior, 31 (mars), p. 71-86.
- Mischel, Walter A. (1968), Personality and Assessment, New York, Wiley.
- O’Campo, P., X. Xue, M.C. Wang, M. Caughy (1997), « Neighborhood Risk Factors for Low Birthweight in Baltimore City : A Multi-level Analysis », American Journal of Public Health, vol. 87, no7, p. 1113-1118.
- Pearlin, Leonard I. et Carol S. Aneshensel (1986), « Coping and social supports : their functions and applications », in Linda H. Aiken et David Mechanic (dir.), Applications of Social Science to Clinical Medicine and Health Policy, New Brunswick, N.J., Rutgers University Press, p. 417-438.
- Pelz, Donald C. et Robert A. Lew (1970), « Heise’s Causal Model Applied », in E.F. Borgatta et G. Bohrnstedt (dir.), Sociological Methodology, San Francisco, Jossey-Bass, p. 28-37.
- Raudenbush, Stephen et Anthony Bryk (2002), Hierarchical Linear Models : Applications and Data Analysis Methods, Second Edition, Thousand Oaks, CA, Sage.
- Thoits, Peggy (1995), « Stress, Coping, and Social Support Processes : Where are We ? What Next ? », Journal of Health and Social Behavior, numéro spécial, p. 53-79.
- Turner, R. Jay et Blair Wheaton (1991), « Psychiatric Distress and the Use and Abuse of Alcohol and Drugs : The Toronto Mental Health and Stress Study Wave II », Health Canada, National Health Research Development Programme.
- Wheaton, Blair, Bengt Muthen, Duane F. Alwin et Gene F. Summers (1977), « Assessing Reliability and Stability in Panel Models », in David R. Heise (dir.), Sociological Methodology, San Francisco, Jossey-Bass, p. 84-136.
- Wheaton, Blair (1985), « Models for the stress-buffering functions of coping resources », Journal of Health and Social Behavior,26, p. 352-365.
- Wheaton, Blair (1990), « Life Transitions, Role Histories, and Mental Health », American Sociological Review, vol. 55, no2, p. 209-223.
- Wheaton, Blair (1998), « Reconsidering the Role of Coping Resources in the Stress Process : How Social and Life History Context Change What we Know about Coping », présenté lors du American Sociological Association meetings in San Francisco, 21-25 août.
- Wheaton, Blair (2001), « The Role of Sociology in the Study of Mental Health…and the Role of Mental Health in the Study of Sociology », Journal of Health and Social Behavior, 42, p. 221-234.
- Wheaton, Blair et Philippa Clarke (2002), « Space Meets Time : Combining Temporal and Contextual Influences on Mental Health in Early Adulthood », présenté lors du American Sociological Association Meetings in Chicago, Illinois, 16-20 août.