Article body

INTRODUCTION

Les tests projectifs permettent une évaluation profonde, dynamique et globale de la personnalité, en évitant les biais qui peuvent exister dans les mesures autorapportées (comme la désirabilité sociale au travers de questionnaires). Bien que les tests projectifs soient régulièrement critiqués en raison de leur supposé manque de validité psychométrique (Lilienfeld, Wood et Garb, 2000), des études récentes ont réfuté ces critiques (Hibbard, 2003; Meyer et al., 2001; Stein et al., 2012).

Le Thematic Apperception Test (TAT) est un des tests projectifs les plus utilisés par les psychologues cliniciens, après le Rorschach. Murray et Morgan (1935) ont créé le Thematic Apperception Test (TAT) dans lequel des images représentant des scènes psychologiquement ambiguës sont montrées aux sujets (Morgan, 1995), qui doivent inventer une histoire à partir de chaque image. Un des objectifs du TAT est d’obtenir par des méthodes indirectes, des informations sur différentes dimensions de la personnalité des sujets, par l’interprétation des récits des sujets face à des situations émotionnellement intenses et ambiguës. Plusieurs méthodes d’interprétations des récits TAT existent (Jenkins, 2008); elles sont souvent (mais pas toujours, Rae Jenkins, 2007) globales et basées sur des théories psychanalytiques (Bellak, 1954; Brelet-Foulard et Chabert, 2003; Morval, 1982; Murray, 1943). D’autres méthodes sont plus spécifiques et évaluent des aspects précis de la personnalité. Par exemple, le Defense Mechanisms Manual (DMM) évalue les mécanismes de défense (Cramer, 1991), alors que le Multi-Motive Grid (MMG) évalue les trois grandes motivations – succès, appartenance et pouvoir (Soklowski, Schmalt, Langens, et Puca, 2000), et que la Social Cognition and Object Relation Scale (SCORS), qui est l’objet de notre étude, évalue les relations d’objet (Westen, 1990b; Westen, Lohr, Silk, Kerber et Goodrich, 1990a).

La méthode SCORS

Westen a créé la première version de SCORS dans les années 1990 (Westen, 1990b, 1991a). SCORS évalue plusieurs dimensions psychologiques impliquées dans les relations d’objet. Selon Westen : « Le terme relation d’objet, se réfère à un ensemble de fonctions et de structures cognitives et affectives, incluant les façons de se représenter les personnes et les relations, les règles, pour inférer et interpréter les causes des émotions des personnes, leurs comportements, leurs désirs interpersonnels, leurs conflits, etc.[2] » (Westen, 1990b, p. 355, traduction française des auteurs). Ainsi, les relations d’objet sont liées au niveau général de la personnalité, aux capacités d’ajustement et aux mécanismes de défense (Hibbard et al., 2010; Kernberg, 1976). La méthode SCORS dans sa version américaine a déjà fait l’objet de plusieurs études de validation.

Validité concourante et discriminante de la méthode SCORS

La validité concourante de la méthode SCORS (version américaine) pour coter les récits TAT, des récits de souvenirs ou des données d’entretiens est déjà bien établie (Ackerman, Hilsenroth, Clemence, Weatherill et Fowler, 2001; Barends, Westen, Leigh, Silbert, et Byers, 1990; Eurelings-Bontekoe, Luyten et Snellen, 2009; Fowler, Ackerman, Speanburg, Bailey, et Blagys, 2004; Hibbard, Hilsenroth, Klepser-Hibbard, et Nash, 1995; Hibbard, Porcerelli, Kamoo, Schwartz et Abell, 2010; Leigh, Westen, Barends, Mendel et Byers, 1992; Lysaker, Dimaggio, Daroyanni, Buck, LaRocco, Carcione et Nicolo, 2010; Mitchel, 2001; Stein et al., 2012; Vaz, Béjar et Casado, 2002; Stein, Pinsker et Hilsenroth, 2007). Comme nous ne visons pas ici à tester la validité concourante de SCORS, nous n’entrons pas dans les détails de ces études.

La validité discriminante de la méthode SCORS a été établie dans plusieurs études, comparant plusieurs groupes et obtenant des résultats conformes au cadre théorique de SCORS. Ainsi, des recherches ont porté sur des groupes de filles ayant ou non souffert d’abus (taille d’effet, r = .38 pour les scores moyens, les groupes de filles non abusées ayant des scores supérieurs à l’autre groupe) (Ornduf, 2003), pour des groupes d’étudiants en psychologie qui ont des scores supérieurs à un groupe d’étudiants en sciences naturelles (Westen, Huebner, Lifton, et Silverman, 1991b), des groupes d’enfants jeunes ayant des scores plus bas que ceux plus âgés (COM[3], d = 0,8; EIM, d = 0,83; CS, d = 0,84), (Westen et al., 1991c), ou encore des sujets avant ou après 16 mois de psychothérapie, les scores étant plus élevés après qu’avant (les tailles d’effet variant entre d = 0,25 à 0,46; Fowler et al., 2004). De façon générale, la validité discriminante de SCORS est aussi bien établie pour des sujets présentant divers troubles de la personnalité. Ainsi, Eurelings-Bontekoe et al. (2009) ont montré des différences statistiquement significatives entre différents troubles de la personnalité sur les échelles EIR (d = 0,55), SC (d = 0,73) et COM (d = 0,69). Weise et Tubert (2004) ont montré que des enfants avec des troubles narcissiques obtenaient des scores significativement plus bas sur les échelles EIV (d = 1,46), AGG (management of aggressive impulses) (d = 1,19) and SE (d = 1,02) par rapport à des enfants ne présentant pas de trouble.

Plusieurs études ont établi la validité discriminante de SCORS pour différencier des sujets présentant des troubles de la personnalité limite. Toutes les échelles de SCORS permettaient de différencier des sujets avec des troubles de la personnalité narcissique, borderline, antisociale et du cluster C (DSM IV) (avec des d variant de 0,9 à 1,5) (Ackerman, Clemence, Weatherill et Hilsenroth, 1999).

Deux études portent sur la comparaison de groupes cliniques avec des groupes non cliniques, comme le fait la présente étude. En accord, avec la littérature sur SCORS (Hibbard et al., 2010; Weise et Tubert, 2004; Westen, 1990b) et sur les relations d’objet (Kernberg, 1976; Lagache, 1984), le groupe non clinique devrait obtenir de meilleurs scores à toutes les échelles de SCORS, par rapport au groupe clinique. Ainsi, des sujets présentant un trouble de la personnalité borderline présentaient des scores plus bas sur toutes les échelles de SCORS, qu’un groupe de sujets sans trouble (taille d’effet variant de d = 0,6 à 0,84) et des scores plus bas que des sujets déprimés sur les échelles AFF (d = 0,23) and EIM (d = 0,49) (Westen et al., 1990a). Une autre étude a montré la validité discriminante de SCORS pour différencier des sujets non cliniques de sujets présentant des troubles névrotiques, états limites et psychotiques. Les sujets non cliniques ont, comme attendu, des scores plus élevés que les trois autres groupes (Hibbard, Porcerelli, Kamoo,Schwartz et Abell, 2010). Ces études ont utilisé la version américaine de SCORS.

Objectif de l’étude

La présente étude a pour objectif d’étudier la validité discriminante (sujets cliniques vs non-cliniques), de la version française de la méthode SCORS, pour coter les récits TAT.

MÉTHODE

Pour tester la validité discriminante de la méthode SCORS version française, nous avons coté avec six échelles de SCORS, 5 récits TAT de 114 sujets répartis en deux groupes : le groupe non clinique (47 sujets) et le groupe clinique (67 sujets) (voir Tableau 1).

Population de l’étude

Notre échantillon est composé de 114 sujets (71 femmes [62%], 43 hommes; M âge = 36,7 ans [SD = 10,9, min = 18; max = 63]; niveau d’étude moyen = 3[4] [1,2, 1-5]). L’échantillon a été séparé en deux groupes : non clinique (47) vs clinique (67, parmi lesquels 27 sujets souffrant de schizophrénie; 20 de troubles de la personnalité borderline; 20 de phobie sociale).

Notre groupe clinique est composé de sujets souffrant de troubles impliquant des difficultés relationnelles, dont on peut supposer qu’elles sont reliées à des difficultés du fonctionnement général, et en particulier, des relations d’objet. C’est le cas pour les sujets souffrant de phobie sociale qui présentent des angoisses relationnelles, des réflexes d’évitement et une estime de soi particulièrement faible (Biran et Reese, 2007; Joorman et Gotlib, 2006; Pinto-Gouveia, Castilho, Galhardo, et Cunha, 2006; Young, 1999). C’est le cas aussi des sujets souffrant de troubles borderline, qui présentent une importante instabilité relationnelle et émotionnelle (Ackerman, Clemence, Weatherill, et Hilsenroth, 1999; Kernberg, 2004; Westen et al., 1990a). C’est le cas, enfin, des sujets souffrant de troubles schizophréniques en raison, entre autres, de leurs difficultés cognitives, en particulier en ce qui concerne les habiletés et les cognitions sociales qui impactent leur capacité à initier et maintenir des relations stables (Bell et Bruscato, 2002; Delteil, 1961; Racamier, 1980, Stein et al., 2012).

Les participants sont tous majeurs et le français est leur langue maternelle. Les passations de TAT ont eu lieu à Paris entre 2007 et 2011 dans différents environnements cliniques ou non (pour les non-cliniques). Les participants non cliniques ont été recrutés pour cette étude par des psychologues expérimentés et des étudiants de master de psychologie clinique dans leur environnement social au sens large (pas dans leur premier cercle de relations, mais seulement auprès de personnes qu’ils ne connaissaient pas directement). Les participants ont été informés de l’étude et ont donné par écrit leur consentement éclairé. De façon à s’assurer qu’ils ne présentaient pas de trouble psychique au moment de l’étude, en plus du TAT, ils ont rempli la SCL90 R (Derogatis, Lipman et Covi, 1973), version française (Pariente et Gurlfi, 1990; Pellet, 1997). Nous n’avons retenu que les participants ayant un score global inférieur à 1, qui exclut la présence de symptômes cliniquement significatifs (Pariente et al., 1989; Tatu Pellet, Lang, Pichon et Coerchon, 1994). De plus, nous avons questionné les participants : ceux qui déclaraient être en psychothérapie, ou prendre un traitement psychiatrique ou avoir à faire face à des difficultés psychologiques actuellement étaient exclus de l’échantillon. Ainsi, en appliquant ces critères d’inclusion (ainsi qu’en tenant compte de la qualité formelle de la retranscription des TAT), des 134 protocoles de TAT, des sujets pressentis pour l’étude, nous en avons retiré 87 qui ne respectaient pas les critères d’inclusion pour en garder finalement 47.

Tableau 1

Données sociodémographiques pour chaque groupe

Données sociodémographiques pour chaque groupe

(a) M(%)/F

(b) Mean (SD)/min/max

(c) 6 = pas de diplôme; 5 = BEPC, BEP, CAP; 4 = Bac; 3 = Bac +2; 2 Bac + 3 et 4; 1 = bac +5 et plus

-> See the list of tables

Les sujets présentant des troubles schizophréniques (27 dont 10 souffrant de schizophrénie paranoïde, 6 d’autres sous-types de schizophrénie et 11 de troubles schizo-affectifs) ont été recrutés dans un centre psychiatrique de réhabilitation psychosociale à Paris. Les diagnostics ont été posés par l’équipe de recherche en suivant les critères DSM IV R (American Psychiatric Association [APA], 2003) en s’appuyant sur les comptes rendus de l’équipe médicale, ainsi que sur les autres données du dossier médical (entretiens, résultats de bilans…). Tous ces patients prenaient un traitement neuroleptique et présentaient un état psychopathologique stable au moment de la passation. Après avoir contacté leur psychiatre traitant (indépendant de l’hôpital de jour), nous avons contacté chaque sujet pour leur proposer de participer à la recherche. Cette recherche impliquait de passer le TAT, le Rorschach ainsi que d’autres questionnaires. 15 sujets ont refusé de participer et 20 ne remplissaient pas les critères d’inclusion. Tous les participants inclus ont donné par écrit leur consentement éclairé à la recherche.

Les données provenant des participants souffrant de phobie sociale (N = 20) provenaient d’un bilan psychologique, effectué dans le cadre de leur prise en charge dans un centre de consultation spécialisée à Paris. Le TAT et d’autres questionnaires ont été passés avant, et indépendamment de cette recherche, dans un objectif clinique. Les diagnostics ont été posés en suivant les critères du DSM IV R par un entretien diagnostic psychiatrique. De plus, tous ces participants ont passé l’échelle d’anxiété sociale de Leibowitz (LSAS) (Liebowitz, 1987). Leurs scores totaux (M = 82,1; SD = 16,7) et ceux aux sous-échelles de peur (M = 45,9; SD = 5,8) et d’évitement (M = 37,2; SD = 9,3) correspondaient aux scores des sujets souffrant de phobie sociale dans l’étude de validation française (Yao et al., 1999). Nous avons inclus les protocoles de 20 sujets souffrant de phobie sociale (dont 4 avec des comorbidités anxieuses et 2 avec des comorbidités dépressives).

Les données des participants souffrant de troubles borderline de la personnalité (N = 20), venaient de plusieurs institutions cliniques. 12 venaient d’un centre de consultation psychothérapique (et le TAT a été administré lors d’un bilan préalable à leur suivi psychothérapique), 8 provenaient d’un hôpital de jour (et le TAT a été passé lors d’un bilan pour une autre recherche). Les diagnostics étaient basés sur les critères du DSM IV R, à la suite de la passation du SCID 2 (Firtz et al., 1997) (pour 12 d’entre eux) ou (pour les 8 autres), en suivant les critères du DSM IV R à partir des comptes rendus d’entretiens diagnostic psychiatriques, ainsi que des éléments du dossier des patients. 7 de ces participants présentaient une comorbidité dépressive.

Tous les participants ont donné leur consentement éclairé et cette étude respecte les recommandations de la déclaration d’Helsinki.

Puissance statistique

Concernant la puissance statistique pour des comparaisons de moyennes, avec 114 sujets répartis en deux groupes inégaux de 47 et 67 sujets, nous avons 80% de chance de montrer des tailles d’effet (si elles existent) de d = 0,5, significatives à p = 0,05. Ce qui est raisonnable par rapport aux résultats connus de la littérature.

Mais, malgré son intérêt scientifique, nous ne comparerons pas les groupes cliniques entre eux, car avec environ 20 sujets par groupe, nous ne pourrions montrer (à 80 % de chance et p = 0,05) que des tailles d’effet de d = 0,9, ce qui est élevé par rapport aux résultats de la littérature. Pour comparer les sous-groupes diagnostic entre eux avec une chance raisonnable d’obtenir des résultats significatifs fiables avec un d à 0,5, il nous faudrait des groupes d’environ 50 sujets, ce qui n’est pas le cas ici, et ce qui pourra faire l’objet d’études ultérieures.

La méthode SCORS utilisée

La version actuelle de SCORS que nous avons utilisée dans l’étude présente, est le SCORS-Global Rating (SCORS-G; Stein et coll, 2011) qui consiste en huit dimensions, évaluées chacune sur une échelle Likert en sept points. Les scores les plus bas montrent un niveau plus pathologique et plus désadapté du fonctionnement global et des relations d’objets, alors que des scores plus élevés montrent un fonctionnement plus élaboré, mature et adapté. Chaque récit TAT est coté avec chaque échelle. Sur les huit échelles de la méthode SCORS-G, nous en avons utilisées six. En effet, l’échelle « gestion des impulsions agressives » (échelle AGG) était difficile à coter en raison du manque de représentations agressives dans les récits TAT dont nous disposions (qu’ils soient cliniques ou non). Et nous trouvions que l’échelle « identité et cohérence du soi » (ICS) était redondante avec l’échelle « complexité des représentations des individus » (COM). Nous avons donc utilisé six échelles de SCORS dans cette étude. L’échelle « complexité des représentations des individus » (COM) qui évalue la façon dont les sujets différencient le soi et les autres, dont ils perçoivent le soi et les autres comme ayant des caractéristiques stables, durables et multidimensionnelles, et dont ils perçoivent les autres comme des êtres avec une vie psychique constituée de motivations complexes et d’expériences subjectives. L’échelle « qualité affective des représentations » (AFF) évalue la tonalité émotionnelle et la qualité affective des représentations des personnes et des relations. Cette échelle tente d’évaluer la nature et l’intensité des attentes du sujet envers le monde, spécialement le monde humain, en particulier en évaluant si les interactions sont associées à de la malveillance et de la souffrance, ou plutôt à de la bienveillance et de l’enrichissement. L’échelle « capacité d’investissement affectif dans les relations » (EIR), évalue dans quelle mesure les autres sont conçus principalement en tant qu’objets (utilisés dans l’intérêt du sujet) ou en tant que sujets pouvant être investis pour eux-mêmes. Ainsi, cette échelle situe le sujet sur un continuum entre centration narcissique et investissement affectif des autres en tant que sujets. L’échelle « investissement des valeurs et des normes morales » (EIM) évalue la façon dont les normes morales ont été internalisées et intégrées, sur un continuum allant de l’immoralité et de l’amoralité jusqu’à des normes sociales bien internalisées et structurées. L’échelle « compréhension de la causalité sociale » (SC) évalue la façon dont l’attribution de la causalité expliquant les comportements, pensées et ressentis des autres est logique, pertinente, complexe et prend en compte la dimension psychologique. L’échelle « estime de soi » (SE) mesure la capacité du sujet à évaluer sa propre valeur d’une façon réaliste que ce soit en positif ou en négatif.

La version française de SCORS

Les noms des échelles et les critères de cotation ont été traduits en français à partir du manuel de cotation en anglais rédigé par l’auteur de SCORS (Westen, 1990b, Stein et coll, 2011). Le manuel en anglais contient le descriptif des échelles, ainsi que de nombreuses indications et exemples, et il fait 132 pages. Il n’a donc pas été possible de le traduire totalement, ni de suivre une procédure de rétro traduction, telle qu’elle se pratique pour les traductions de questionnaires. Nous avons donc traduit en français le nom des échelles ainsi que les critères de cotation principaux. La traduction a été effectuée par des psychologues français, certains bilingues, puis comparée à d’autres versions françaises traduites indépendamment de notre groupe de travail. Enfin, la traduction a été revue pour la faire contrôler par d’autres psychologues et étudiants en psychologie bilingues. Après ce processus de traduction, la version française a été utilisée dans des études pilotes en France avec une bonne fidélité interjuge et une bonne validité de façade (Bouvet, 2010; Bouvet et Cleach, 2011; Bouvet, Nascimento Stieffatre et Prime, 2006).

Nous avons aussi rédigé en français un manuel de cotation avec des exemples de cotation émanant de protocoles de TAT passés en France et en français. Nous pouvons transmettre l’ensemble de ces documents sur demande.

Après plusieurs sessions de formation des coteurs basées sur le manuel de cotation transmis à l’auteur principal par D. Westen, les récits TAT ont été cotés en double et en aveugle, concernant le statut clinique vs non clinique. Puis nous avons comparé, échelle par échelle, les résultats de chaque groupe à l’aide de test de comparaison de moyennes.

Procédure de passation des TAT

Les protocoles de TAT des sujets du groupe non clinique ont été recueillis pour cette recherche, par des psychologues expérimentés et des étudiants en master de psychologie, formés à la passation du TAT pour cette recherche. Ces passations ont été enregistrées, puis contrôlées par le groupe de recherche et retranscrites, avant d’être cotées par l’équipe de recherche. Les protocoles des TAT des participants du groupe clinique ont été recueillis par des psychologues expérimentés sur leur lieu de travail clinique et ont été retranscrits, avant d’être cotés par l’équipe de recherche.

Les instructions ont été les mêmes pour tous les participants et étaient celles préconisées par Murray (1943, p.4) : « j'ai ici des images que je vais vous montrer et pour chaque image, je voudrais que vous inventiez une histoire. Dites ce qui s’est passé avant, et ce qui se passe maintenant, et comment cela se terminera. Dites ce que les personnages ressentent et pensent. Vous pouvez inventer l'histoire qui vous plaira ». Selon les passations, de 12 à 15 planches ont été utilisées. À chaque fois, le jeu de planche présenté, incluait les planches 1, 2, 3BM, 4 et 13 qui sont les plus fréquemment utilisées dans les études sur le TAT (Bouvet, 2010). C’est pour ces raisons que nous les avons sélectionnées pour la présente étude.

Procédure de cotation

12 psychologues expérimentés et étudiants en master en psychologie volontaires pour ce travail se sont entraînés collectivement à la cotation des TAT, avec la méthode SCORS sur la base du manuel de cotation transmis par l’auteur de SCORS, D. Westen. Les sessions d’entraînement collectif à la cotation étaient suivies par des cotations indépendantes de protocoles de TAT. Puis, la fidélité interjuge était calculée (avec le coefficient de corrélation intraclasse). Plusieurs sessions de formation ont été nécessaires pour atteindre une fidélité interjuge satisfaisante. 2 juges ne parvenaient pas à une bonne fidélité interjuge avec le groupe de coteurs, nous les avons donc exclus pour les cotations pour la présente recherche. 10 coteurs ont donc coté les protocoles de cette recherche.

Les 114 protocoles de TAT ont été standardisés dans leur présentation et ont été envoyés aux coteurs, sans aucune information sur le statut clinique ou l’origine institutionnelle du sujet. Seuls l’âge et le sexe des participants étaient indiqués sur le protocole.

Nous avons alors envoyé aux coteurs un certain nombre de protocoles de TAT (c’est-à-dire les récits aux cinq planches indiquées plus haut). L’attribution des TAT aux coteurs a été effectuée par tirage au sort. Chaque protocole a été coté par deux coteurs indépendants l’un de l’autre, et aveugles sur le statut clinique du sujet. Cette procédure rigoureuse de cotation a donc impliqué d’effectuer 6840 cotations (114 sujets x 5 planches x 6 échelles de SCORS x 2 coteurs).

Le score final par sujet et par planche correspond à la moyenne des deux cotations des deux coteurs et le score final par sujet et par échelle, correspond à la moyenne des notes de ses cinq récits cotés sur l’échelle correspondante.

RÉSULTATS

Fidélité interjuge

La fidélité interjuge va de correcte à excellente, selon les échelles de SCORS. Les coefficients de corrélation intraclasse (Fliess, 1981; Hilsenroth, et al., 2004), calculés sur toutes les cotations de chaque échelle de SCORS, sont de 0,66 (COM), 0,67 (AFF), 0,73 (EIR), 0,59 (EIM), 0,66 (SC), 0,64 (SE) et après la correction de Spearman-Brown, respectivement de 0,79, 0,80, 0,84, 0,74, 0,79, 0,78.

Normalité et homogénéité de variances

Après le test de la normalité des variables (Shapiro-Wilk test et Anderson-Darling test) et le test d’homogénéité des variances (avec le test de Bartlett et le test de Levene) pour chaque variable, nous avons mené des tests paramétriques ou non paramétriques de comparaison de moyennes entre les moyennes de chaque échelle de SCORS des deux groupes.

Tests de comparaison des moyennes entre groupes clinique et non clinique

Nos hypothèses prédisant des résultats supérieurs du groupe non clinique, par rapport au groupe clinique sur chaque échelle de SCORS, sont confirmées (Tableau 2).

Le groupe non clinique a des cotations systématiquement supérieures au groupe clinique. Ces différences sont significatives à p<0,05 pour les échelles COM (W = 1036, p = 0,007, d = 0,65), SC (t = 2,65, df = 110, p = 0,009, d = 0,50) and SE (w = 1068, p = 0,003, d = 0,67), et sub-significatives à p<0,1 pour les échelles AFF (W = 1242, p = 0,06, d = 0,48), EIR (W = 1251, p = 0,06, d = 0,51) et EIM (W = 1282, p = 0,09, d = 0,35). Les tailles d’effets vont de petites (EIM) à modérées (COM, AFF, EIR, SC, SE).

Afin de contrôler d’éventuelles variables de confusion, nous avons effectué plusieurs tests statistiques. Ils n’ont pas montré de différence entre les groupes non clinique et clinique concernant le sexe (Chi2 [1, 114] = 0,008, p = 0,93) et le niveau d’étude (W = 1594, p = 0,8). Mais il y avait une différence significative concernant l’âge : le groupe non clinique étant plus âgé (M = 42) que le groupe clinique (M = 33), (W = 897,5, p < 0,00). Cependant, il n’y avait pas d’effet de l’âge sur les moyennes des échelles de SCORS, excepté pour l’échelle AFF (R[111] = 0,21, p = 0,03). Pour évaluer l’importance de cet effet de l’âge sur l’échelle AFF par rapport à notre variable indépendante (le statut clinique), nous avons testé des modèles de régression multiple avec l’échelle AFF comme variable dépendante, l’âge et le statut clinique (codé comme une variable numérique : 0 et 1) comme variables indépendantes. Le modèle est significatif (F(2,110) = 2,79, p = 0,03). Le statut clinique étant contrôlé, l’âge n’a pas d’effet significatif (p = 0,33), il n’est donc pas une variable de confusion pour le résultat à cette échelle.

Tableau 2

Moyennes et écarts-types pour le groupe non clinique et clinique pour chaque échelle de SCORS

Moyennes et écarts-types pour le groupe non clinique et clinique pour chaque échelle de SCORS

Note : COM : Complexité des représentations des individus; AFF : qualité affective des représentations ; EIR : capacité d’investissement affectif dans les relations; EIM : Investissement des valeurs et des normes morales; SC : Compréhension de la causalité sociale; SE : estime de soi. p : significativité; d : de Cohen, taille d’effet.

-> See the list of tables

DISCUSSION

Notre étude confirme à nouveau la fidélité interjuge de la méthode SCORS version française.

De plus, notre hypothèse est donc validée, les échelles de SCORS permettent de différencier un groupe non clinique d’un groupe clinique, et ce, dans le sens attendu. Le groupe non clinique produit des récits TAT qui montrent une plus grande complexité des représentations des individus, une vie psychique mieux différenciée et plus complexe (échelle COM), ils expriment des représentations des relations et des autres plus positives (AFF), montre un investissement affectif dans les relations et vers les autres plus important (EIR) ainsi qu’une estime de soi plus réaliste (SE). De plus, le groupe non clinique construit des histoires plus logiques et prenant en compte la dimension psychologique (SC) et exprime une meilleure intégration des normes morales (EIM). Ces résultats sont cohérents avec ceux de la littérature (Fowler et al., 2004; Hibbard et al., 2010; Vaz et al., 2002).

Ainsi, la version française de la méthode SCORS montre des critères de validité discriminante encourageants. Dans le même mouvement, cela apporte aussi des éléments de validation de la capacité du TAT à différencier différents groupes de sujets. Cela est d’autant plus marquant que la procédure de validation que nous avons suivie tend à réduire les significations saillantes des protocoles de TAT, et cela, de plusieurs façons. D’une part, chaque récit est coté indépendamment des autres récits d’un même sujet, ainsi l’information provenant de la progression des récits d’une planche à l’autre pour un même sujet n’est pas prise en compte par la méthode SCORS. De plus, les scores sur lesquels nous nous sommes basés sont des moyennes (des deux coteurs), ce qui tend à réduire les notes extrêmes et donc à ramener vers la moyenne toutes les cotations, réduisant d’autant leur potentiel discriminateur. Enfin, la méthode SCORS elle-même, propose pour chaque échelle, en cas d’absence de la dimension évaluée (par exemple des relations ou des expressions de morale), de mettre une note type qui tend à donner une prime à l’inhibition (ainsi un récit qui n’évoque pas de dimension morale à l’échelle EIM sera côté 4 par défaut). Cela aussi tend à appauvrir la capacité discriminante des récits TAT. On peut aussi rajouter que nous n’avons coté que 5 récits par sujet, alors qu’en situation clinique réelle, une dizaine de récits semble un minimum, chacun apportant des informations spécifiques.

Malgré ces limitations, nos résultats vont dans le sens attendu, ce qui milite pour la validité discriminante de SCORS version française et, de façon plus générale, du TAT.

Cependant, d’un autre point de vue, il faut noter que nos résultats, pour significatifs ou subsignificatifs qu’ils soient, n’amènent pas de tailles d’effet importantes. Les différences sont au mieux modérées. Les raisons que nous venons d’évoquer accentuent probablement cette modération. Mais le fait que ces tailles d’effet soient modérées nous empêche de repérer des effets plus subtils, par exemple la discrimination des groupes cliniques entre eux. Comme nous l’avons vu, pour obtenir des effets significatifs, il faudrait qu’ils soient très importants et que nous ayons plus de sujets. Ces deux conditions n’étant pas remplies, nous ne pouvons donc pas tester dans cette étude, la capacité discriminante de SCORS entre les sous-groupes cliniques.

Se pose aussi la question de savoir si SCORS discrimine les groupes entre eux du fait d’une différence spécifique dans leurs modalités de relation d’objet, ou s’il les différencie parce que leur niveau global de fonctionnement diffère en raison des effets de la pathologie vs absence de pathologie. Pour trancher cette question, il faudrait mener une étude avec des sujets présentant de niveau équivalent de fonctionnement global, mais des relations d’objet différentes qualitativement. Cela donne des pistes d’approfondissement de la présente étude.

CONCLUSION

Les tests projectifs apportent des informations d’une richesse inaccessible par d’autres outils d’évaluation. Mais leur validité est souvent contestée et les méthodes utilisées en pratique par les professionnels sont trop rarement validées (en particulier en France), ce qui renforce le soupçon de la non-scientificité des tests projectifs en général. Il est donc important d’une part de tester la validité des méthodes d’interprétation des épreuves projectives, et d’autre part, d’orienter les cliniciens vers les méthodes qui ont fait la preuve de leur validité, afin de fournir à nos patients les moyens les plus sûrs de saisir leurs difficultés et de les aider au mieux. Cette étude visait essentiellement le premier objectif et elle vient compléter les éléments de validation du TAT (méthode SCORS) déjà existant. D’autres études restent à mener pour compléter solidement cette validation de la version française de la méthode SCORS.