Mesure et évaluation en éducation
Volume 24, numéro 2-3, 2001
Sommaire (4 articles)
-
Détection des biais d’items et de personnes en testing adaptatif
Richard Bertrand
p. 1–22
RésuméFR :
Si le testing adaptatif par ordinateur (TAO) possède des avantages reconnus depuis plusieurs décennies, il recèle également quelques inconvénients. Par exemple, tel que l’a déjà souligné Wainer (2000, p. xxiii), il ne serait pas très approprié d’utiliser la stratégie du TAO pour les tests à enjeux critiques (high stake tests) comme les examens. De même, puisque le nombre d’items des tests administrés selon la stratégie du TAO est limité, il est impératif de relever et, au besoin, d’éliminer les items comportant un fonctionnement différentiel (FDI). Cet article propose une procédure pour découvrir les items comportant un FDI dans le contexte spécifique du TAO. Une méthode pour distinguer les patrons de réponses atypiques dans le contexte du TAO est aussi suggérée.
EN :
Computerized adaptative testing (CAT) still have a host of advantages but also some drawbacks. For example, as Wainer (2000, p. xxiii) stated, high stake tests like exams are not good candidates for computerized tests. Also, as the number of items is limited in CAT, the process of detecting biased (DIF) items is vital. This paper suggests a DIF method specially aimed at identifying biased items in a CAT context. A person-fit index for adaptive testing will also be proposed.
-
Étude de la distribution d’échantillonnage de l’estimateur du niveau d’habileté en testing adaptatif en fonction de deux règles d’arrêt dans le contexte de l’application du modèle de Rasch
Gilles Raîche et Jean-Guy Blais
p. 23–39
RésuméFR :
Cet article s’intéresse à l’application des modélisations issues de la théorie de la réponse à l’item au testing adaptatif par ordinateur. Plus spécifiquement, il s’intéresse à l’impact de la variation des critères retenus pour la règle d’arrêt sur la distribution de probabilité de certaines statistiques associées à la distribution d’échantillonnage de l’estimateur du niveau d’habileté en testing adaptatif. Les règles d’arrêt considérées sont de deux types : selon l’erreur-type de l’estimateur du niveau d’habileté et selon le nombre d’items administrés.
EN :
This article presents results concerning the application to adaptive testing of modelisations coming from item response theory. More specifically, interests are on the impact of the variation of the criterias retained for the stopping rules on the probability distribution of certain statistics associated with the sampling distribution of the proficiency estimate in adaptive testing. Stopping rules considered are of two kinds: according to the standard error of the proficiency estimate and according to the number of administered items.
-
À la recherche de l’« unité de mesure » en psychométrie : réflexions sur la mesure en sciences humaines
Louis Laurencelle et Jim O. Ramsay
p. 41–52
RésuméFR :
La mesure en sciences humaines, bien que largement répandue et pratiquée, a mauvaise presse chez les théoriciens et fait souvent figure d’enfant pauvre à côté de la mesure instrumentale qu’on retrouve dans les sciences physiques et biologiques. Les auteurs reprennent le débat, en reformulant la question et en revoyant les concepts de mesure, unité de mesure, étalon, grandeur et échelle. Ils posent quelques balises qui permettent de juger, sans passion ni préconception, la légitimité des mesures, que ce soit pour des tests psychométriques, des examens scolaires ou d’autres types d’indices socioculturels. La perspective générale, bien que critique, reste favorable et optimiste.
EN :
Measurement in the social sciences is widespread in our society, but it has a poor reputation compared with its siblings, instrumental measures in the physical and life sciences. The authors take up again the debate, in re-editing the question and scrutinizing the notions of measurement and measure, measurement unit, standard, measure and scale. They put up some landmarks by which one may decide upon the legitimacy of a measurement context, whether for psychometric tests, academic performance, or other types of socio-cultural measures. Though cautious, the outlook is rather positive and optimistic.
-
L’évaluation de la qualité des systèmes de formation
François-Marie Gerard
p. 53–77
RésuméFR :
L’évaluation de la qualité des systèmes de formation, qu’ils soient éducatifs ou professionnels, nécessite de prendre en compte des critères d’ordre économique (l’efficacité et l’efficience) et d’ordre social (l’équité), mais aussi d’ordre pédagogique (l’équilibre, conçu comme étant la capacité du système à développer de manière harmonieuse tous les types d’objectifs liés au savoir) et d’ordre conatif (l’engagement, conçu comme étant la capacité du système à développer auprès des apprenants un réel engagement en vue d’apprendre ou d’agir).
EN :
The assessment of the quality of training systems, whether we talk about education or vocational training, requires to consider criteria of economic nature (effectiveness and efficiency) and of social nature (equity), but also of pedagogical nature (balance, considered as the ability of the system to develop in a harmonious way all the different objectives linked to knowledge), of conative nature (engagement, considered as the ability of the system to develop with the learner a real engagement in order to learn and/or to act).