Résumés
Résumé
Dans cet article, nous nous intéressons à l’une des sources possibles du plagiat étudiant, la recherche d’information. Nous examinons en détail l’impact de l’infrastructure informatique et informationnelle de Google ordinaire sur deux des activités cruciales que devraient mener les étudiants pour éviter le plagiat, l’exploration de la littérature scientifique et la différenciation du statut des sources. Nous posons comme hypothèse que l’accès trop simplifié aux sources d’information, conjugué à l’exposition à des sources qui ne sont pas toutes sélectives, empêche la recherche d’information de jouer son rôle dans l’appropriation des théorisations par les étudiants. Paraphraser ces dernières, c’est-à-dire les reformuler en les éclaircissant, compétence « antiplagiat » majeure, devient alors difficile. Par la suite, nous confrontons cette perspective techno-informationnelle aux autres cadres explicatifs de l’usage massif de Google ordinaire par les étudiants, en particulier celui de la « commodité ».
Mots-clés :
- Google,
- processus et activité de recherche d’information,
- étudiants,
- plagiat universitaire,
- commodité
Abstract
In this article, we consider one of the possible sources of student plagiarism, the information seeking behavior. We examine in detail the impact of ordinary Google’s informatics and information infrastructure on two of the critical activities that students should undertake to avoid plagiarism, scientific literature exploration and differentiation of the status of sources. We hypothesize that oversimplified access to information sources, combined with exposure to sources that are not all selective, prevents information research from playing its role in students’ appropriation of theorizations. Paraphrasing the latter, i.e. reformulating them by clarifying them, a major “anti-plagiarism” skill, then becomes difficult. Thereafter, we confront this techno-information perspective with other frameworks that explain the massive use of ordinary Google by students, particularly that of “convenience.”
Keywords:
- Google,
- information seeking process and behavior,
- students,
- academic plagiarism,
- convenience
Corps de l’article
Introduction
Dans cet article, nous nous arrêterons, de façon réflexive, sur une des sources supposées du plagiat universitaire chez les étudiants, la recherche d’information. Pourquoi s’intéresser à la recherche d’information lorsque l’on se penche sur le plagiat universitaire des étudiants? On pourrait considérer que le plagiat n’a aucune relation avec la recherche d’information; des textes entiers ou des extraits ont été sélectionnés à l’issue de la recherche d’information et sont, par la suite, susceptibles d’être recopiés mot à mot, référencés ou non. Autrement dit, le plagiat viendrait après la recherche d’information et ne concernerait que les phases de rédaction et de référencement. La modélisation de Peters (2015) indique qu’il n’en est rien, en mettant en avant l’interdépendance des compétences de recherche d’information, de rédaction et de référencement, et la nécessité, pour les étudiants, de disposer de ces trois compétences pour éviter de plagier. La question est alors de rendre visible les conditions dans lesquelles s’effectue le processus de recherche d’information des étudiants et dans quelle mesure celles-ci favorisent le plagiat universitaire.
Pour ce faire, nous considérerons les technomédiations informationnelles actuelles en gardant à l’esprit que celles-ci jouent avec les modes de faire des chercheurs d’information (Van Dijck, 2010). Nous commencerons par questionner les usages étudiants de Google « ordinaire »[1] Puis nous nous arrêterons sur les particularités de l’infrastructure informatique de Google, en partie héritées de l’ingénierie documentaire qui a bâti, entre autres, les catalogues de bibliothèque. Nous estimerons leurs effets sur deux activités[2], cruciales du point de vue du plagiat : l’exploration de la littérature et la différenciation du statut des sources. Notre objectif est de mettre en relation les deux dimensions, technologie et activité informationnelle, pour ne pas nous en tenir à des généralités sur la pauvreté de l’activité informationnelle des étudiants ou la puissance de Google.
Notre analyse des technomédiations informationnelles poursuit un autre objectif, celui de mettre à l’épreuve la « commodité » (convenience), l’un des principaux éclairages théoriques de l’usage étudiant de Google. Dans un second temps, nous montrerons que l’explication par la « commodité » perd de son évidence dès qu’elle est confrontée aux conditions matérielles de l’activité informationnelle, mais aussi aux conditions sociales, celles-ci présentées en dernier lieu.
1 Usage étudiant de Google ordinaire ou l’usage d’un bric-à-brac savamment organisé
Les choix des étudiants relatifs aux modes d’accès aux sources documentaires sont abondamment étudiés, et depuis une quinzaine d’années, en comparant essentiellement l’accès par l’intermédiaire du portail de la bibliothèque universitaire et par Google. Les résultats, notoires, sont immuables. Google ordinaire (comparativement à Google Scholar et son fonds largement scientifique) a été et reste le mode d’accès privilégié par les étudiants. Google, premier dans l’ordre de consultation, est de surcroît consulté sur une durée assez longue dans les sessions de recherche (Dumouchel et Karsenti, 2018). On a assisté en direct à l’intensification de l’usage de Google. Par exemple, dans leur étude longitudinale, sur une durée de cinq ans, Kennedy, Judd, Churchward, Gray et Krause (2008) ont observé l’usage croissant de Google chez les étudiants du premier cycle universitaire et constaté que le portail de la bibliothèque universitaire restait au même niveau de consultation, et assez bas. Même les étudiants les plus avancés s’appuient massivement sur Google, tout comme les étudiants futurs enseignants observés par Dumouchel et Karsenti (2018). On aurait pu penser que d’autres modes d’accès à l’information s’imposeraient, rendant l’usage de Google moins massif, par exemple, le partage de liens via les médias sociaux. Ou encore que les approches de plus en plus critiques de l’éducation à l’information, pointant les effets du modèle économique de Google sur l’organisation et la légitimité des sources proposées, auraient dérangé l’ordre de consultation des portails d’accès et favorisé un retour franc vers les catalogues des bibliothèques. Ce n’est toujours pas le cas, notablement dans le premier cycle universitaire (Komissarov et Murray, 2016; Liu, Zamir, Li et Hastings, 2018). Le faible usage de Google Scholar est également remarqué chez ces étudiants.
La préoccupation sous-jacente à la question des modes d’accès est celle de l’usage de sources savantes, scientifiques ou de vulgarisation scientifique experte. Comme Marquis, Lenel et Van Campenhoudt (2018, p. 42) l’ont fait remarquer, dans l’enseignement supérieur, « la préséance doit être donnée à la perspective scientifique et à ses critères par rapport à d’autres formes de discours ». Dans une perspective de compréhension du plagiat universitaire des étudiants, la question de l’accès aux sources savantes est donc centrale. Pour préciser en quoi l’accès aux sources savantes (comparativement aux sources ordinaires) conditionne l’absence de plagiat, il faut considérer que ne pas plagier signifie avant tout que l’on a été capable de reformuler le contenu des sources savantes. Autrement dit, il s’agit, pour les étudiants, de « travailler quelques phrases avec ses propres mots pour clarifier une idée complexe ou incorporer des informations utilisant une terminologie spécifique ou des détails provenant d’une source »[3], comme l’indique la définition générique de la paraphrase proposée par Jamieson (2016, p. 505). On qualifiera de « réussie » ce type de paraphrase[4] qui ne se contente pas de reprendre en des termes plus ou moins approchants le texte original, mais qui explicite (« clarifie ») ce qu’il convient de comprendre et de retenir du texte sélectionné. Cela suppose, pour les étudiants, de repérer les textes qui se prêtent à un tel éclaircissement. Les textes confus, ou vagues, ouverts à toutes les interprétations (à la différence des textes scientifiques, qui ne s’accordent aucune liberté dans l’interprétation et qui proposent une interprétation cadrée par les données empiriques et les théorisations antérieures) ne faciliteront ni l’appropriation des savoirs ni la reformulation de ceux-ci par les étudiants.
Or, à quelles formes de savoirs Google ordinaire donne-t-il accès? Il n’est pas aisé d’apporter une réponse à cette question de nos jours. Google n’est plus un simple bric-à-brac de sources pour la plupart ordinaires, et dont le niveau de rigueur argumentative est variable. Le bric-à-brac est désormais savamment composé et organisé. En effet, ces dernières années, on a assisté à l’hybridation de Google Web (nommé ici Google ordinaire) et ses sources rarement scientifiques, avec Google Scholar. La première page de résultats de Google ordinaire, en particulier en réponse à des requêtes portant sur des concepts scientifiques, contient désormais plusieurs liens vers des sources scientifiques ou de vulgarisation de bonne tenue. On y retrouve des extraits de livres, des extraits d’articles, les uns et les autres issus des plateformes d’éditeurs scientifiques (Cairn pour la version française du moteur), des vidéos de colloques ou de conférences, des recensions d’ouvrages. On y voit également des liens vers les sites donnant accès à des mémoires de masters voire de thèses; certains sont accessibles dans des répertoires institutionnels mais d’autres le sont dans des sites personnels, et sans indication de l’autorisation de diffusion par le jury. On trouve également des sources ordinaires, articles ou publications de sites personnels, parfois d’étudiants, etc. Au demeurant, le bric-à-brac persiste mais dans les faits, les sources savantes correspondant aux attentes des enseignants sont bien présentes. En conséquence, on pourrait penser que Google ordinaire offre aujourd’hui un bon soutien aux travaux universitaires des étudiants. Cependant, plusieurs raisons permettent d’en douter. Elles tiennent à la fois à l’infrastructure informatique de Google et aux caractéristiques du processus de recherche d’information tel que mené par les étudiants.
2 La recherche d’information des étudiants sous contrainte techno-informationnelle
2.1 Google et les catalogues de bibliothèques : une « malfaçon » originelle commune, une entrave à l’exploration de la littérature?
La première question que soulève l’usage de Google ordinaire par les étudiants se rapporte à son infrastructure informatique, que l’entreprise (Alphabet aujourd’hui) a empruntée aux travaux en ingénierie documentaire (information retrieval), comme tous les concepteurs de moteurs de recherche du Web d’alors. Si Google a su tirer parti de la structure des liens dans le Web, mieux que ne l’ont fait ses concurrents (Levy, 2011, p. 20), plusieurs de ses principes s’inspirent de ceux de l’information retrieval. Warner (2010) évoque ce transfert en parlant d’« héritage » et Chiaramella et Mulhem (2007), d’« adaptation directe des modèles de recherche les plus classiques à cet environnement particulier [le web] ». Point rarement soulevé, la puissance de façonnage de Google sur le déroulement de l’activité de recherche d’information ne tient pas seulement aux algorithmes qui définissent la hiérarchisation des liens sous forme de rangs de classement[5]. Elle tient aussi à son infrastructure informatique, propre au « retrouvage[6] », originellement pensée dans le domaine universitaire à l’orée des années cinquante; dans ce domaine, on y a élaboré les premiers systèmes d’information informatisés comme les catalogues des bibliothèques ou les bases de données scientifiques et techniques. De ce point de vue, Google et les catalogues de bibliothèques ne diffèrent pas fondamentalement. Cette infrastructure informatique fait aujourd’hui l’objet de fortes critiques. Elle est vue comme un frein à l’autonomisation des chercheurs d’information, les privant du contrôle de leur activité informationnelle et ne leur permettant pas de développer les capacités informationnelles (Warner, 2010). Ces systèmes qui exigent de leurs usagers de formuler et reformuler des requêtes mettent en difficulté nombre de leurs usagers, ceux qui n’ont pas ou peu de connaissances sur leurs sujets de recherche, comme les étudiants. Leurs requêtes sont conceptuellement pauvres (peu de mots-clés) et leurs reformulations rares (peu de termes associés, peu de transformations de requêtes) (Boubée et Tricot, 2010; Case et Given, 2016). Une série de dispositifs d’assistance est venue compléter l’infrastructure, comme la proposition de mots-clés associés (voir les travaux fondateurs de Belkin (1980) pensant la communication usager/système). Plus fondamentalement, la critique porte sur l’objectif choisi par les premiers concepteurs de ces systèmes : épargner tout effort à l’usager (Boubée, 2018); cet objectif n’était pas le bon, du moins il était diamétralement opposé à celui d’autonomisation des usagers promu par les chercheurs en sciences de l’information, et à leurs côtés les bibliothécaires (Kerssens, 2017). De ce point de vue, on peut parler de malfaçon dès ces premiers travaux originels en ingénierie documentaire.
Pour mieux comprendre la critique, il faut disposer d’une vue schématique sur le processus informationnel et repérer ce que font les technomédiations informationnelles actuelles à l’une des phases essentielles de ce processus, celle usuellement désignée par « définir son problème informationnel », comme intitulée dans la modélisation canonique de Marchionini (1997). Cette modélisation reste l’une des plus intéressantes pour discuter des effets des technologies actuelles sur l’activité informationnelle. D’une part, elle détaille une huitaine de sous-processus impliqués et arrive à restituer les niveaux de complexité que peut (devrait) atteindre la recherche d’information, en signalant les itérations et les réitérations les plus probables entre les phases du processus. D’autre part, elle suggère qu’il s’agit de tirer profit des possibilités offertes à chaque phase pour développer la compréhension de son problème de recherche d’information et en retour optimiser les actions des autres phases (Savolainen, 2018). Le processus informationnel débute par la reconnaissance d’un problème d’information et se termine lorsque le problème est résolu ou abandonné; il faut passer la première phase de reconnaissance du problème (1), et nombre de facteurs interviennent dans la décision de s’engager dans une recherche d’information : aspect organisationnel, acceptabilité sociale du thème de recherche, difficulté perçue de la tâche, etc. Dans la phase suivante (2), il s’agit de comprendre ce que l’on cherche, de « définir son problème informationnel ». La phase 3 est celle des choix des systèmes d’information, répertoires, genre de documents, etc., tout ce qui sert à accéder aux sources d’information. Les phases 4 et 5 sont les moments d’interaction avec les systèmes choisis (phases de « searching »), formulations de requêtes, explorations des fonctionnalités des systèmes, navigations, etc. Les phases 6 et 7 réfèrent à l’évaluation de la pertinence et à la sélection des sources d’information. Enfin, la phase 8 est celle du retour réflexif qui conduit à poursuivre (réitérer certaines phases) ou à mettre fin à la recherche. Il y a néanmoins une phase cruciale, la phase 2 (définir son problème informationnel), la seule à « rester active tant que la recherche d’information progresse » (Savolainen, 2018); c’est aussi la seule à être en connexion avec toutes les autres phases. En d’autres termes, tout doit concourir à maintenir active cette phase pour que l’exploration du problème d’information soit effective. Selon nous, c’est précisément ce que les systèmes d’information que nous venons de décrire ne permettent pas ou permettent peu de maintenir, et Google ordinaire bien moins que les catalogues des bibliothèques pour les raisons que nous détaillons infra.
2.2 Déléguer l’évaluation de la sélectivité des sources à Google ordinaire versus différencier le statut des sources
S’arrête ici la ressemblance entre ces systèmes d’information. Une différence majeure distingue en effet Google et les catalogues de bibliothèques. Elle est centrale pour saisir la contrainte que fait peser Google ordinaire sur le processus informationnel des étudiants. Au sein des bibliothèques, un bon système d’information est un système qui restitue plusieurs documents et des documents sémantiquement cohérents. La cohérence est assurée par l’indexation des documents réalisée à l’aide de langages documentaires spécifiques qui permettent d’établir des liens sémantiques entre termes représentant le contenu des documents, et bien entendu par la nature de leurs fonds (savants). Pour Google, un bon système est un système qui fournit « le meilleur document ». In fine, le but est que l’usager estime positivement non seulement les documents qu’il lui soumet mais, avant tout, le système lui-même, Google. C’est bien connu, la stratégie est efficace. Hargittai, Fullerton, Menchen-Trevino et Thomas (2010) indiquent que la confiance dans les moteurs de recherche est si élevée que les étudiants (en 1re année) n’éprouvent pas le besoin d’évaluer les documents auxquels ils accèdent via les moteurs. C’est particulièrement effectif pour Google qui bénéficie de plus de confiance que Yahoo, chez les étudiants observés; il y aurait un effet « marques » dans la recherche d’information. L’explication renvoie à Google comme objet de consommation et à l’incapacité des étudiants à prendre une distance critique vis-à-vis de ce qui est institué en objet de consommation. On retrouve ici la particularité de l’attribution de confiance dans les médias traditionnels. On sait depuis les premiers travaux sur les médias télévisuels que la primauté est accordée au canal sur la source ou le contenu du message, ceci aboutissant à la confusion entre canal et sources (après les travaux de Chaffe sur la télévision, voir Metzger, Flanagin, Eyal, Lemus et Mccann, 2003). On peut penser que le même phénomène se produit avec les moteurs de recherche et qu’il favorise grandement la stratégie de Google de passer pour un bon système d’information, celui qui fournit une poignée de bons documents dès la première page de la liste. La puissance de ce jugement global de confiance envers Google agit fortement, y compris chez les étudiants qui ont une bonne connaissance de leur sujet de recherche. C’est ce que montrent Unkel et Haas (2017) qui ont fabriqué une liste de résultats et étudié les critères qui président au choix des sources, le rang de classement ou l’un des trois critères de crédibilité testés (réputation de la source, objectivité du message, recommandations [nombre ajouté à côté de chaque lien]). Le rang de classement a généralement primé, même pour les étudiants ayant des connaissances sur le thème de recherche. On le voit, les étudiants délèguent le travail d’évaluation de la sélectivité des sources à Google.
Si nous reprenons l’hypothèse que nous soutenons ici – une des sources potentielles du plagiat réside dans le manque d’exploration de la littérature savante –, on comprend qu’un portail d’accès comme Google ordinaire, qui incite à minimiser l’effort d’exploration, et qui offre des sources sans véritable cohérence sémantique, n’offre que peu de possibilités de participer à l’appropriation des théorisations, base d’une restitution non plagiée des sources. En effet, comme signalé précédemment, la production écrite sans plagiat oblige à reformuler en explicitant les idées de la source originale. Ainsi que théorisé en sciences du langage, « l’énoncé reformulateur est plus long que l’énoncé source […] [on le définit] comme l’apport d’éléments supplémentaires » (Roquelaure et Garcia-Debanc, 2015). Sans appropriation, ce type de reformulation, qui suppose un développement, est compromis. Or, l’appropriation ne peut apparaître qu’avec une réinterprétation constante de la littérature pertinente, dans une démarche de type herméneutique que seule une recherche d’information exploratoire et approfondie autorise (Hjørland, 2015). On retrouve la pertinence, pour comprendre comment se forme l’action, de la prise en compte des « circonstances matérielles et sociales » mises en avant par Suchman (2007) dans sa théorie de l’action située. Dans le contexte actuel de médiations informationnelles dont le design est sous l’emprise des industries de l’accès et du contenu, les « circonstances » se muent en contraintes susceptibles de faire obstacle au processus de recherche d’information et, en conséquence, au travail d’appropriation et de reformulation des contenus savants.
On pourrait continuer à objecter que l’hybridation de Google « ordinaire » avec « Google Scholar » augmente la probabilité que les étudiants fassent usage des sources savantes. En conséquence, la délégation de l’évaluation de la sélectivité des sources serait moins préjudiciable aujourd’hui et l’une des sources du plagiat ne serait plus à situer dans la recherche d’information. Cependant, la délégation de l’évaluation de la sélectivité des sources à Google « ordinaire » demeure à bien des égards problématique. Par « évaluation de la sélectivité des sources », nous entendons la capacité à différencier le statut des sources, à repérer les sources les plus sélectives (du point de vue de leur nature savante). La notion est plus intéressante que celle d’évaluation et sélection des sources puisqu’il ne s’agit pas tant de savoir quels critères de pertinence les étudiants appliquent aux sources que de déterminer quels types de sources ceux-ci sélectionnent couramment au sein de Google ordinaire. Georgas (2015), qui a comparé chez des étudiants en premier cycle la qualité (savante) des livres et articles retrouvés avec Google ou avec le catalogue de la bibliothèque universitaire, établit un double constat. La qualité des sources retrouvées avec Google et avec le catalogue est peu ou prou semblable, légèrement supérieure pour les livres repérés via Google et, inversement, légèrement supérieure pour les articles repérés via le catalogue. Georgas (2015) note néanmoins la qualité bien moindre des sources choisies librement par les étudiants (comparativement au format de sources imposé par la chercheuse, livres et articles scientifiques); en ne considérant que les sources sélectionnées sans contrainte de format, l’« écart de qualité » entre Google et le catalogue est plus important puisque le nombre de sources savantes sélectionné est bien moindre avec Google. Est également remarquée la conception très large de ce qu’est un article pour les étudiants. Par article, les étudiants n’entendent pas seulement article scientifique, mais aussi article journalistique, article d’encyclopédie, recension d’ouvrage, pages ou publications dans des sites divers, sites d’université, personnels ou commerciaux. Et, comme déjà remarqué (p. ex. par Jones et Allen, 2012), les étudiants expriment leur difficulté de lecture devant le haut niveau de complexité des articles scientifiques, ce qui les conduit à avoir recours aux articles non scientifiques, en quelque sorte de « seconde main », moins précis, avec un risque de distorsion des théorisations. Suivant la distinction entre autorités proposée par Domenget et Segault (2017), on peut avancer que les étudiants, en particulier au premier cycle, se contentent de sources référant à l’autorité de contenu renforcée par l’autorité calculée (algorithmique)[7]. De ce point de vue, Google ordinaire fournit plutôt bien l’assistance attendue par les étudiants. Ceux-ci y retrouvent les contenus de tous types, apparaissant dans une page de résultats ayant une coloration savante, et issus d’un moteur perçu comme fiable. Ce faisant, les étudiants retardent le moment d’entrer dans la conversation scientifique, pour reprendre la formulation du nouveau référentiel listant les « compétences informationnelles en enseignement supérieur » (Association of College and Research Libraries [ACRL], 2016). Participer à la conversation scientifique suppose « de faire des efforts pour évaluer et soupeser les différentes positions à un problème » (Hofer et Pintrich, 1997, cités par Rosman, Peter, Mayer et Krampen, 2018). Ne pas pouvoir s’y engager comporte le risque pour les étudiants d’être dans l’incapacité de produire une explicitation écrite personnelle, non copiée-collée, celle qui rend manifeste l’appréhension critique des théorisations qui est attendue par leurs enseignants (Marquis et al., 2018).
3 L’éclairage théorique de la « commodité »
Parmi les interprétations avancées pour analyser les usages informationnels étudiants de Google ordinaire, le recours à la notion de commodité (convenience) domine. La commodité est également citée comme un des déterminants de la pratique de copier-coller des étudiants (p. ex. les technologies citées comme « outil commode et facilement accessible » par Nilsson, 2016). La « commodité » connaît deux variantes. La première se rapporte aux théorisations de la rationalité limitée, la deuxième à l’aliénation provoquée par les technologies, privant les usagers du contrôle de leurs actions. La rationalité limitée issue des théorisations en psychologie et en sciences économiques est devenue transversale au sein des sciences humaines et sociales. Il n’est donc pas étonnant de la retrouver dans les travaux qui s’intéressent aux pratiques informationnelles. Elle postule, dans sa dimension instrumentale, une forme de raisonnement qui « conduit […] à adopter des représentations incomplètes et même imparfaites de son environnement » et à « se contenter d’actions minimales » (Berthelot, 2012, p. 244). L’article qui a fortement popularisé le rapprochement entre recherche d’information et commodité dans son acception psychologique est celui de Connaway, Dickey et Radford (2011). La commodité y est théorisée, pour la première fois dans le domaine, en prenant appui explicitement sur la théorie de la rationalité limitée. Partant d’un dispositif méthodologique conséquent (enquête quantitative et qualitative, sur 3 ans, auprès d’étudiants et de professeurs [1 500 répondants au questionnaire, 78 entretiens]) les auteurs constatent i) que le critère « commodité » supplante tous les autres critères (« les chercheurs d’information sacrifieront le contenu pour des raisons de commodité », autrement dit, ils s’en tiennent à l’information qui est à portée de main, immédiatement accessible), ii) que la commodité est un facteur qui joue quels que soient l’âge, le genre, la position universitaire (étudiant ou professeur), le fait d’utiliser ou pas les services en ligne de bibliothèque, enfin iii) que ce facteur se retrouve dans tous les contextes (recherches d’information universitaires ou personnelles). L’article a été par la suite régulièrement cité et la commodité est périodiquement maintenue comme principal facteur explicatif, entre autres, de l’usage de Google (p. ex. chez Komissarov et Murray, 2016). La commodité connaît une variante, nettement critique vis-à-vis des technologies. Par exemple, Wu (2018) invoque « [n]otre goût pour la commodité [qui] en engendre toujours plus […] », convoque la force de l’habitude, sciemment entretenue par les industries actuelles : « plus il est facile d’utiliser Amazon et plus Amazon devient puissant ». Malgré l’accent mis sur la manipulation des technologies commerciales des raisonnements et comportements, ce dernier cadrage théorique de la commodité mise toujours sur une cognition humaine faillible dont tireraient profit les « technologies de la commodité », pour reprendre l’expression de Wu (2018).
Les perspectives critiques sur les industries de l’accès et du contenu sont considérablement nombreuses de nos jours, notablement au sein des sciences de la communication. Elles ne reprennent pas l’idée de commodité, voire la rejettent comme étant peu explicative. C’est le cas de Van Dijck, l’une des premières à avoir proposé une analyse critique des stratégies des plateformes commerciales (Van Dijck, 2013). Ce n’est pas la commodité qui est « l’ennemie de la science », mais la « naïveté et l’ignorance », avance Van Dijck (2010) à propos des usages étudiants de Google et Google Scholar; elle insiste sur l’obstacle majeur que constitue l’ignorance des « implications des outils pratiques, mais aussi boîte noire, [qui] conduit inévitablement à un plus grand contrôle par les propriétaires des technologies de recherche d’information sur la production de connaissances ». Elle conclut sur l’importance pour les étudiants de disposer de connaissances approfondies (sociales, économiques, juridiques), des « outils qui les aident à construire leur connaissance ». La discussion n’est, en effet, pas seulement théorique (infrastructure de Google ou commodité dans toutes ses acceptions), elle est aussi éducative et renvoie à la plus ou moins grande capacité des conceptualisations à être traduites en dispositifs de formation. La notion de commodité, qui peut paraître séduisante comme piste explicative, se révèle difficile à intégrer dans un cadre éducatif et peut vite conduire à des sortes de leçons de morales inappropriées (développer le goût de l’effort, par exemple) et inefficaces.
D’autres perspectives théoriques bousculent les approches par la commodité ou s’en écartent considérablement. S’intéresser aux déterminismes sociaux, à la différenciation sociale à l’oeuvre dans les pratiques informationnelles atténue fortement l’idée à laquelle conduisent les approches centrées sur la cognition d’un raisonnement (faillible) commun à tous et toutes. Par exemple, le lien est établi entre niveau d’études des parents et capacité des étudiants à évaluer l’information et à tenir un discours critique sur les moteurs de recherche commerciaux dans l’étude d’Hargittai et al. (2010), précédemment citée; le manque de persistance dans la recherche d’information, d’exploration, est patent dans la recherche d’information de probables futurs étudiants (lycéens de 16 à 18 ans) issus des classes sociales défavorisées. La recherche d’information des jeunes issus de classes favorisées présente les traits inverses et ces derniers ne « comptent » pas seulement sur Google comme le font les jeunes plus défavorisés (Davies, 2018). Ce type de travaux est représentatif du retour de la prise en compte des déterminations sociales au sein des études sur les pratiques numériques, un temps éclipsées par la vision d’un Internet grâce auquel il serait possible d’échapper aux limitations sociales.
Conclusion
Dans cet article, nous avons cherché à saisir les liens entre recherche d’information des étudiants et plagiat universitaire, en donnant à voir la dimension matérielle de l’activité informationnelle. Cela supposait de mettre au jour les contraintes que Google en tant que technomédiation informationnelle exerce sur les modes de faire des étudiants. Ces contraintes sont de deux ordres : entrave au déroulement complet de la recherche d’information, et renforcement de la croyance en la fiabilité, voire la responsabilité épistémique de Google. Tout concourt à desservir l’exploration de la littérature et à conduire les étudiants à déléguer l’évaluation de la sélectivité des sources à Google. Selon nous, ce sont deux points d’ancrage potentiels du plagiat des étudiants.
Certes, il y a d’autres contraintes, cognitives et sociales, et façons de les penser. La « commodité » jette un éclairage sur les contraintes cognitives, partant de nos supposées failles cognitives. Elle est plus ou moins aveugle à la puissance de la structure matérielle qui contraint l’activité. Sa portée est également réduite par les approches qui se préoccupent du contexte social, en termes de détermination. Le penchant pour la facilité n’offre qu’un argument faible pour expliquer le plagiat des étudiants. La machinerie de la recherche d’information est paradoxalement devenue plus complexe avec Google ordinaire et les réponses pédagogiques au problème du plagiat étudiant devraient être réorientées vers une meilleure prise en compte de ces contraintes matérielles.
Il resterait cependant à mettre en regard la question des « contraintes » et celle des « possibilités » pour ne pas en rester à une position déterministe, qui n’est plus guère soutenue. L’analyse des contraintes matérielles ne doit pas faire perdre de vue la dialectique de l’action : être agi n’exclut pas d’agir. Nous évoquerons donc un dernier outillage théorique, esquissé dans notre développement, celui de l’activité ou action située, ou encore action pragmatique, qui considère l’action en train de se faire. Les conceptualisations y sont positionnées dans un entre-deux théorique, sociologique et psychologique; elles ont aussi l’avantage d’être très attentives à la matérialité de l’action. En concevant l’existence de dynamiques exploratoires, même malhabiles (Auray, 2016), elles permettent d’envisager avec optimisme la possibilité de renforcer l’efficacité des dispositifs pédagogiques « antiplagiat ».
Parties annexes
Notes
-
[1]
Nous utilisons le terme « Google ordinaire » suivant quelques auteurs (par exemple Georgas, citée supra). Nous reconnaissons plusieurs atouts à cette expression. Elle établit la distinction avec Google Scholar mieux que ne le font les termes « Google généraliste » (ou « Google Web ») en faisant référence aux notions de quotidien, d’habituel, voire d’habitude, mais aussi à la partition entre « ordinaire » et « savant » concernant les théories (voir par exemple Pedler et Cheyronnaud, 2013).
-
[2]
Nous utilisons à la fois les notions d’» activité » et de « processus ». Nous employons « processus » lorsque nous évoquons l’une des modélisations du processus de recherche d’information. Le processus informationnel est décrit de façon usuelle comme une série d’actions matérielles et cognitives assemblées en « phases ». Il faut aller plus loin : le processus n’est pas d’un seul tenant, figé; il se construit de façon singulière. La notion d’» activité » est très proche de cette conception, dans le sens que lui accorde depuis presque 40 ans la psychologie ergonomique, dans le sillage des approches situées anglo-saxonnes (voir Boubée et Tricot, 2010, p. 153-168). Nous pourrons ainsi être amenée à utiliser « activité » à la place de « phase », en référence à ces théorisations.
-
[3]
Les extraits d’ouvrages en anglais, entre guillemets, sont des traductions effectuées par l’auteur du présent article [note de l’éditeur].
-
[4]
Jamieson (2016) relate l’histoire de l’enseignement de l’écriture universitaire articulant plusieurs sources; elle y recense les appréciations divergentes sur la forme que devrait prendre un « emprunt de texte » et insiste sur les définitions peu consensuelles de ce qu’est une paraphrase « ratée » ou encore sur la qualification de plagiat intentionnel. Au préalable, elle propose une définition que nous avons qualifiée de « générique ». Ce qui nous importe, ici, est qu’elle saisit remarquablement la paraphrase comme « clarification ».
-
[5]
Un autre « héritage universitaire » venant, lui, des travaux en scientométrie (Ertzscheid, Gallezot et Boutin, 2009).
-
[6]
Par « ingénierie documentaire », nous traduisons, imparfaitement, « information retrieval » (« retrouvage » de l’information). Mot-clé (uniterme), fichiers inverses, modèles booléen, vectoriel, probabiliste, etc., ont vu le jour au sein de l’information retrieval. À l’arrivée du Web, les travaux étaient déjà bien développés (voir l’histoire du domaine par Chiaramella et Mulhem, 2007). Voir également les trois sous-fonctions d’un moteur de recherche listées par F. Bourdoncle (2008) concepteur d’Exalea : « rapatriement des pages à collecter sur Internet, leur indexation [et consultation de l’index], et le calcul et la présentation des réponses aux questions ». C’est la deuxième fonction que nous évoquons ici (l’indexation et la consultation de l’index).
-
[7]
Dans l’article que nous citons, les auteurs décrivent quatre autorités : énonciative (figure de l’auteur), institutionnelle, de contenu et calculée, qu’ils appliquent au contexte de Twitter et dans le cadre d’une étude de communication organisationnelle. Malgré la spécificité de ce contexte, la partition fine des autorités présente un intérêt pour d’autres contextes.
Références
- Association of College and Research Libraries (ACRL). (2016). Référentiel de compétences informationnelles en enseignement supérieur (F. Parenteau, trad.; È-L. Rondeau, coord.). Groupe de travail de la Promotion du développement des compétences informationnelles (GT-PDCI) du réseau de l’Université du Québec (ouvrage orginal paru en 2015 sous le titre Framework for Information Literacy for Higher Education). Récupéré du site du PDCI : http://ptc.uquebec.ca/pdci
- Auray, N. (2016). L’alerte ou l’enquête : une sociologie pragmatique du numérique. Paris, France : Presses des Mines.
- Belkin, N. J. (1980). Anomalous states of knowledge as a basis for information retrieval. Canadian Journal of Information Science, 5, 133-143. Récupéré du site de la School of Communication and Information, Rutgers University : http://tefkos.comminfo.rutgers.edu
- Berthelot, J. M. (2012). Les sciences du social. Dans J. M. Berthelot (dir.), Épistémologie des sciences sociales (p. 203-268). Paris : Presses Universitaires de France.
- Boubée, N. (2018). Épistémologie des concepts de jugements de pertinence et de jugements de « crédibilité web ». Les cahiers du numérique, 14(2), 113-138.
- Boubée, N. et Tricot, A. (2010). Qu’est-ce que rechercher l’information? Villeurbanne, France : ENSSIB.
- Bourdoncle, F. (2008, 14 mars). Les moteurs de recherches, technologie et enjeux [vidéo]. Récupéré du site du Collège de France : http://college-de-france.fr
- Case, D. et Given, L. (2016). Looking for information: A survey of research on information seeking, needs, and behavior. Bingley, R.-U. : Emerald.
- Chiaramella, Y. et Mulhem, P. (2007). La recherche d’information : de la documentation automatique à la recherche d’information en contexte. Document numérique, 10(1), 11-38. Récupéré de http://cairn.info/revue-document-numerique.htm
- Connaway, L. S., Dickey, T. J. et Radford, M. L. (2011). “If it is too inconvenient I’m not going after it:” Convenience as a critical factor in information-seeking behaviors. Library and Information Science Research, 33(3), 179-190. doi:10.1016/j.lisr.2010.12.002 Récupéré du site CiteSeerX : http://citeseerx.ist.psu.edu
- Davies, H. C. (2018). Learning to Google: Understanding classed and gendered practices when young people use the Internet for research. New Media & Society, 20(8), 2764-2780. doi:10.1177/1461444817732326 Manuscrit récupéré du répertoire ORA de l’Université d’Oxford : http://ora.ox.ac.uk
- Domenget, J. C. et Segault, A. (2017). Une pratique collective de fabrication de l’autorité. Quaderni, 2017/2(93), 85-97.
- Dumouchel, G. et Karsenti, T. (2018). Mon ami Google : une étude des pratiques des futurs enseignants du Québec en recherche d’information. La revue canadienne de l’apprentissage et de la technologie, 43(2). https://doi.org/10.21432/T2P09M
- Ertzscheid, O., Gallezot, G. et Boutin, E. (2009). PageRank : entre sérendipité et logique marchande. Dans B. Simonnot et G. Gallezot (dir.), L’entonnoir : Google sous la loupe des sciences de l’information et de la communication (p. 113-136). Paris, France : C&F.
- Georgas, H. (2015). Google vs. the library (part III): Assessing the quality of sources found by undergraduates. portal: Libraries and the Academy, 15(1), 133-161. Récupéré du répertoire CUNY Academic Works : http://academicworks.cuny.edu
- Hargittai, E., Fullerton, L., Menchen-Trevino, E. et Thomas, K. Y. (2010). Trust online: Young adults’ evaluation of web content. International Journal of Communication, 4, 468-494. Récupéré de http://ijoc.org
- Hjørland, B. (2015). Classical databases and knowledge organization: A case for boolean retrieval and human decision-making during searches. Journal of the Association for Information Science and Technology, 66(8), 1559-1575. Manuscrit récupéré du profil de l’auteur sur ResearchGate : http://researchgate.net/profile/Birger_Hjorland
- Jamieson, S. (2016). Is it plagiarism or patchwriting? Toward a nuanced definition. Dans T. Bretag (dir.), Handbook of academic integrity (p. 503-518), Singapour : Springer. doi:10.1007/978-981-287-098-8_68
- Jones, S. et Allen, J. (2012). Evaluating psychology students’ library skills and experiences. Psychology Teaching Review, 18(2), 94-115. Récupéré du site ERIC : http://eric.ed.gov
- Kennedy, G. E., Judd, T. S., Churchward, A., Gray, K. et Krause, K.-L. (2008). First year students’ experiences with technology: Are they really digital natives? Australasian Journal of Educational Technology, 24(1), 108-122. Récupéré de http://ajet.org.au
- Kerssens, N. (2017). When search engines stopped being human: Menu interfaces and the rise of the ideological nature of algorithmic search. Internet Histories, 1(3), 219-237. https://doi.org/10.1080/24701475.2017.1337666
- Komissarov, S. et Murray, J. (2016). Factors that influence undergraduate information-seeking behavior and opportunities for student success. The Journal of Academic Librarianship, 42(4), 423-429. doi:10.1016/j.acalib.2016.04.007
- Levy, S. (2011). In the plex: How Google thinks, works, and shapes our lives. New York, É.-U. : Simon & Schuster.
- Liu, J., Zamir, H., Li, Y. et Hastings, S. K. (2018). Search systems and their features: What college students use to find and save information. Library & Information Science Research, 40(2), 118-124. doi:10.1016/j.lisr.2018.06.002
- Marchionini, G. (1997). Information seeking in electronic environments (Cambridge Series on Human-Computer Interaction, n° 9). Cambridge, R.-U. : Cambridge University Press.
- Marquis, N., Lenel, E. et Van Campenhoudt, L. (2018). Pratique de la lecture critique en sciences humaines et sociales. Paris, France : Dunod.
- Metzger, M. J., Flanagin, A. J., Eyal, K., Lemus, D. R. et McCann, R. M. (2003). Credibility for the 21st century: Integrating perspectives on source, message, and media credibility in the contemporary media environment. Dans P. J. Kalbfleisch (dir.), Communication Yearbook 27 (p. 293-335), New York, É.-U. : Routledge. doi:10.4324/9781410607737
- Nilsson, L.-E. (2016). Technology as a double-edged sword: A promise yet to be fulfilled or a vehicle for cheating? Dans T. Bretag (dir.), Handbook of academic integrity (p. 607-623). Singapour : Springer.
- Pedler, E. et Cheyronnaud, J. (dir.) (2013). Théories ordinaires. Paris, France : École des hautes études en sciences sociales.
- Peters, M. (2015). Enseigner les stratégies de créacollage numérique pour éviter le plagiat au secondaire. Revue canadienne d’éducation, 38(3). Récupéré de http://journals.sfu.ca/cje
- Roquelaure, M.-F. et Garcia-Debanc, C. (2015). Les reformulations comportant des exemples dans les cours magistraux de l’enseignement supérieur. Corela, 2015(HS-18). Récupéré de http://journals.openedition.org/corela
- Rosman, T., Peter, J., Mayer, A.-K. et Krampen, G. (2018). Conceptions of scientific knowledge influence learning of academic skills: Epistemic beliefs and the efficacy of information literacy instruction. Studies in Higher Education, 43(1), 96-113. doi:10.1080/03075079.2016.1156666 Manuscrit récupéré du site Public Open Science Institute for Psychology (ZPID). http://leibniz-psychology.org
- Savolainen, R. (2018). Pioneering models for information interaction in the context of information seeking and retrieval. Journal of Documentation, 64(5), 966-986. https://doi.org/10.1108/JD-11-2017-0154
- Suchman, L. A. (2007). Human-machine reconfigurations: Plans and situated actions. New-York, É.-U. : Cambridge University Press.
- Unkel, J. et Haas, A. (2017). The effects of credibility cues on the selection of search engine results. Journal of the Association for Information Science and Technology, 68(8), 1850-1862. doi:10.1002/asi.23820
- Van Dijck, J. (2010). Search engines and the production of academic knowledge. International Journal of Cultural Studies, 13(6), 574-592. https://doi.org/10.1177/1367877910376582
- Van Dijck, J. (2013). The culture of connectivity: A critical history of social media. Oxford, R.-U. : Oxford University Press.
- Warner, J. (2010). Human information retrieval. Cambridge, É.-U. : MIT Press.
- Wu, T. (2018, 16 février). The tyranny of convenience. The New York Times. Récupéré de http://nytimes.com