Corps de l’article

La sociologie filmique s’inscrit dans une longue tradition de l’utilisation des images (fixes ou animées) en ethnologie, en anthropologie, puis en sociologie et dans les sciences humaines en général (histoire, géographie, ergonomie, psychologie)[1]. C’est une longue maturation dont on présentera quelques éléments choisis. La sociologie filmique, quant à elle, s’est développée pas à pas à l’Université d’Évry Paris-Saclay à partir de 1997 avec la création d’un master en sociologie intitulé Image et société jusqu’à ce que des thèses soient soutenues qui font dialoguer un documentaire sociologique réalisé par le doctorant ou la doctorante avec leur réflexion épistémologique. La sociologie filmique appartient au domaine de la sociologie visuelle, mais nous ajoutons bien souvent « et filmique » pour affirmer une position : le mouvement et le son de la vidéo complètent l’image fixe qu’est la photographie. L’International Visual Sociology Association (IVSA) inclut la sociologie filmique dans son champ (Conférence de l’IVSA à Évry, 2018). Par ailleurs, la sociologie filmique n’a pas pour objet le commentaire ou l’analyse des films existants, mais la réalisation des films documentaires par des sociologues, avec ou sans l’aide de professionnels du cinéma ou de la vidéo en s’assurant de la maîtrise du processus de la prise de vue et de son, du dérushage, de la narration jusqu’au montage.

Notre questionnement combine plusieurs interrogations qui structurent le présent article : en quoi l’usage de l’image et du son conforte-t-il le projet sociologique, c’est-à-dire en quoi et comment le documentaire sociologique est-il producteur de sens et de connaissances sociologiques ? Quels rapports la sociologie filmique entretient-elle avec quelques-uns des grands courants de la discipline ? Enfin, peut-on penser par l’image, ou bien encore que signifie cette formule concentrée ?

1. la sociologie filmique produit des connaissances originales

Dans notre démarche, la réalisation d’un documentaire sociologique repose, comme pour toute recherche dans la discipline, sur un travail de terrain conséquent avant d’entreprendre le tournage, travail de terrain lui-même préparé par des recherches documentaires et d’archives. Durant cette phase d’entretiens et d’observations (voire de passation de questionnaires), nous commençons à enregistrer images et sons tout en sachant que les chances d’utilisation de ces matériaux dans le documentaire définitif sont maigres. Pourtant cette « observation équipée » a quelques avantages par rapport à l’observation à l’oeil nu, puisque l’on saisit des faits ou des situations dont on peut ne pas avoir perçu la portée lors d’une observation simple ; de plus, l’enregistrement permet de revenir sur ce matériau pour mieux l’analyser, le comprendre et l’assimiler. Par ailleurs, le dérushage de ces images/sons, que l’on peut qualifier d’esquisses, conduit aussi à préparer le tournage final quant aux choix des points de vision (où mettre la caméra et le micro), des lumières, etc., et à éviter les écueils potentiels tels que les mauvais contre-jours, les sons indésirables… C’est aussi au cours de ce travail de découverte du terrain que l’on choisit les personnages du documentaire qui vont participer à la structuration du récit.

Le film court Les statues parlent aussi[2], débattu ci-dessous, se place dans le prolongement d’un autre documentaire sociologique que nous avons réalisé aux États-Unis, 50 ans d’affirmative action à Boston[3] (2013, 54’). Lequel a été conçu à un moment où le gouvernement français souhaitait mettre en oeuvre une politique de discrimination positive (affirmative action). Il s’agissait donc pour nous d’analyser les principes de celle-ci, de comprendre son fonctionnement, ses réalités et surtout ses effets sociaux en termes de réduction ou non des inégalités et des discriminations entre Américains blancs et Afro-Américains ; de fait, nous ne pouvions traiter en même temps de la situation des Latino-Américains ou des populations autochtones. Au-delà d’une préparation théorique intense, nous avons pris contact avec de très nombreuses institutions, associations, travailleurs sociaux, etc., pour leur expliquer notre projet afin de les mobiliser, y compris pour y trouver des personnages qui puissent débattre en profondeur à partir de guides d’entretien adaptés à chaque situation. En arrivant à Boston — c’était déjà notre troisième séjour dans cette ville —, les rencontres avec nos interlocuteurs nous ont permis de mieux connaître les quartiers où nous allions travailler : morphologie, habitat, inégalités sociales et raciales, ressorts économiques, modes de vie, mais aussi gouvernance de la ville et des aides sociales, voire des aides financières aux entreprises appartenant aux minorités.

Quinze années plus tard, alors que nous séjournions à Washington, un quotidien gratuit nous informait d’une manifestation antiraciste à Charlottesville (deux heures et demie de route) à propos du déboulonnage de la statue de Robert Lee (voir encadré ci-dessous). Nous avions suivi l’affaire durant les mois précédents et, parce que nous connaissions bien l’histoire des Afro-Américains, de la ségrégation raciale depuis la fin de l’esclavage à aujourd’hui, l’idée de compléter le travail fait à Boston nous conduisit directement à Charlottesville (Virginie).

La réalisation de ce film court a largement bousculé notre pratique de sociologues cinéastes, en raison de l’intensité des événements, sans pourtant en modifier l’esprit. En effet, selon nous, la fabrication d’un documentaire sociologique s’appuie sur un travail de terrain conséquent ; celui-ci achevé, le sociologue cinéaste prépare un premier scénario qui associe son questionnement, ses connaissances théoriques avec les données recueillies. Lequel scénario repose sur une narration qui devra captiver l’attention du futur spectateur, tout en prévoyant dans ses grandes lignes les séquences, voire les plans (le séquencier), qu’il devra tourner (voir pour un développement La Sociologie filmique, CNRS Éditions, 2020). En effet, concevoir les images (et les sons) avant d’aller filmer, à partir de la documentation disponible et d’un pré-travail de terrain qui nous familiarise avec celui-ci, nous paraît essentiel.

Bien sûr, nous ne pouvions, à Charlottesville, préparer un premier scénario ni penser à l’avance les plans et les points de vision, mais notre connaissance du sujet nous permettait de relever le défi. Cependant, nous avions à réfléchir rapidement (les foules des deux camps étaient en mouvement rapide et imprévisible), à enregistrer des images et des sons que nous qualifions de signifiants[4], c’est-à-dire avec des contenus sociologiquement forts. Il ne s’agit pas ici de traits signifiants pour illustrer une thèse a priori, mais de collecte d’éléments visuels et sonores qui expriment au mieux ce que nous vivions sur le terrain, y compris des éléments pouvant contrarier la ou les thèses développées à partir de la problématique. Ici, pas de doute sur les images signifiantes : nous nous attendions à voir les militants suprémacistes s’afficher avec des insignes nazis, revêtant des tenues militaires, quelquefois avec des casques allemands de la dernière guerre ; ils sont actifs dans le film, mais non répétés pour ne pas alourdir le propos. De même, les drapeaux confédérés, assez nombreux, ne sont pas montrés avec trop d’insistance pour ne pas envahir l’espace. Seul un plan, un peu plus long, montre un homme faisant tournoyer son drapeau confédéré ; mais ce plan a une autre fonction : souligner la sortie peu honorable des confédérés, sous la protection d’une police qu’ils vouent aux gémonies. En revanche, les armes de guerre sont omniprésentes parce qu’elles l’étaient dans la manifestation et que, d’une certaine manière, elles écrasaient tous les autres signifiants suprémacistes, y compris parce que ces armes à feu sont au coeur d’un débat central dans la société américaine. Il nous a d’ailleurs fallu l’aide de contre-manifestants interrogés pour comprendre que ces hommes surarmés ne faisaient pas partie d’un corps d’armée officiel, mais qu’il s’agissait d’extrémistes prêts à en découdre. Toutes ces images appellent l’émotion et c’est certainement l’un des atouts de la sociologie filmique que de montrer ici un rapport de forces en jouant sur le sensible : comment accepter que des civils s’arment pour exister, pour faire valoir leur point de vue et s’arc-boutent sur un passé révolu qu’ils voudraient faire revivre (la Confédération des États du Sud et l’esclavage) dans une grande démocratie ? Mais, on l’a compris, tout ce travail de recherche des signifiants a lieu (au-delà du tournage) dans le visionnage répété des images/sons qui fait découvrir des éléments nouveaux ou fait jaillir des interprétations pertinentes. C’est ici le terrain qui parle et qui conduit en général le sociologue cinéaste à construire un second scénario à partir du matériau enregistré. Lequel repose sur deux exigences :

  • partir des éléments dont on dispose réellement pour monter le film — évidemment en lien étroit avec le premier scénario —, lesquels diffèrent nécessairement des prévisions (nous ne sommes pas dans le processus d’un cinéma de fiction) : la qualité de l’image et du son peut ne pas être au rendez-vous ou bien des personnages et des lieux se sont dérobés au moment du tournage ;

  • faire évoluer les hypothèses, voire la problématique d’origine, à partir des données sociologiques recueillies au cours de ce travail de terrain équipé du caméscope.

Ainsi, la phase du montage apparaît stratégique dans la production de connaissances. Dans ce film, c’est entre le dérushage et le montage que nous est apparu l’objet central du film, et son fil conducteur : les statues. En effet, à Washington, nous avions filmé quelques scènes et des situations en lien avec la poursuite de notre précédent film sur l’affirmative action, en particulier sur le National Mall : le mémorial de Lincoln et l’immense statue de Martin Luther King. Un élément commun traversait ces images et le conflit contemporain autour de Robert Lee : la présence de statues liées à l’histoire des États-Unis. Elles allaient animer le film, à partir d’une mise en abyme avec le travail de Chris Marker et d’Alain Resnais dans Les statues meurent aussi. Réalisé en 1952, ce documentaire interroge l’enfermement des statues africaines au Musée de l’Homme à Paris. Lesquelles perdent alors toute leur vitalité et le sens qu’elles détenaient lorsqu’elles étaient au coeur des populations dont elles sont issues. Au contraire, les statues, que nous avions filmées aux États-Unis, se situaient dans un espace ouvert à tout vent, libre, étaient non muséifiées à la différence de celles filmées par Marker et Resnais. Elles étaient vivantes et parlaient au présent et du présent. D’où le titre, Les statues parlent aussi, pour dire combien le passé des États-Unis hante le présent. En d’autres termes, le travail rigoureux sur les images (et sur les sons, voir ci-dessous) et la mise en relation de la statue du général Lee avec celles des émancipateurs de Washington (Abraham Lincoln et Martin Luther King) réactive les causes mouvementées de l’histoire du pays pour comprendre les mouvements sociaux contemporains. L’enchevêtrement des images de notre film télescope les périodes et les faits sociaux pour interroger l’histoire ou lire le présent à la lumière du passé, autrement dit fait penser par l’image. En ce sens, ce télescopage des images et des sons contribue à faire réfléchir et à produire des interrogations et des connaissances.

Réfléchir et concevoir ce que signifie cette belle formule de penser par l’image que l’on attribue souvent à Jean-Luc Godard et que Pierre Maillot reprend à son compte (2000) exige ici un retour aux sources de la sociologie filmique, à savoir la sociologie et l’ethnologie ou l’anthropologie visuelles.

2. héritage et traditions de l’image dans les sciences humaines

Les ouvrages et les écrits en sociologie visuelle, qui traitent de la seule photographie et non de l’image animée, la pensent comme au service de la sociologie. Cette vision s’inscrit dans la longue histoire de la place de l’image dans les sciences humaines, à commencer par l’histoire et l’archéologie qui interprètent et débattent des oeuvres iconographiques depuis les gravures rupestres du paléolithique. Plus près de nous, les ethnologues et les anthropologues ont abondamment utilisé la photographie pour étudier les pratiques quotidiennes, l’habitat, les outils, la vie domestique, etc. Il s’agissait aussi, un peu plus tard, de mémoriser les cultures de populations appelées à disparaître après la pénétration des Occidentaux sur leurs territoires. On pense bien sûr à Bronislaw Malinowski, à Margaret Mead et Gregory Bateson, aux photographes (et cinéastes) envoyés par le banquier Albert Kahn dans ce qu’il caractérisait comme les pays les plus lointains ; la liste est longue. D’abord témoignage, la photographie ethnologique est devenue rapidement support aux débats sur les cultures et les civilisations dites aujourd’hui premières.

Notre pratique de sociologues-cinéastes s’inscrit nécessairement dans ce double héritage ou, pour être plus précis, d’un héritage à deux entrées, à savoir l’anthropologie et la sociologie d’une part et la photographie et le cinéma d’autre part. L’exposé prend d’abord appui sur l’anthropologie visuelle aboutissant à l’anthropologie filmique (la photographie en anthropologie n’est pas traitée ici). Puis le récit aborde l’usage de la photographie en sociologie, pour déboucher sur l’utilisation de la vidéo dans cette discipline en Italie.

Vers l’anthropologie filmique

Les ethnologues et les anthropologues se sont emparés très tôt de la caméra, malgré les difficultés de tournage liées à l’encombrement du matériel et à la fragilité des pellicules. Dans l’expédition Dakar-Djibouti (1931-1933), Marcel Griaule ne rapporta que quelques dizaines de minutes de film utilisables. De son séjour chez les Dogons, nous conservons Sous les masques noirs (1938). Et c’est Robert Flaherty, mieux organisé et habitué des contrées glaciales, qui marque le début de l’histoire du documentaire avec Nanouk l’Esquimau (1922) puis avec L’homme d’Aran (1934) ou avec Louisiana Story (1948). Son épouse Frances Flaherty montre comment Robert Flaherty percevait la caméra :

C’était une machine qui révélait ce que l’oeil ne pouvait voir. Il n’avait pas la prétention d’écrire des scénarios ni de dire à la caméra ce qu’elle devait voir. Il ne lui disait pas “voici la vie”. Il lui demandait “quel est ce mystère que tu perçois mieux que moi ? Tu saisis mieux le mouvement. Et la vie c’est le mouvement. [...] Tu renouvelles notre perception. À travers tes yeux, nous redécouvrons le monde qui nous entoure

entretien avec Robert Gardner, Peabody Museum, Harvard, 1958

C’est cette acuité visuelle que nous cherchons à cultiver en utilisant des caméscopes, ô combien plus faciles à tenir ! Le Britannique John Grierson, ancien collaborateur de Robert Flaherty, y ajoute le sens et la qualité du montage pour montrer dans Night Mail (1936, 25’) l’extrême précision du travail et des mouvements des postiers sur un train de nuit roulant à pleine vitesse, qui lancent ou reçoivent les sacs de courrier échangés avec le personnel en gare[5].

Quand Jean Rouch, ethnologue, commence à filmer, il utilise très tôt le nouveau matériel allégé de tournage, de prise de son et plus tard de synchronisation pour ses films en Afrique. Il est à l’origine, au début des années 1960, du cinéma vérité généralement rattaché au ciné direct, plus international (États-Unis, Québec…) qui utilise les avantages de la caméra légère pour pratiquer un cinéma plus souple, plus près des sujets ; ce qui n’empêche pas Jean Rouch de travailler à partir de scénarios dont il s’éloigne en général durant le tournage. Avec Les Maîtres fous (1954), moi, un noir (1958), Cocorico Monsieur Poulet (1977) et une filmographie de plus d’une centaine de films, il marque l’histoire du documentaire (Barnouw, 1974), en particulier par sa très grande réactivité aux situations durant les prises de vue. C’est ici toute une leçon que nous pouvons tirer du cinéma direct : disposer d’un scénario plus ou moins précis, mais toujours ouvert, pour filmer les situations et les échanges imprévus et signifiants.

Entre 1959 et 1961, Jean Rouch réalise avec le sociologue Edgar Morin Chronique d’un été, que l’on peut considérer comme l’un des premiers films sociologiques à travers un témoignage sur la France traitant du travail, de la consommation, de la guerre d’Algérie, de l’immigration, voire du féminisme. Après une discorde, les deux auteurs mettront fin à leur coopération et Edgar Morin abandonnera la pratique du cinéma (mais non les analyses des fictions). Au Québec, Pierre Perreault et Michel Brault réalisent en 1963 Pour la suite du monde selon les préceptes du cinéma direct. Ce documentaire sur la pêche au marsouin blanc dans L’Isle-aux-Coudres rencontre un franc succès en raison de sa qualité cinématographique tout en renvoyant à l’histoire nationale : il indique subrepticement les thématiques qui intéressent le public et la nécessaire qualité technique de la réalisation.

En France, l’héritage de Jean Rouch irrigue les universités et le CNRS et nombre d’ethnologues ou d’anthropologues réalisent leurs films en Afrique ou en France, sans que l’on puisse les citer tous. Jean Arlaud a réalisé plusieurs dizaines de courts et moyens métrages sur différents thèmes de la France paysanne, du quartier d’immigrés de la Goutte d’Or à Paris (Ici, y’a pas la guerre, 1978) ou sur la symbolique des camions multicolores pakistanais (Touchez pas au Malang, 2002). Marc-Henri Piault a tourné plusieurs films en Afrique, mais s’est aussi intéressé au rôle de l’image en anthropologie en publiant sa synthèse Anthropologie et Cinéma. Passage à l’image, passage par l’image. De leur côté, Jacques Lombard et Michèle Fiéloux ont réalisé plusieurs documentaires anthropologiques à Madagascar et au Burkina Faso dont Les Mémoires de Binduté Da (1989, 52’) sur les rites funéraires dans ce dernier pays et plus récemment À visage découvert (58’) qui y décrit la situation des femmes. Tous ces anthropologues pratiquent le cinéma ou la vidéo et publient leurs réflexions sur leur utilisation des images (et des sons) dans leur discipline.

Claudine de France, anthropologue-cinéaste, a réalisé ses documentaires essentiellement en France, utilisant la démarche ethnologique pour étudier les populations rurales ; ce qui donne une primauté à la gestuelle et aux rites quotidiens dans son cinéma. C’est après qu’elle a utilisé le terme d’anthropologie filmique que nous avons opté en 2001 pour le terme de sociologie filmique, afin de qualifier notre pratique et notre réflexion. En s’inspirant de la typologie d’André Leroi-Gourhan, Claudine de France propose de distinguer les films d’exploration (quand la caméra devient outil « d’observation équipée ») et les films d’exposition qui rendent compte des résultats des recherches (de France, 1989). Le défi qui est le nôtre à travers la sociologie filmique est de faire converger les deux moments de la recherche, afin que le documentaire sociologique soit aussi un outil de diffusion élargie des connaissances sociologiques. Nous disséquons ailleurs (Sebag et Durand, 2020, chapitre 3) ce long processus technico-scientifique (technique pour le cinéma ET scientifique pour la sociologie) pour produire de tels documentaires sociologiques[6].

En sociologie : de la photo à la vidéo

Pour Howard Becker, la photographie présente des situations dont les sociologues peuvent tirer des informations pour alimenter leurs thèses et leurs théories :  

Le prix à payer pour les chercheurs en sciences sociales est moins élevé [que celui des photographes pour apprivoiser les sciences sociales]. Ils doivent se familiariser avec l’abondante littérature photographique [...]. En outre, ils devront apprendre à regarder les photographies plus attentivement qu’ils ne le font d’habitude. Les profanes lisent les photographies comme ils le font avec les titres [des journaux], en les survolant rapidement pour saisir l’essentiel de ce qui est dit. Les photographes, par contre, les étudient avec le soin et l’attention aux détails que l’on peut accorder à un article scientifique difficile ou à un poème difficile. Chaque partie de l’image photographique contient des informations qui contribuent à sa signification globale ; la responsabilité du spectateur est de voir, de la manière la plus littérale, tout ce qui est là et d’y réfléchir. En d’autres termes, la proposition contenue dans l’image — pas seulement ce qu’elle vous montre, mais aussi l’humeur, la position morale et les liens de causalité qu’elle suggère — est construite à partir de ces détails. Une « lecture » correcte d’une photographie voit et répond pleinement [au questionnement posé].

Becker, 1974, p. 6-7

Pour Howard Becker, les sociologues peuvent utiliser les photographies comme sources informationnelles pour produire des résultats sociologiques, sans aller véritablement au-delà.

Diana Papademas a multiplié les expériences d’utilisation des photographies dans l’enseignement universitaire, à la fois pour faire partager ses analyses des mondes sociaux et pour développer le sens critique des regards portés sur les images. Elle a publié, sous l’autorité de l’American Sociological Association, une sorte de manuel pour construire ses cours à partir des images (photos et vidéos), qui fait autorité (Papademas, 1993) ; elle y soutient que le plaisir et l’imagination des enseignants sont les conditions du succès ! De son côté, John Grady a développé une réflexion approfondie sur les apports des recherches visuelles (les graphes en général, la photo et la vidéo) pour la sociologie en formulant les questions de fond, c’est-à-dire avec une approche que l’on pourrait qualifier d’épistémologique (Grady, 2008). Sans omettre qu’il « est impossible d’obtenir une quelconque maîtrise de la sociologie visuelle si l’on ne développe pas une connaissance artistique approfondie dans la création d’images » (Grady, 2001, p. 118). Par ailleurs, il souligne l’ambivalence des images : elles

peuvent représenter des processus subjectifs complexes sous une forme extraordinairement objective. Pour un grand nombre de questions et dans les débats, les images fournissent donc les données les plus pertinentes possibles. Apprendre à traiter et à interpréter les images est donc un moyen privilégié pour interpréter les faits en général et pour former les étudiants à la sociologie

Grady, 2001, p. 84

Douglas Harper, dans Visual Sociology (2012), démontre aussi tout l’intérêt, pour les sociologues, d’utiliser la photographie pour y puiser des informations qu’ils ne trouveraient pas dans l’observation par des voies traditionnelles (celles que nous dénommons non équipées) ; son ouvrage propose des méthodes plus sophistiquées que la seule analyse des photos de sociologues ou de non-sociologues, pour provoquer la production d’informations nouvelles dans ou par la photographie : auto-confrontation (p. 238), photo-élicitation (chapitre 8), photovoice (chapitre 9). Lesquelles mettent à contribution les sujets observés pour, à partir du sens qu’ils perçoivent dans les photos, expliciter leurs comportements, leurs valeurs et leurs représentations. Bien qu’il ait publié un ouvrage sur les vagabonds de l’Ouest américain avec 25 photos qu’il a prises lui-même, lesquelles constituent pour nous les prémisses de la photographie sociologique[7], il les considère (Harper, 1982) comme des sources d’information pour ses analyses sociologiques des tramps dont il a partagé la vie quotidienne. Dans la réédition totalement réécrite de Visual Sociology (2023), Douglas Harper envisage l’image (fixe ou animée) comme moyen d’expression sociologique.

Mais en général, les sociologues qui « font de la photo » utilisent leurs travaux comme source informationnelle, sans aller au-delà. François Cardi estime que

comme toute méthodologie de recherche en sociologie, la méthode photographique revient à constituer l’image photographique en objet d’analyse pour permettre d’en déterminer la nature, la forme, le sens, de telle sorte qu’elle devienne voie d’accès au social et source de connaissance.

2021, p. 117

Et il ajoute immédiatement, « la photographie, malgré son caractère apparemment objectif et objectivant dans l’exactitude, ne peut que citer les apparences ». Alors son activité de sociologue-photographe, tel qu’il se définit lui-même, ne peut se dispenser d’un commentaire analytique de ses clichés chargé « d’objectiver les données qu’il a lui-même recueillies au cours de son travail de photographe » (Cardi, 2021, p. 222). Ainsi, ses propres photos « constituent en tant que telles des sources de connaissances ou d’hypothèses, en bref des données d’enquête, des matériaux originaux que les spécificités de la photographie, à condition de les prendre au sérieux, rendent indispensables et irremplaçables » (Cardi, 2021, p. 226).

Pierre Fraser semble convaincu de la possibilité d’une image sociologique, fixe ou animée, mais continue de s’interroger. Dans sa revue Sociologie visuelle (mars 2021), ses images et celles de Georges Vignaux comparent les étals d’un marché public avec les étagères d’une banque alimentaire à partir d’un appareillage théorique qu’ils ont conçu : territoire visuel, repère visuel, réseau visuel et parcours visuel. Chacune des photos du marché exprime un étal, l’histoire d’un produit, ses contenus (bocaux), son mode d’emploi, etc. Ces photos de type documentaire sont accompagnées d’un commentaire analytique justifiant la présence de chaque photo dans la démonstration générale de l’article comme si l’image devait s’appuyer sur un texte pour être lue ou interprétée. Textes et photos marchent ainsi de conserve : toutefois, si les photos des auteurs parlent d’elles-mêmes, les textes qui leur semblent nécessaires en réduisent l’autonomie potentielle. D’où ce questionnement des auteurs :

Existe-t-il réellement une sociologie visuelle ? Est-elle une discipline qui permette efficacement d’utiliser l’image comme modèle d’expression, de communication, de monstration et de démonstration ? Est-elle une démarche scientifique qualitative qui fait objectivement appel aux trois principes fondamentaux d’une analyse, à savoir la description, la recherche de contextes et l’interprétation ?

Fraser et Vignaux, 2021, p. 53

De son côté, Sylvaine Conord souligne les limites de la photo documentaire telle qu’elle est définie par Olivier Lugon (2011) : « La photographie est alors source d’informations scientifiques, cependant son usage crée une certaine uniformité dans les techniques de prise de vue devenues répétitives et systématiques. Le réel est palpable mais sans humanité » (Conord, 2019, p. 252). En tant qu’ancienne photographe de presse convertie à la sociologie, Sylvaine Conord définit, dans son mémoire d’habilitation à diriger des recherches, son approche comme photo-sociologique, en particulier à propos de son travail sur les cafés de Belleville ou sur les danses et les fêtes juives du même quartier : ici, les images de l’auteure apparaissent comme l’expression photographique d’une réflexion sociologique. On peut ainsi dire que la notion de photographie sociologique est en gestation.

L’équipe du Lab’Urba de l’Université Gustave Eiffel (Marne-la-Vallée) réunie par Cécile Cuny, elle-même photographe et sociologue, a accompagné sa recherche sur les plateformes logistiques par de très nombreuses photographies de terrain : les résultats de la recherche ont fait l’objet de plusieurs publications (Cardi et al., 2022 ; Cuny et al., 2021 ), voire d’expositions. Sans utiliser le terme de photographies sociologiques, les clichés publiés et exposés relèvent en partie de cette démarche, sauf que dans notre cas, la photographie n’est pas là pour recueillir des données utiles à l’enquête et à la construction des résultats mais, bien au contraire, arrive plutôt à la suite d’une bonne connaissance des terrains pour accompagner — et non pas illustrer — l’écrit final. Ce sont des images qui « tiennent toutes seules », réalisées en des itinéraires photographiques avec les personnes interrogées durant la recherche ou montrant leur cadre de travail. Les photographies, qui apparaissent volontairement décalées du questionnement de la recherche, ne manquent pas d’interroger le lecteur ou le spectateur : entrepôts vides de leur personnel, espaces désertés, salariés photographiés en dehors de leurs lieux de vie et de travail, « natures mortes » d’engins de levage, etc. Ici, la dimension esthétique pourrait parfois l’emporter au détriment de la préoccupation sociologique : si certains signifiants renvoient à la recherche sociologique, la dé-contextualisation sociale peut tendre à effacer la démarche sociologique, y compris à partir de la précision technique de l’image.

Reconsidérer l’image comme source de connaissance (document) mais aussi comme forme de savoir engage un triple enjeu : réévaluer le statut et les usages de l’image dans les sciences sociales, interpréter avec discernement l’information sociologique contenue dans les documents visuels et apprendre à élaborer une recherche sociologique en images et par l’image. Le défi à relever n’est pas mince puisqu’il consiste à réhabiliter une forme de « pensée visuelle » — qui n’est pas qu’une simple « sensibilité » visuelle — et s’en saisir pour proposer un programme de recherche scientifique compatible avec l’un ou l’autre paradigme sociologique. Et ultimement, de se saisir du langage visuel pour élaborer un discours qui réponde aux exigences de la pensée sociologique scientifique (démonstration et explication) en dépassant le format du documentaire journalistique ou social et l’usage purement illustratif de l’image ou encore l’usage instrumental du document visuel en sociologie pour faire place à l’image et au document sociologique élaboré de bout en bout par le sociologue lui-même comme produit (et non objet) de sa recherche.

Vander Gucht, 2018, p. 45

Alors, dans ce programme, l’image sociologique ne préexiste pas à l’analyse sociologique « mais lui devient consubstantielle en tant que fait social, “conquis, construit et constaté”, comme le dit Gaston Bachelard du “fait scientifique” résultant d’un processus heuristique ad hoc » (Vander Gucht, 2018, p. 121). Ce qui ne manque pas de soulever de nouvelles questions épistémologiques si la réalité sociale et son image construite par le sociologue (le fait social) appartiennent toutes deux au même domaine (le social), et qu’il faudra bien dissocier leurs natures et leurs statuts pour conduire une analyse réflexive.

Plusieurs sociologues italiens se sont intéressés très tôt à l’usage de la photographie, dans la discipline, en particulier à l’Université de Bologne, tels que Patrizia Faccioli qui publie en 1993 une Introduction à la sociologie visuelle (avec Costantino Cipolla) puis une nouvelle version en 2010 avec Giuseppe Losacco (Faccioli et Losacco, 2010). Pour Patrizia Faccioli,

la sociologie visuelle possède deux âmes : elle est en même temps une méthodologie et une discipline autonome. En tant que méthodologie, ses techniques d’enquête peuvent être appliquées à tous les domaines disciplinaires de la sociologie — par exemple le travail, le territoire, la communication, etc. — ainsi qu’aux autres disciplines voisines comme l’anthropologie ou la psychologie. Même si nous la pensons comme une méthodologie, il faut admettre qu’elle est capable de nous fournir des informations que nous ne réussirons jamais à obtenir autrement. La recherche vidéo-photographique sur le terrain nous donne la possibilité d’enregistrer les mouvements des flux culturels qui se manifestent visuellement. Les techniques de la photo-elicitation et de production subjective des images se basent sur la nature polysémique des données visuelles, leur interprétation et production reflètent donc les ways of seeing des sujets de la recherche. Comme discipline autonome, la sociologie visuelle doit avoir son domaine d’étude particulier. Lequel ? On pourrait en indiquer au moins deux : les processus de visualisation et les pratiques de la vie quotidienne. Travailler sur la visualisation signifie analyser les données visuelles qui nous submergent pour en déconstruire les diverses strates de signification et en déterminer le contexte de production et les idéologies véhiculées.

Entretien avec Fabio La Rocca, 2020

Dans son article « Réaliser des films sociologiques : une proposition » paru en 1996 dans Visual Sociology, Giuseppe Losacco met en avant les écueils et les difficultés à réaliser de tels films, en doutant de l’acceptabilité par la communauté scientifique d’une possibilité d’exposer des résultats en dehors du support papier (a non-paper output ; voir aussi Losacco, 2007). Ce n’est qu’en gagnant la confiance de celle-ci « que la réalisation de films [sociologiques] pourrait devenir une extraordinaire alliée de la connaissance scientifique » (Losacco, 1996). Ce n’est que deux décennies plus tard, cette fois à l’Université de Gênes, que des sociologues tentent le pari et réalisent plusieurs documentaires sociologiques : le premier sur une prison de Barcelone (Filming (With) Gangs) et le second sur la fin de la révolution tunisienne (Après le printemps, l’hiver[8]). Luca Queirolo Palmas et Luisa Stagi ont aussi entrepris une collection d’ouvrages numériques dans la même université, traitant de la sociologie visuelle et filmique. En France, plusieurs masters ont été créés dans la dernière décennie pour former des réalisateurs de documentaires, en sciences humaines et sociales, sans spécifier la discipline ; l’Université d’Évry délivre des doctorats en sociologie filmique, tous fondés sur la présentation d’un documentaire sociologique accompagné d’une réflexion critique sur le film lui-même.

Le déploiement lent, mais inéluctable, de l’image et en particulier de l’image/son en sociologie à côté, voire en remplacement du texte avec ses longues traditions, soulève nécessairement des questions théoriques nouvelles.

3. de quelques débats épistémologiques

Pour nous, la sociologie visuelle et filmique dépasse le principe de la sociologie comme instrument et moyen avancé de lire, analyser, comprendre ou interpréter sociologiquement des images — bien souvent réalisées par des non-sociologues (voir section précédente). Si l’absence d’apprentissage de la lecture ou de l’interprétation d’une image (et du son) reste un point nodal dans l’enseignement de la plupart de nos pays, on ne saurait limiter l’apport de la sociologie à ce seul registre. De même, si l’instrumentation de la sociologie filmique (Naville, 1966) est plus que l’outil basique d’enquêtes de terrain, ce principe signifie que sa préoccupation première est de produire des images/sons en mesure de faire (res)sentir des propos sociologiques, comme par exemple dévoiler ce qui est caché, ou bien encore tenter de situer les causes des faits sociaux ; ce que nos collègues en ethnologie et en anthropologie visuelles ou filmiques pratiquent depuis un demi-siècle comme il est dit précédemment. En ce sens, nous poussons jusqu’au bout ce qui peut être vu comme implicitement contenu dans les écrits de nombre de sociologues en général et de ceux côtoyant la photographie, voire la pratiquant : dévoiler, montrer, démontrer, expliquer, comme le propose Daniel Van Der Gucht (2017).

En soutenant que la réalisation d’un documentaire sociologique produit des connaissances à chaque étape, la sociologie filmique, selon notre vision, dépasse largement l’idée d’utiliser seulement la caméra comme outil de recueil des données. Ici, l’image et le son sont producteurs de sens sociologique, tout au long du processus de réalisation du documentaire. Bien sûr au tournage, considéré comme l’aboutissement d’une « observation équipée », auquel il faudrait ajouter les aléas liés aux événements inattendus ou aux comportements et déclarations des personnages : autant de situations qui peuvent rapprocher notre pratique, à certains moments, du cinéma direct, sauf que nous avons pensé un scénario et anticipé autant que faire se peut les événements durant la prise de vue. Le second moment de production de sens et de connaissances s’avère être la très longue période de dérushage : le visionnage répété des séquences et leur rapprochement mental font émerger des idées nouvelles ou font prendre conscience de faits ou de représentations non perçues au départ de la recherche. Enfin, le montage lui-même confirme cette tendance par la mise en rapport de plans ou de séquences qui, à son tour, fait naître, révèle, voire fait jaillir, des idées et des thèmes inattendus. Les perceptions différenciées des spectateurs et les débats sur les documentaires sociologiques — comme sur les films en général — constituent évidemment une autre source de production de connaissances.

Sans développer ce qui sera l’objet de la dernière partie de cet article, on peut citer ici l’effet du montage dans Les Statues parlent aussi qui, par exemple, fait succéder immédiatement, à la quiétude silencieuse de la maison de maître, le brouhaha et la brutalité vestimentaire des manifestants suprémacistes : c’est bien la violence filmique qui suggère la fureur des rapports sociaux à travers lesquels les esclaves fournissent aux maîtres l’aisance et la douceur de vivre ; ce que quelques-uns voudraient voir se poursuivre.

En résumé, pour nous, la sociologie filmique consiste en la réalisation ou la fabrication de documentaires sociologiques fondés sur des enquêtes, des observations « équipées » ou non, basés sur des théories sociologiques. Alors, nous nous inscrivons aussi dans tous les débats qui traversent historiquement la sociologie auxquels s’ajoute la présence de l’image et de son auteur. Pour n’en prendre que quelques-uns, nous portons toute notre attention sur les effets de la subjectivité du réalisateur dans son traitement de la réalité ; tout en sachant qu’il est inclus dans cette même réalité.

Image et démarche inductive

Un débat théorique porte sur le fait que l’usage de l’image, fixe ou animée, semble redonner des ailes à la démarche inductive en sociologie, celle qui déclare partir du terrain (et seulement du terrain) pour émettre ensuite des thèses ou des théories, voire créer des concepts. En premier lieu, faut-il remarquer que les tenants d’une induction rigoureuse s’égarent en se dupant eux-mêmes ? D’une part, et quoi qu’ils en disent, ils partent sur le terrain avec des hypothèses, des idées (préconçues) ou ce que Durkheim dénommait des prénotions. D’autre part, aucun sociologue avéré et expérimenté ne peut affirmer sérieusement qu’il arrive sur un terrain, en étant vierge de toute idée, de toute représentation, quelque objet qu’il traite. La démarche inductive comme entrée innocente sur le terrain est une fiction ou, au mieux, un faire-semblant d’objectivité qui intègre toutes les subjectivités et les idées reçues, parce qu’elle manque une étape importante de la sociologie : la réflexivité.

Notre proposition est inverse : il s’agit de partir de ces idées premières (dans leurs conflits et dans leurs contradictions) pour penser un questionnement, une problématique, puis émettre des hypothèses, des réponses théoriques possibles, avant d’aller voir sur le terrain si elles fonctionnent. Les images/sons recueillis, que l’on pourrait considérer comme un « matériau brut » dans le sens où ils montrent un événement ou une situation, sont construits esthétiquement car pensés auparavant (questions du point de vision, de la lumière, etc., sans mise en scène des objets ou des personnages). Y compris parce que le sociologue-cinéaste connaît bien son terrain et qu’il peut s’adapter immédiatement à tout changement imprévu. John Grady nous dit :  

l’image est une forme unique de données. D’une part, elle est tangiblement objective. Ce que vous voyez est ce que l’appareil photo a obtenu et donc, toutes choses étant égales par ailleurs, l’image est un enregistrement physique de quelque chose qui a été, ou qui s’est produit, à un moment ou à un autre. D’autre part, l’image est irréductiblement subjective. Elle reflète invariablement le centre d’attention, à un moment donné, de la personne qui tient ou dirige l’appareil photo. Très souvent, l’image capture également des aspects importants de l’expérience du sujet de l’image. C’est particulièrement vrai pour les films et les vidéos.

Grady, 2001

Ce contenu dialectique de l’image en fait bien un témoin de ce qui s’est passé et dit.

En même temps, la richesse informationnelle des images/sons fait qu’ils ne se limitent pas à répondre aux interrogations du sociologue-cinéaste, mais aussi qu’ils posent de nouvelles questions adjacentes et éclairantes, par exemple en conduisant le théoricien à formuler autrement la question d’origine ou en la complétant par une approche de biais. Nous désignons par « résidus scientifiques » ces informations parce que, la plupart du temps, le sociologue de l’écrit ne revient pas dessus : d’une part, parce qu’elles peuvent complexifier considérablement la démarche générale et d’autre part, parce qu’elles risquent d’obscurcir l’exposé central ; ou bien encore trop allonger la durée de la recherche relativement à un commanditaire pressé. Or, pour le cinéaste-sociologue, ces « résidus scientifiques » sont plus difficiles à oublier que dans le processus de rédaction papier, car ils ont une sorte d’épaisseur matérielle dans sa mémoire qui le taraude tout au long du dérushage et du montage. Intégrer ces résidus scientifiques est particulièrement complexe durant le montage, car ils peuvent briser la fluidité de la narration. Cependant, la qualité du documentaire sociologique se mesure en grande partie à la richesse des situations et des arguments présentés, exprimant une diversité de points de vue qui font débat dans le film et plus tard entre les spectateurs. Précisons que cette variété des points de vue (entretiens, images et sons…) ne signifie pas neutralité ou « objectivité » du sociologue-cinéaste. En fonction de son questionnement et de ses hypothèses, il induit des interprétations possibles de ses images/sons : au spectateur de s’en emparer et de les discuter. Enfin, les images/sons et les entretiens, dans la diversité de leurs significations, ont aussi pour fonction de conduire le spectateur à s’interroger toujours plus en profondeur sur ce qu’il a perçu, comme à propos de toute oeuvre.

Le documentaire sociologique soulève un débat, mais n’assène pas une vérité ou un positionnement politique. Par exemple, dans Les Statues parlent aussi, nous avons souhaité montrer et entretenir le sentiment d’étrangeté qui caractérise la manifestation et plus particulièrement la violence latente ou contenue, présente-absente, qui imprègne l’événement. Ce qui surprend tient à la passivité des manifestants « pro statue » et au calme des suprémacistes regroupés autour de la statue — qui contraste avec la violence de leurs tenues militaires ou de leurs insignes nazis —, que l’on sent pourtant prêts à en découdre, séparés des contre-manifestants antiracistes par un cordon de la police locale en vestes jaunes. En face, les antiracistes, dans des tenues quelquefois estivales et dans une certaine dispersion, semblent chercher l’affrontement, sans disposer d’aucun moyen de combat. Celui-ci n’aura pas lieu, puisque la police locale met fin à la manifestation en accompagnant les suprémacistes hors du parc Lee, dans un défilé désordonné où ils apparaissent quelque peu penauds. Tout au long de l’affrontement latent, toujours prêt à éclater, le travail sur le son soutient la saturation de l’espace et participe résolument à maintenir le spectateur en haleine. Cette latence de la violence, avec des mouvements de foule du côté des anti-statue qui doivent être regardés avec attention, montre la très faible proportion d’Afro-Américains, alors qu’il s’agit d’une manifestation antiesclavagiste. Cette situation conduit le spectateur à s’interroger sur l’évolution sociopolitique des États-Unis : au-delà des violences des manifestations en réaction aux assassinats d’Afro-Américains, qui est le premier niveau de lecture de cette évolution, le pays — et en premier lieu la population blanche — n’est-il pas plutôt déchiré entre une extrême droite radicalisée et les libéraux ?

Ce film court constitue aussi une réflexion sur ce que peuvent dire les images lorsqu’elles ne sont pas accompagnées de paroles… Que se passe-t-il dans un groupe, quelles sont les interactions qui se produisent ? Ici, filmer les manifestants dans l’action, avec leurs tenues respectives, dans leur gestuelle, dans leurs symboles — fleurs ou fusils, drapeaux confédérés, etc. — était d’emblée révéler une histoire de l’Amérique qui reste irrémédiablement déchirée, et ce, malgré le rêve d’harmonie qui traverse aussi son histoire.

Enfin, pour revenir sur la démarche inductive versus approche hypothético-déductive (ce vocabulaire reste bizarre car assez imprécis), c’est-à-dire sur le thème de la vérification ou de l’invalidation des hypothèses, la puissance du réel qui traverse les images/sons conduit à exposer la diversité ou la complexité du réel plutôt qu’à le tronquer : il s’agit alors de faire évoluer ces hypothèses si elles sont erronées, mal formulées ou imprécises. Par exemple, dans le film court discuté ici, les images de la jeune fille aux fleurs (en filmant, nous l’avons spontanément pensée comme citation de la célèbre photographie de Marc Riboud[9]) nous apparaissaient duales : à la fois historiques et décalées dans cette manifestation contre les suprémacistes blancs armés. Comment faire parler ces images et à quel moment les placer dans le montage final, sachant qu’elles avaient aussi un lien avec les séquences sur la mansion des planteurs du xixe siècle ?

Ainsi, la démarche rigoureuse que nous tentons de faire nôtre consiste à concevoir la connaissance comme une spirale cumulative, y compris en réalisant plusieurs films sociologiques sur le même objet ! Ce qui signifie aussi que cet enrichissement des hypothèses emprunte à la démarche inductive : autrement dit, ce débat entre deux méthodes qui seraient étrangères l’une à l’autre, et surtout inconciliables, n’a guère de sens. Sauf à obscurcir le débat en prenant des positions extrêmes pour refuser la dispute à partir de démarches univoques masquant mal des partis pris qui devraient être exposés dès le début du processus de recherche.

Ici, le choix de ne pas inclure d’entretiens (pourtant réalisés) tient à notre volonté de rendre compte par l’image d’une question politique qui hante les États-Unis : les rapports entre Blancs et Noirs ou métis. Ce film court relève de la construction d’une approche expérimentale qui montre les potentialités de l’image et du son dans la recherche en sciences sociales, dans la restitution d’une situation interactive. Il ne s’agissait pas d’illustrer des hypothèses mais de faire parler le terrain, compte tenu de nos connaissances accumulées, y compris en recherchant des lieux et des situations en fonction de celles-ci. Ainsi, ne penser une recherche qu’en termes de méthode inductive ou déductive constitue une vision qui nous paraît « sectaire » en ce qu’elle omet la double complexité de notre rapport au savoir et au terrain. Notre approche peut ressembler à une méthode inductive, or elle repose sur un long travail de terrain et un important travail théorique sur l’affirmative action et sur les droits civiques aux États-Unis, lequel a pu nous conduire à nous intéresser à ce qui peut apparaître seulement comme un « événement ». La seule approche hypothético-déductive (et déterministe dans ses absolus) a pu être considérée comme vraie ou « juste » à un moment de l’histoire des sciences sociales, mais il nous semble important de ne pas sombrer dans un autre intégrisme où le terrain s’offrirait à nous, totalement, pour nous proposer des solutions, sinon des savoirs sur le monde qui nous entoure.

Place et rôle de l’interactionnisme

Le troisième débat épistémologique traite des relations étroites qu’entretient la sociologie filmique avec l’interactionnisme.

Notre démarche questionne la nécessité perçue « d’aller ailleurs », de passer par d’autres processus de connaissance. Ce qui nous a conduit vers des courants sociologiques traitant des rapports sociaux sans négliger les relations interindividuelles, voire s’appuyant sur celles-ci. Quels sont alors les éléments constitutifs de la proximité entre sociologie filmique et interactionnisme ? Erving Goffman a exposé le fait que la parole est toujours accompagnée de signes corporels et à quel point il est difficile de rendre compte, par l’écrit, de la vie sociale dans la richesse de ses détails et plus précisément des échanges interindividuels. Il écrit :

Personne n’ignore que, lorsqu’un individu en présence d’autrui répond à un événement, les coups d’oeil qu’il lance, ses regards, ses changements de position sont porteurs de toutes sortes de significations, implicites et explicites. Et si des mots sont prononcés, le ton de la voix, la manière de la reprise, les redémarrages, la localisation des pauses [...]. Et de même, la manière d’écouter. [...] Ainsi, il est possible de parler de ce qu’ont fait ou feront des individus avec un petit répertoire d’allusions et de simulations. Les romanciers et les acteurs ne font qu’étendre ces capacités ordinaires, que porter l’aptitude à la réévoquer au-delà de ce que sait faire le reste du monde. Mais il s’agit toujours d’esquisses.

Aussi, Goffman énonce-t-il sa problématique dès l’avant-propos de Façons de parler (1983, p. 7-8), en exprimant clairement la difficulté de décrire avec des mots des situations que l’approche interactionniste se propose de dissiper. L’écriture cinématographique de la sociologie peut-elle relever le défi des insuffisances que souligne l’approche goffmanienne ? C’est ce que nous tentons de réaliser à travers la capacité ou la vertu du caméscope à capter les détails des relations individuelles et des interactions en les conservant pour les travailler ensuite. Détails qui ont du sens, y compris dans leur mouvement, pour caractériser, interpréter, analyser les relations interindividuelles dans leur contenu autant que dans leur forme. On pourrait dire qu’avec cette captation, le caméscope peut resserrer l’attention sur les positions des corps, leur environnement, le détail des mains ou de leur jeu, les regards, les caractéristiques physiologiques, sentimentales des protagonistes jusqu’à par exemple dévoiler les appartenances sociales et les caractères. Les expressions, les rictus des visages en disent long, voire plus que le contenu des paroles échangées. On pourrait parler de connotation, qui ajoute à la dénotation (c’est-à-dire ce qui est expressément dit) pour reprendre le vocabulaire de Roland Barthes (1967), afin de définir la richesse de l’enregistrement.

Le caméscope recueille aussi les voix avec leur ton, la vitesse d’élocution, le niveau sonore, l’accent national ou régional, les emphases, les hésitations, les formes de langage, les hésitations, etc. Ainsi, le son révèle plus que ne peut le faire le texte écrit (sauf chez les grands auteurs…), tels la retenue ou la réserve dans l’expression, les sentiments à peine perceptibles. La complémentarité image/son (vue et ouïe) peut forcer l’émergence des non-dits. Le caméscope enregistre tous les éléments de paralangage, chers aux linguistes, qui enrichissent leurs analyses de ce qui est énoncé par le verbe. D’une certaine manière, cet instrument « grossit » par l’image et par le son ce que l’on perçoit sans nécessairement en avoir conscience. En ce sens, il est un outil pour le décodage des interactions qui donne un élan à la sociologie filmique ; il est un instrument pour exposer les instants éphémères.

Par la sociologie filmique et en empruntant à l’interactionnisme, notre projet est bien de filmer l’imperceptible ou ce qui est à peine perceptible, qui caractérisent tant les rapports sociaux et les interactions rapidement invisibilisées. Jean-Luc Godard répétait, « il y a le visible et l’invisible. Si vous ne filmez que le visible, c’est un téléfilm que vous faites. » Ce sont des constats qui nous renvoient à la phénoménologie de Merleau-Ponty qui fait de la perception un élément privilégié de la connaissance (voir aussi ci-dessous Rudolf Arnheim). Stefen Kristensen défend, selon Achille Papakontantis, une position godardienne d’une synthèse entre le cinéma godardien et la phénoménologie,

« le dispositif cinématographique [serait] une sorte de subjectivité augmentée » [et] un dispositif qui inclut à la fois la machinerie à proprement parler (« le dispositif technique ») et la représentation (« ce qui est donné à voir ») qui vise un certain effet sur le spectateur (lui faire part de la production des relations entre images et sons toujours dans le sens d’une pédagogie de la perception) et qui entre en relation avec d’autres dispositifs.

Papakontantis, 2014, § 5

D’où l’importance, parmi ces dispositifs, des rapports entre le champ et le hors-champ : le principe godardien veut que

le champ n’ait pas de sens propre et que c’est seulement par sa relation avec le hors-champ que ce dernier se produit. La relation — toujours en mouvement — prévaut sur ses termes pris séparément et c’est, par conséquent, la rencontre entre deux séries d’images qui divulgue le sens de leur devenir.

Papakontantis, 2014, § 9

Ces propositions correspondent à notre démarche dans ce film court. Ici, le hors-champ (l’esclavagisme) revient dans le champ (la manifestation suprémaciste) lorsque l’histoire rejoint le présent politique. Soit par la surimpression de nos images de la plantation avec les gravures du Ku Klux Klan, soit par la juxtaposition des drapeaux confédérés et de la contre-manifestation. C’est un hors-champ qui, grâce aux dispositifs de montage, revient dans le champ. Ainsi, c’est au montage que l’on se réapproprie le hors-champ, en lui donnant une visibilité par rapport au champ, ici à la fois par la surimpression et par la mise en résonance des plans de symboles nazis avec des images historiques.

C’est par une présence et une attention sans faille que se construit la possibilité de rendre compte des relations entre les sujets filmés pour atteindre, lors du tournage et au-delà dans le documentaire achevé, une situation caractéristique des travaux s’inspirant de l’interactionnisme. De ce fait, la perception largement fondée sur la construction du regard peut dépasser la simple observation des seules interactions pour participer à la visibilisation des structures sociales, à leurs influences sur celles-ci et aux facteurs explicatifs des comportements et des valeurs. Daniel Vander Gucht considère ainsi que « la mission de la sociologie n’est pas d’informer mais d’expliquer » (2017, p. 106). Si l’interactionnisme (en particulier dans ses interprétations françaises) tend à faire éclater les structures sociales en microstructures ou en interactions, avec une production endogène du sens des actions, la sociologie filmique doit aussi traiter de thèmes et d’objets qui dépassent les préoccupations d’une microsociologie. En ce sens, elle diverge d’une vision réductrice de l’interactionnisme tout en s’y reconnaissant proche par le biais de ses emprunts. Car, en même temps, elle doit faire advenir par le choix des images et des sons, par la narration, par le rythme adopté et donc par le montage, une réflexion des spectateurs les amenant à interroger le pourquoi des choses. Les différences de trajectoires sociales, de statuts, d’expériences individuelles, mais aussi de sensibilité aux images/sons des spectateurs et spectatrices les conduisent à interpréter diversement les situations et les faits sociaux exposés dans les films (sociologiques ou non). Mettre en débat les propositions énoncées par les films réalisés fait partie de la démarche que nous avons adoptée en sociologie filmique.

4. peut-on penser par l’image ?

Dans Les statues parlent aussi, nous tentons de faire de l’image un médium essentiel de notre démarche sociologique ; nous disons essentiel, car le son joue aussi un rôle important (ailleurs, le son peut bien sûr être des entretiens). Ainsi, la tentative de la sociologie filmique de faire jouer un rôle important à l’image soulève nécessairement un débat. Selon la tradition, en particulier occidentale, la parole est la première à conduire au texte, dans des cultures monothéistes fondées sur le Livre. Des auteurs essaient de redonner une place honorable à l’image. On pense à Régis Debray (1992) pour qui l’image prime certainement sur la parole chez le nouveau-né et combien elle est pertinente comme mode de connaissance du réel, si le processus de pensée intègre l’image et le sensible : « Penser l’image suppose en premier lieu qu’on ne confonde pas pensée et langage. Puisque l’image fait penser par d’autres moyens qu’une combinatoire de signes » (Debray, 1992, p. 47). De son côté, Rudolf Arnheim (1976) refuse de séparer la pensée et la perception du réel :

Si la pensée est à même d’utiliser le matériau perceptuel, c’est uniquement grâce à la perception, qui rassemble des types de choses, à savoir des concepts ; et qu’à l’inverse, l’esprit n’a d’aliment que dans la mesure où il emmagasine le matériau recueilli par les sens.

Arnheim, 1976, p. 10

Ainsi pour lui, la perception pense puisque les « activités cognitives désignées par le vocable “pensée”, loin d’être l’apanage de processus mentaux intervenant à un niveau bien au-dessus et au-delà de la perception, constituent les ingrédients fondamentaux de la perception elle-même » (Arnheim, 1976, p. 21).

Alors, la fonction essentielle des sens est rétablie et, pour nous ici, le rôle de l’image et des sons, pour donner à la photographie et au cinéma leur juste place dans la construction des connaissances (à côté de la parole et du texte). Les travaux de Georges Didi-Huberman se concentrent aussi sur la défense et l’illustration de l’image dans la connaissance et dans l’expression artistique. Il utilise, dans ses différents textes, trois expressions qui convergent : « les images pensent » (2009), ou bien « penser les images » (2023[10]) ou bien encore « penser par les images » (2006). Mais les images ne pensent pas ou ne nous font pas penser immédiatement. À partir de la domination historique du texte écrit en Occident, Georges Didi-Huberman souligne combien l’apprentissage du décryptage et de l’interprétation des images est nécessaire. En se référant à Lazslo Moholy-Nagy (1993) et à Walter Benjamin (1997), il écrit :

Les images ne nous disent rien, nous mentent ou demeurent obscures comme des hiéroglyphes tant qu’on ne prend la peine de les lire, c’est-à-dire de les analyser, de les décomposer, de les remonter, de les interpréter, de les distancier hors des « clichés linguistiques » qu’elles suscitent en tant que « clichés visuels ».

Didi-Huberman, 2009, p. 36

De plus, et c’est là toute sa démonstration sur France Culture en 2023, Didi-Huberman montre comment l’image travaille dans un autre registre que le texte et comment elle nous rapproche du sensible et des émotions. Ce qui, cependant, n’est pas univoque : les grands textes poétiques ou les romans peuvent faire vibrer nos sensibilités au même titre que des images. Mais si nous revenons à la sociologie et vers toutes les sciences humaines ou sociales, ou plus particulièrement à leur histoire, le texte occupe un statut particulier qui est celui de la raison et si possible de la démonstration rationnelle, rigoureuse, s’appuyant sur des concepts scrupuleusement construits. Pour nous, la sociologie filmique entend réconcilier ces deux modes de représentation du monde, sans d’ailleurs établir de hiérarchie entre la formulation par le texte et l’expression par l’image, mais plutôt en soutenant leur complémentarité. C’est d’ailleurs à partir de cette double entrée dans et par le documentaire sociologique, par leur complémentarité, que les spectateurs sont disposés et appelés à débattre des faits de société, maniant le sensible et le rationnel pour interpréter le réel.

Dans Les statues parlent aussi, le travail sur la mémoire se déroule de plusieurs manières. Au début, dans le « sanctuaire » grand ouvert de la statue de Lincoln, jeunes et vieux de tout le pays et d’ailleurs se photographient devant ou dans l’imposant mémorial : loin d’être muets, ils se livrent à des échanges de paroles qui font vivre ce lieu. Le discours de Lincoln gravé dans la pierre a des résonances actuelles : c’est celui qu’il a prononcé à Gettysburg en décembre 1863 quelques mois après la première défaite des Confédérés. Dans la première phrase, en image dans le film, il déclare : « Il y a quatre-vingt-sept ans, nos pères ont donné le jour sur ce continent à une nouvelle nation, conçue dans la liberté et attachée à l’idée que tous les hommes sont créés égaux. » La statue de Lincoln, assis tel un magistrat dominant son peuple (la statue est surplombante), rappelle la force d’un pays qui croit en sa révolution démocratique. L’image fixe exprime alors cette volonté de stabilité. Les bruissements de chaussures sur le marbre, les voix et les cris d’enfants qui résonnent entre les grands murs de pierre de cet immense hall rendent plus actuelle et vivante la présence de Lincoln.

Puis, l’émotion se conjugue à nouveau avec l’histoire : quatre Afro-Américains se tiennent par les épaules en lisant d’un même regard un slogan sur un monument : « Quitter les montagnes du désespoir pour le rocher de l’espérance ». Leur solidarité saute aux yeux (signalons que cette image n’a pas été mise en scène) sans que l’on ne sache immédiatement sur quel support s’inscrit la maxime. Les plans fixes suivants nous montrent la statue de Martin Luther King au visage paisible, convoquant la sensibilité des spectateurs par un simple effet de surprise. Unité de lieu (le National Mall (l’« Esplanade nationale ») de Washington), mais aussi convergence de pensée entre Abraham Lincoln et Martin Luther King dans son discours d’août 1963 devant la même esplanade, sur le rêve américain d’égalité entre tous les hommes, repris ici par le leader de la lutte pour les droits civiques des Afro-Américains. Les trois plans fixes au pied de l’immense statue de ce dernier font la transition dans le film entre le brouhaha du mémorial de Lincoln et la voix claire du discours de Martin Luther King, comme si Lincoln n’avait jamais été entendu.

À nouveau, l’obélisque et le plan d’eau du Mall font le lien avec l’histoire : l’eau devant le mémorial de Lincoln se fond avec l’eau tremblotante d’une plantation de Virginie. Le calme et la sérénité de la demeure cossue des planteurs marquent leur puissance et leur richesse. Dans une séquence suivante, ces dernières semblent s’évanouir devant le léger frémissement des eaux d’où surgit le passé de l’esclavage qui prend pour témoin le luxe et la quiétude de la maison de maître dont on imagine le faste des réceptions sous la varangue. L’étang adjacent à la demeure, dont les mousses espagnoles créent une certaine intimité en se reflétant sur la surface aquatique dans un léger clapotis. Le travail de surimpression des images de l’eau en mouvement les rend floues jusqu’à ce qu’elles ressemblent à des flammes. Au-delà du conflit entre ces deux principaux éléments de la nature (rappel de la Bible), c’est l’apparition lente des hommes du Ku Klux Klan en forme de flammes, justement, avec leurs longues robes blanches et leurs capuches pointues qui renvoie directement aux esclaves noirs que l’on a vus précédemment émerger pareillement des eaux tranquilles de l’étang. Ainsi, le décor est planté, d’une part, en renvoyant les esclaves au Ku Klux Klan et, d’autre part, en télescopant le présent (la maison de maître et l’étang en images couleur) avec le passé (en noir et blanc) pour nous dire que celui-ci n’est pas révolu.

Ces dernières séquences révèlent une recherche esthétique dans le montage. L’esthétique d’un documentaire sociologique participe de plusieurs effets : il propose d’abord une « accroche » au début du film avec un générique attractif présentant le thème de façon originale avec des images/sons très choisis ; l’esthétique contribue au maintien de l’attention sur des sujets quelquefois difficiles tout en confortant la thèse développée (Sebag et Durand, 2020). Cette recherche du discours iconique ne doit pas conduire à dénaturer le propos ; elle exige du documentariste qu’il se soumette à une rigueur morale. Elle s’inscrit à contre-courant de certains discours utilitaristes ou instrumentalistes sur l’image qui considèrent que la présence ou l’existence de l’image se suffit à elle-même, sans préoccupation de ses qualités esthétiques. Il ne s’agit pas non plus d’esthétisme qui pourrait transformer les significations premières des images. L’esthétique joue un rôle politique dans les processus de transmission de l’information et des connaissances, au sens d’accompagnement favorisant l’ouverture d’esprit par des juxtapositions et des présentations formelles qui questionnent. Faudrait-il reprendre et travailler de façon critique les intuitions de Theodor Adorno dans sa Théorie esthétique (1985) quand il propose de sortir du primat de la rationalité par un travail profond sur l’esthétique ?

Dans Les statues parlent aussi, le plan fixe du monument équestre du général Lee sert d’introduction à la manifestation avec la présence des policiers puis le brouhaha qui fait le lien avec celui du mémorial de Lincoln : en effet, le cinéma ou la vidéo, c’est aussi une bande son qui doit être travaillée… Ce vacarme n’est plus celui qui accompagnait la lecture du discours égalitariste de Lincoln, mais celui du conflit radical entre les partisans de la préservation de la statue du général sudiste considéré par les suprémacistes blancs comme le grand héros des Confédérés et ceux qui souhaitent la déboulonner. En 2017, le travail historique de construction de l’égalité entre les humains reste inachevé après le discours de Lincoln et celui de Martin Luther King qui, comme lui, nous regardait en face.

Nous utilisons à nouveau la surimpression pour dire que le passé n’est pas révolu : les drapeaux confédérés brandis par les suprémacistes durant la manifestation se confondent avec ceux des gravures relatant la guerre de Sécession plus de 150 ans auparavant. Ces images marquent la permanence de l’histoire, en particulier dans sa violence sociale. Pour filmer, nous avions choisi d’être sur la « ligne de front » en un point légèrement surélevé, un talus autour d’un arbre, tout en nous adossant à celui-ci pour ne pas trop bouger avec le téléobjectif de la caméra et pour ne pas être surpris par un mouvement de foule venant de l’arrière. Car, le spectateur le voit bien sur les images, la ligne d’affrontement bouge sans cesse avec une grande confusion dans les mouvements des uns et des autres : les grilles de la police séparant les belligérants sont tombées et chacun les enjambe selon les avancées ou le recul de son groupe.

L’affrontement a lieu aussi par l’écrit des banderoles plus que par des slogans criés par les manifestants. Au grand calicot des suprémacistes « DESTRUCTION OF HERITAGE IS GENOCIDE[11] », répondent les mots d’ordre « NO SHRINE TO WHITE SUPREMACY. TAKE THEM DOWN NOW[12] » et « BLACK LIBERATION NOW » sur fond vert. En prenant le temps d’analyser les images, le spectateur est saisi par la très forte participation des Blancs du côté des contre-manifestants par rapport à la faible participation des Afro-Américains, dans une manifestation anti-suprémaciste et antiraciste : il est probable que les explicitations d’un texte ne marqueraient pas le lecteur autant que ces images.

Ainsi, et contrairement à des représentations simplifiées, l’affrontement a lieu d’abord autour des idées d’égalité entre les humains. La présence majoritaire des Blancs dans cette ville à l’université prestigieuse[13], ceux auxquels faisait déjà allusion Martin Luther King, prolonge son discours de 1963 :

Le merveilleux esprit militant qui a saisi la communauté noire ne doit pas nous entraîner vers la méfiance de tous les Blancs, car beaucoup de nos frères blancs, leur présence ici aujourd’hui en est la preuve, ont compris que leur destinée est liée à la nôtre. L’assaut que nous avons monté ensemble pour emporter les remparts de l’injustice doit être mené par une armée biraciale. Nous ne pouvons marcher tout seul au combat. Et au cours de notre progression, il faut nous engager à continuer d’aller de l’avant ensemble[14].

Puis le départ des manifestants suprémacistes est l’occasion de voir s’exprimer encore plus clairement les oppositions. Ceux-ci arborent des symboles nazis, des tenues militaires de combat avec fusils-mitrailleurs, ils partent en file indienne sous la protection presque invisible des policiers tandis qu’en face, les antiracistes essentiellement blancs renouent avec les fleurs des hippies ou les mots d’ordre contre l’ignorance, fondement du suprémacisme selon eux. Une pancarte cite Emma Goldman, intellectuelle libertaire, qui affirmait le rôle central de la connaissance dans les luttes. Pourtant, les images et slogans criés des antiracistes soulignent leur fragilité relativement à une violence qui tuera une contre-manifestante et blessera une vingtaine de personnes, tandis que l’hélicoptère de surveillance de la police s’écrasera avec deux policiers à son bord, scène mettant fin au film.

conclusion

Le montage de ce film court relève d’une approche expérimentale dans nos pratiques de la sociologie filmique dans le sens où il ne contient pas d’entretiens, ni sous-titrage, ni musique et encore moins de voix hors champ. Il montre la puissance des images/sons pour restituer le réel et tenter de l’expliquer par un retour sur l’histoire et sur le contexte de l’action. Par ailleurs, nous conservons un souci de l’esthétique des images, des sons et du montage, y compris dans les expérimentations, comme ici avec les surimpressions : les sociologues-cinéastes souhaitent en général laisser libre cours à leur créativité, voire au hasard des matériaux quand ils sont de bonne qualité et qu’ils entrent dans le projet, même a posteriori. C’est dire que le sociologue-cinéaste est toujours en éveil et reste à l’affût de ce qui peut être enregistré pour satisfaire sa curiosité et étayer ou contredire une hypothèse en suspens. Il n’y a pas de paillasse pour les sciences humaines et leur laboratoire est celui de la vie de tous les jours.

Ainsi, parce que les humains sont capables de sentiments et de raisonnement, la sociologie filmique embrasse ce paradoxe de la pensée :

  • en choisissant des images/sons pour exprimer le sensible, les émotions qui sont toujours au coeur des actions sociales ;

  • tout en recourant à la rigueur de la démarche rationnelle et étayée (qui s’affirme comme scientifique dans notre métier) pour démonter les phénomènes sociaux, dévoiler ce qui est caché et si possible expliquer ce qui nous parvient dans les constats empiriques.

C’est dire qu’en sociologie filmique, il ne s’agit pas seulement d’enregistrer des faits, de recueillir des données empiriques, mais aussi (et surtout) de montrer par des images/sons (des documentaires) ce que les sociologues-cinéastes ont découvert grâce aux théories et à l’expérience qui les arment. Autrement dit, la sociologie filmique propose de ne pas s’en tenir à la surface des choses mais de chercher également les fondements des situations, des rapports sociaux, des interactions, etc., et de les exprimer par des images/sons structurés et montés en des documentaires sociologiques.

La tâche est ardue, le pari est ambitieux dans ce que nous avons dénommé l’hybridation (Sebag et Durand, 2020, p. 101) ou la mise en convergence du travail de la raison (le texte, l’écrit, la sociologie) avec le sensible (l’image/son, la parole, le cinéma), sans oublier l’esthétique