Alain Freudiger

Prouver et jouir : de la vidéosurveillance au « happy slapping »

Au mois d’août dernier, la commune vaudoise de Lutry¹ équipait ses préaux d’école de caméras de vidéosurveillance pour « lutter contre les incivilités ». Quelques semaines plus tard, fin octobre, deux adolescents se faisaient agresser dans une cour d’école lausannoise par d’autres jeunes qui filmèrent la scène avec leur téléphone portable². Quel lien entre ces deux événements ? A priori ils sont à l’opposé l’un de l’autre, mais la proximité spatiale (le préau d’école) et instrumentale (l’image enregistrée) appelle quelques réflexions.

Si « l’affaire » des caméras de vidéosurveillance de Lutry a rapidement pris de l’ampleur et nourri un vif débat sur plusieurs mois, ce débat portait surtout sur des aspects juridiques et sociologiques. Parallèlement, le phénomène que les médias ont baptisé « happy slapping », et qui consiste à agresser quelqu’un à plusieurs pendant qu’un des protagonistes filme la scène, a donné lieu à quelques analyses en tant que « phénomène de société ». Etonnamment, dans les deux cas, on a très peu parlé des images tournées, et pas du tout du fait qu’il s’agissait, justement, d’images. C’est pourtant une question centrale, qui engage la pensée et la liberté, comme le relève Marie-José Mondzain :

« L’image s’offre à la vue et en ce sens ne peut jamais tromper personne. L’image n’est trompeuse que lorsqu’on ne sait plus qu’il ne s’agit que d’une image et rien d’autre. Si le producteur iconique crée les conditions de séduction ou de terreur qui induisent la cécité, c’est-à-dire la croyance substantielle, alors se pose la question de la liberté du jugement face aux visibilités. »³

Dans ce contexte, s’intéresser de plus près à ces phénomènes peut s’avérer judicieux.

Dispositif de vidéosurveillance

Les caméras de vidéosurveillance de Lutry – tout comme leurs consœurs disposées en différents lieux publics de par le monde – procèdent d’un double fantasme, celui de tout voir⁴ – y compris la nuit grâce à l’infrarouge – et celui de tout archiver⁵. Symétriquement, le discours qui les légitime répond à une double prétention : premièrement la dissuasion, la présence de caméras étant censée prévenir le passage à l’acte de malfaiteurs potentiels⁶ ; deuxièmement, la preuve, l’enregistrement de l’acte malfaisant étant censé permettre de retrouver le coupable et de le confondre. Ces éléments croisés instituent un certain régime d’action, particulier au cinéma de vidéosurveillance, qui est la transformation rapide du mode actif en mode passif, ou du regard en vision. La dissuasion anticipe l’action, mais en refusant de l’initier, elle ne peut plus que la subir ; l’acte de prouver suit l’action et, préférant la constater qu’y réagir, se condamne à l’avoir subie. De la sorte, l’instance qui filme est immédiatement déniée comme sujet d’un regard pour être constituée en objet où vient s’inscrire une « vérité ».

Pourtant, loin d’occuper un point de vue neutre et sans importance, ces caméras ont été placées en des endroits précis, et la question de leur position est bien évidemment centrale. À Lutry (collège du Grand-Pont), la majorité des caméras est disposée contre le bâtiment scolaire principal (fig. 4), à une hauteur d’environ trois mètres, sur les quatre façades, avec néanmoins une bien plus grande concentration sur celle qui jouxte la cour de l’école (fig. 1-3). Le point de vue adopté est donc celui du bâtiment, et même, étant donné la hauteur, celui du premier étage. D’entrée de jeu, ces caméras de vidéosurveillance se placent donc « hors » de l’action et du terrain (la cour d’école) – ce qui confirme la passivité que nous avons noté – pour adopter une position en surplomb⁷ (fig. 5), assignant à l’école elle-même celle de « metteur en scène », de foyer immobile et de tache aveugle du dispositif.

Si l’on s’intéresse maintenant à la scène, force est de constater qu’elle est multiple, puisque les caméras sont braquées sur des espaces divers et même qu’elles découpent un espace identique selon des angles différents. La scène, en grande partie la cour de l’école, est ainsi filmée de trois côtés à la fois (quelques caméras sont fixées à des bâtiments connexes). À noter encore que la scène peut au besoin être éclairée par des spots (fig. 6) ; mais il ne s’agit pas ici de lumière : plutôt que de constituer un jeu entre l’obscur et le clair, l’ambition affichée est l’élimination de toute zone d’ombre.

Ainsi, loin d’être une robe sans couture⁸, le film que découpent les caméras est une couverture rapiécée tenant lieu d’habit neuf de l’empereur : à la fois transparente et couvrant tout le champ du réel, recomposée et intacte.

Film de vidéosurveillance

Le dispositif étant en place, que peut-on dire du « film »⁹ de vidéosurveillance ? On peut d’abord noter que, contrairement à la prétention première de tout archiver vingt-quatre heures sur vingt-quatre, il consiste toujours en un extrait : car tant qu’il ne se passe rien, le film est dénié (rushes à jeter). Si bien que, d’un point de vue économique, ce film est le moins rentable qui soit si l’on s’en tient au rapport entre ce qui est filmé et ce qui est utilisable. En effet, même à supposer que l’école de Lutry soit le terrain d’innombrables méfaits, sur vingt-quatre heures, la majorité du film serait dépourvue de la moindre péripétie et du moindre personnage.

En ce qui concerne la « mise en scène », elle se réduit au cadrage et au choix du décor (l’école, ici), le scénario étant laissé aux acteurs, tout comme le rythme. Le découpage tient au fait qu’il y a plusieurs caméras simultanément, mais il n’est pas organisé en articulations logiques. De même, il n’y a pas de montage, mais une sorte de para-montage qui consiste en l’alignement des différents moniteurs avec leurs points de vue dans la salle de surveillance. Ainsi, le « film » de Lutry, visible au commissariat, est constitué d’un split-screen de six images (trois en haut et trois en bas), toutes en plan fixe et en plongée¹⁰. C’est alors le regard du surveillant-spectateur qui constitue le montage, et pour lui seul – ce qui au fond n’est pas si différent du cinéma mainstream¹¹. Dans une telle mise en scène, la seule dynamique est celle qui sépare le champ du hors-champ ; mais ce hors-champ étant presque nié – par l’angle des caméras qui filment jusqu’à l’horizon, par l’éclairage, par la délimitation du périmètre – il ne reste pas grand-chose de cette potentialité. Sans compter que le film de vidéosurveillance est tout entier dans son instantanéité ; il est toujours déjà à l’écran, en direct, qu’il se passe quelque chose ou qu’il ne se passe rien – de la sorte, toutes les « séquences » sont des plans figés, et les « plans » d’interminables séquences.

Supposons un film (par exemple celui qui a enregistré l’action de vandalisme¹²) : qu’est-ce qu’on pourrait y voir ? Des gens entrent dans le champ, ils se dirigent vers les caméras. Il y a tension, suspense, incertitude : si la caméra ne procède à aucune construction, celui qui agit le fait et entre dans une narration et un rythme. Il entre aussi dans un film, car le protagoniste qui se trouve dans le champ de la caméra se sait devant elle et se comporte autrement qu’en l’absence de la caméra. Des graffitis sont tagués sur les murs lors de cette action : ils s’adressent aux élèves, mais on peut aussi bien, via la caméra, les rapprocher des cartons du cinéma muet. Puis les personnages sortent des sprays de peinture noire, s’approchent des caméras, et soigneusement les recouvrent¹³. On a alors quelque chose qui s’assimile à cette vieille grammaire du cinéma qu’est le fondu au noir ou la fermeture à l’iris¹⁴ – même si, dans le cas présent, avec l’intervention directe sur le matériau, on pourrait également rapprocher ce film de l’avant-garde ou du cinéma expérimental.

Néanmoins, si le « film » de vidéosurveillance échappe en partie à ses surveillants, c’est toujours dans le lieu choisi par eux. A ce stade il est déjà possible de dire que ce « cinéma » est obnubilé par l’Espace, mais n’a aucune conscience du Temps. Le « temps réel » est sa seule préoccupation, et le rewind constitue ici non un rapport au temps mais une citation à comparaître, chargée de rendre présent ce qui est passé et de répéter ce qui n’a eu lieu qu’une fois. Le film lui-même disparaît alors totalement et ce que le surveillant regarde et croit voir, c’est la chose. Cette transparence est au centre du rapport aux images construit par la vidéosurveillance.

Agressions filmées

Filmer un passage à tabac avec un téléphone portable se rapproche apparemment de ce qu’on appelle le snuff movie¹⁵. Cependant, il y a une différence de taille : l’outil n’est pas indifférent, et filmer avec un téléphone implique toujours déjà la diffusion¹⁶. Ce qui résulte d’une telle pratique est plutôt une séquence qu’un film, tout comme la vidéosurveillance trouve finalement sa forme dans l’extrait-séquence. D’ailleurs, le succès de Youtube n’a-t-il pas entériné le devenir-séquence, voire le devenir-diffus, de tout film ?

Les conditions techniques du « happy slapping » et le cadre dans lequel il se déroule impliquent plusieurs choses. Tout d’abord, que si l’enregistrement n’avait pas lieu, l’acte lui-même n’aurait sans doute pas lieu non plus, contrairement à l’illusion qu’essaie de donner le film¹⁷. Ensuite, que celui qui filme est tout à la fois scénariste, acteur, chef opérateur, réalisateur et diffuseur. Evidemment, ce cumul de positions consiste plutôt en une absence de position : paradoxalement, il y a fuite complète du regard qui ne prend pas position. Tout est centré sur la victime, il faut qu’elle soit visible, mais nier que cette visibilité nécessite un dispositif et un regard. Le regard est ainsi immédiatement relégué dans le passif (enregistrer) et absorbé dans l’actif (frapper) – nulle place ne lui est plus laissée¹⁸. Il n’y a pas de montage, le côté « pris sur le vif » étant censé garantir par la transparence la vérité du document et de l’action.

Les films tournés dans ces conditions de violence – violence filmée, mais aussi bien violence dans le fait de filmer – impliquent aussi, à un niveau esthétique, l’« amateurisme » : des images sautantes, un son de piètre qualité, un cadrage approximatif et bien souvent l’obstruction du champ de vision par un corps ou un membre tiers. C’est là un point important. Dans ce type de « film », le hors-champ est jugé sans intérêt et construit comme tel, sans rapport dynamique entre le visible et l’invisible. L’obstruction ou l’obscurité gâche l’effet, car ce type de cinéma nie la dimension symbolique et prétend tout montrer.

Si la vidéosurveillance est obnubilée par l’espace, le « happy slapping » l’est par le temps : à la présence partout spatialisée des caméras répond le présent toujours disponible du téléphone portable. Cela tient en partie à certaines contraintes du « genre » : il faut à la fois filmer vite et durer, avant que l’action ne se termine ou qu’une circonstance extérieure n’y mette un terme. Cela dans le but d’obtenir une durée suffisante pour constituer un « clip » à diffuser ensuite sur Internet ou à transmettre à des complices comme « preuve » de l’acte. D’où une impression que le film est « arraché » au réel, ce qui renforce sa violence et son apparente vérité.

Mais finalement, qu’y voit-on ? Supposons un film, par exemple celui qui a été « tourné » dans ce préau d’école lausannois¹⁹ : sans doute, le début de la séquence est précipité, il n’y a pas d’introduction, les agresseurs intimident et cognent tout de suite. Une certaine confusion règne ; ce qui est en tout cas constamment visible ou perceptible, c’est la violence (comme rapport exercé). Le son supplée spectaculairement l’image, d’autant plus que, saturant rapidement dans les aigus, il renforce l’impression de violence. Le spectateur a l’impression de voir quelqu’un se faire rouer de coups, pas de voir un film : en même temps qu’un certain flou, il y a donc, paradoxalement, transparence. Etablissant un rapport de violence redoublée, l’agression filmée dénude son objet jusqu’au dernier degré pour y chercher la vérité. En adhérant ainsi totalement à l’équation visible = vrai, elle rejoint la vidéosurveillance.

Similitudes

Nous pouvons maintenant nous intéresser au rapprochement entre ces deux phénomènes. Si quelqu’un se fait passer à tabac dans la cour d’école de Lutry, il sera filmé ; les surveillants auront donc à leur disposition un film assez similaire à celui d’un « happy slapping ». Et comme, malgré toutes les précautions, il n’est pas exclu que ce qui est filmé par la vidéosurveillance se retrouve un jour sur Internet, la jonction avec le « happy slapping » est achevée. A l’inverse, si la police attrape les auteurs d’une agression filmée, comme ce fut le cas dans notre fait divers lausannois, le film, fonctionnant comme preuve du délit, en vient à se confondre avec un film issu de caméra de vidéosurveillance…

Ce rapprochement, pour forcé qu’il soit ici, n’est pas dépourvu de pertinence : il n’y a au fond pas de différence dans le rapport à l’image entre l’agresseur-filmeur et le vidéosurveillant²⁰. Même si les films paraissent différents, ce qui régit les deux cas est une croyance en la transparence, en la toute-puissance des images qui remplacent la liberté du regard par la « vérité » du visible. Vidéosurveillance et « happy slapping » sont les deux faces d’une même pièce. Tous deux visent à produire techniquement la vérité dans un rapport de violence en ne laissant aucune marge à l’image.

Dans l’un des cas, le principal ennemi est le hors-champ externe (l’échappée), dans le second, le hors-champ interne (l’obstruction) ; mais le rapport au visible est le même, il prétend être immédiat et sans envers. Dans les deux cas, l’absence de montage se veut garante de vérité. Quant à la position, dans le dispositif, de celui qui filme, que ce soit le flic ou le voyou, elle est problématique : est-il filmeur ou spectateur ? A la confusion « incestueuse » de la place répond la confusion entre l’image et la vérité. À cela s’ajoute le fait que, dans les deux cas, le film n’existe que parce qu’il y a violence (sinon il est détruit dans un cas, non tourné ou non diffusé dans l’autre). Dans les deux cas, il n’est ensuite utilisé que s’il est « clair ». En outre, dans les deux cas, on part du principe que le rôle de l’actant (coupable ou victime) est écrit d’avance. En effet, ces dispositifs, non contents de prendre l’image pour la chose, créent en plus l’image de toute pièce : dans le cas du « happy slapping » c’est évident, mais dans le cas de Lutry, depuis la pose des caméras de vidéosurveillance, les seuls délits répertoriés aux abords du collège ont été dirigés… contre les caméras !

Au fond, ce sont des films où l’on ne voit littéralement rien, parce que ce qu’il y a à voir est déjà pris dans un champ de signification défini et préétabli : prouver, par l’assimilation du visible au vrai ; jouir, par la transparence qui efface la distance avec l’objet. Les deux « genres » visent ainsi l’obtention d’une image dégradée ou avilie de l’objet du film et, de fait, transforment tout filmé en victime du film. Le film lui-même devient donc l’arme de deux sujétions circulaires : si la vidéosurveillance ambitionne de tout couvrir (force centrifuge, être au centre et couvrir tous les points du cercle), le « happy slapping » prétend tout envelopper (force centripète, être tout autour du même centre). Tous deux se répondent absolument. Si bien que l’injonction-slogan que l’on retrouve sur un bon nombre de caméras de surveillance : « Souriez, vous êtes filmés », résonne étrangement avec le « Joyeux tabassage » (happy slapping).

↑

¹ Le fait qu’il s’agisse de Lutry n’est évidemment pas un hasard. Comme le dit Gérard Dyens, chef de service : « Les caméras reflètent l’état d’esprit d’une commune. Dans une zone urbaine, le réseau social, les éducateurs et la police forment un tissu que n’ont pas les communes résidentielles, plus axées sur les villas. » (24 Heures, 15.08.2006). On peut aussi mettre ce fait en relation avec ce qu’écrit Michel Thévoz : « La petite cité lémanique de Lutry a été admise dans la dernière édition du Guinness Book pour un record mondial : 518 panneaux d’interdiction concentrés sur les deux hectares que représente le centre de la ville, auxquels s’ajoutent 310 panneaux aux abords de la plage, souvent enluminés, véritable encyclopédie illustrée des prohibitions auxquelles la baignade peut donner prétexte. » (Michel Thévoz, « La cité interdite », Le syndrome vaudois, Favre, Lausanne, 2002, p. 119.)

² 24 Heures, 1.11.2006.

³ Marie-José Mondzain, Le commerce des regards, Seuil, Paris, 2003, p. 25.

⁴ Cette jouissance de la vision totale est, à bien des égards, à rapprocher de la question du voyeurisme – omnipotence dérisoire comme le souligne François Bovier : sur ce point, on lira notamment le dossier consacré à Fenêtre sur cour (Rear Window, Alfred Hitchcock, 1954) dans Décadrages, no 3, printemps 2004.

⁵ Les bandes sont censées être détruites après vingt-quatre heures, mais cela ne change rien au fait que, temporairement, tout aura été conservé en tant qu’archive.

⁶ Il est d’ailleurs piquant de constater que l’appareil qui a pour fonction de tout voir prétend en outre être vu. D’autant plus qu’il s’agit déjà d’une forme d’hypocrisie, puisque parallèlement on insiste souvent sur la discrétion desdites caméras. Ainsi de Lucien Chamorel, municipal de la police de Lutry : « Pour ma part, je préfère que mes enfants soient en sécurité […]. D’autant plus que cette surveillance est assez discrète et que seule la police peut visionner les bandes. », Le Matin, 16.08.2006.

⁷ Position qui rappelle celle du voisin délateur qui surveille de sa fenêtre : figure bien connue du cinéma (Rear Window, évidemment, mais plus souvent intégrée comme rôle secondaire dans des films policiers, d’espionnage ou de résistance), mais aussi des quartiers résidentiels suisses (système du neighborhood watch – à ce sujet, lire la satire intitulée « Les oisillons », dans Jacques-Etienne Bovard, Nains de jardin, Bernard Campiche, Orbe, 1996 (2004).

⁸ Je fais ici référence à André Bazin, qui opposa cette formule (« robe sans couture de la réalité ») aux particularités du cinéma (découpage, montage…) (Jean Renoir, Editions Gérard -Lebovici, Paris, 1989, p. 84).

⁹ Il est évidemment problématique d’utiliser la notion de « film » dans un tel cadre, mais qu’il nous soit permis de le faire dans cet article, en regard notamment des travaux de Gérard Genette sur la notion de texte : film pourrait alors désigner tout « texte » de nature audiovisuelle.

¹⁰ Il est sans doute possible de sélectionner les différents points de vue, de naviguer de l’un à l’autre, ou de s’adonner à d’autres opérations : les possibilités offertes et leur aspect interactif n’étant limités que par la technique ou par la loi.

¹¹ Je pense ici aux théories qui, à la suite d’Umberto Eco (Lector in fabula, Grasset, Paris, 1985), attribuent une place prépondérante au lecteur, ou en ce cas au spectateur, dans la construction du récit et du sens.

¹² « La semaine dernière, deux des quinze caméras surveillant le collège du Grand-Pont, à Lutry, ont été sprayées de peinture. Quelques tags ont signé l’attaque. […] Selon la police de Lutry, trois tags ont été retrouvés en guise de signature murale : ‹ Evadez-vous ! ›, ‹ Prison ›, ainsi qu’un logo de caméra. […] Le comble serait qu’aucune image des assaillants n’ait été enregistrée. Mais la police ne désespère pas de retrouver les coupables. ‹ Nous avons des images qui seront exploitables ›, affirme le commissaire Eugène Chollet, qui ne néglige pas la possibilité d’identifier les taggers lors de leurs repérages. » (24 Heures, 08.12.2006.)

¹³ A noter qu’ici on pourrait voir le film se dérouler selon un scénario préalable, si l’on se référait à l’appel boutade de l’avocat genevois Charles Poncet à taguer les caméras (sur les ondes de RSR – « La Première », 21.08.2006).

¹⁴ Ce rapport entre sprayage de caméra et fondu au noir n’a sans doute pas échappé à Aki Kaurismäki, dont le dernier film Les lumières du faubourg (Laitakaupungin valot, 2006) met précisément en scène un tel geste – et Kaurismäki demeure l’un des cinéastes actuels les plus proches du cinéma muet et de ses codes.

¹⁵ Le terme de snuff movie apparaît au milieu des années 1970 pour désigner des films clandestins contenant les images de sévices et de meurtres censément réels. Ces films faits de brutalité et de violence semblent destinés à des amateurs demandeurs. L’existence de ces films est toutefois discutée, certains considérant qu’il s’agirait principalement d’une légende urbaine (source Wikipédia).

¹⁶ Au passage, il est intéressant de noter que ce cinéaste décrié, fils illégitime de Brian de Palma et de Clint Eastwood, qu’est Joel Schumacher, a peut-être senti la proximité de ces questions : il a abordé à la fois le snuff movie (8mm, 1999) et la question du téléphone (Phone Booth, 2002).

¹⁷ Cette logique se révèle finalement proche de celle qui régit, outre le snuff movie, le cinéma pornographique – la jonction entre les deux genres s’opérant d’ailleurs d’elle-même quelques mois plus tard avec les faits divers de viols collectifs filmés qui remplacent ceux dont nous parlons à la une des médias suisse romands (affaires de Rhäzüns, de Steffisburg et de Seebach) : « SONDAGE. Les viols collectifs par des mineurs sont le fait le plus marquant de l’année », Le Temps, 28.12.2006).

¹⁸ D’autant plus que, comme dans le cas mentionné, le prétexte souvent invoqué par les agresseurs pour se justifier est un simple regard…

¹⁹ « Un groupe de quatre adolescents, âgés entre 14 et 15 ans, faisait du skateboard dans le préau du collège. Quatre autres jeunes de 13 à 17 ans les ont alors apostrophés, selon la police municipale. Les agresseurs ont alors commencé à humilier et menacer les skateurs en sortant un couteau. Ils sont ensuite passés aux mains en frappant deux membres de l’autre groupe. Les assaillants se sont alors particulièrement acharnés sur une de leurs proies, la rouant de coups de pied à la tête et dans le ventre. […] Interpellés en moins de 24 heures, les auteurs du happy slapping n’auront cette fois pas eu le temps de mettre leur film sur Internet. » (24 Heures, 1.11.2006.)

²⁰ D’ailleurs, le phénomène du « happy slapping » vient de Grande-Bretagne, et ce pays détient le record du nombre de caméras de surveillance par habitant : 14 (voir l’article de Philippe Miauton, « Les caméras sont partout », Le Temps, 30.08.2006). Notons encore que la Grande-Bretagne est également le pays de George Orwell et du Big Brother de 1984. Y aurait-il quelque résurgence du puritanisme anglo-saxon derrière cette obsession de tout voir ?