Prouver et jouir : de la vidéosurveillance au « happy slapping »
Au mois d’août dernier, la commune vaudoise de Lutry1 équipait ses préaux d’école de caméras de vidéosurveillance pour « lutter contre les incivilités ». Quelques semaines plus tard, fin octobre, deux adolescents se faisaient agresser dans une cour d’école lausannoise par d’autres jeunes qui filmèrent la scène avec leur téléphone portable2. Quel lien entre ces deux événements ? A priori ils sont à l’opposé l’un de l’autre, mais la proximité spatiale (le préau d’école) et instrumentale (l’image enregistrée) appelle quelques réflexions.
Si « l’affaire » des caméras de vidéosurveillance de Lutry a rapidement pris de l’ampleur et nourri un vif débat sur plusieurs mois, ce débat portait surtout sur des aspects juridiques et sociologiques. Parallèlement, le phénomène que les médias ont baptisé « happy slapping », et qui consiste à agresser quelqu’un à plusieurs pendant qu’un des protagonistes filme la scène, a donné lieu à quelques analyses en tant que « phénomène de société ». Etonnamment, dans les deux cas, on a très peu parlé des images tournées, et pas du tout du fait qu’il s’agissait, justement, d’images. C’est pourtant une question centrale, qui engage la pensée et la liberté, comme le relève Marie-José Mondzain :
« L’image s’offre à la vue et en ce sens ne peut jamais tromper personne. L’image n’est trompeuse que lorsqu’on ne sait plus qu’il ne s’agit que d’une image et rien d’autre. Si le producteur iconique crée les conditions de séduction ou de terreur qui induisent la cécité, c’est-à-dire la croyance substantielle, alors se pose la question de la liberté du jugement face aux visibilités. »3
Dans ce contexte, s’intéresser de plus près à ces phénomènes peut s’avérer judicieux.
Dispositif de vidéosurveillance
Les caméras de vidéosurveillance de Lutry – tout comme leurs consœurs disposées en différents lieux publics de par le monde – procèdent d’un double fantasme, celui de tout voir4 – y compris la nuit grâce à l’infrarouge – et celui de tout archiver5. Symétriquement, le discours qui les légitime répond à une double prétention : premièrement la dissuasion, la présence de caméras étant censée prévenir le passage à l’acte de malfaiteurs potentiels6 ; deuxièmement, la preuve, l’enregistrement de l’acte malfaisant étant censé permettre de retrouver le coupable et de le confondre. Ces éléments croisés instituent un certain régime d’action, particulier au cinéma de vidéosurveillance, qui est la transformation rapide du mode actif en mode passif, ou du regard en vision. La dissuasion anticipe l’action, mais en refusant de l’initier, elle ne peut plus que la subir ; l’acte de prouver suit l’action et, préférant la constater qu’y réagir, se condamne à l’avoir subie. De la sorte, l’instance qui filme est immédiatement déniée comme sujet d’un regard pour être constituée en objet où vient s’inscrire une « vérité ».
Pourtant, loin d’occuper un point de vue neutre et sans importance, ces caméras ont été placées en des endroits précis, et la question de leur position est bien évidemment centrale. À Lutry (collège du Grand-Pont), la majorité des caméras est disposée contre le bâtiment scolaire principal (fig. 4), à une hauteur d’environ trois mètres, sur les quatre façades, avec néanmoins une bien plus grande concentration sur celle qui jouxte la cour de l’école (fig. 1-3). Le point de vue adopté est donc celui du bâtiment, et même, étant donné la hauteur, celui du premier étage. D’entrée de jeu, ces caméras de vidéosurveillance se placent donc « hors » de l’action et du terrain (la cour d’école) – ce qui confirme la passivité que nous avons noté – pour adopter une position en surplomb7 (fig. 5), assignant à l’école elle-même celle de « metteur en scène », de foyer immobile et de tache aveugle du dispositif.
Si l’on s’intéresse maintenant à la scène, force est de constater qu’elle est multiple, puisque les caméras sont braquées sur des espaces divers et même qu’elles découpent un espace identique selon des angles différents. La scène, en grande partie la cour de l’école, est ainsi filmée de trois côtés à la fois (quelques caméras sont fixées à des bâtiments connexes). À noter encore que la scène peut au besoin être éclairée par des spots (fig. 6) ; mais il ne s’agit pas ici de lumière : plutôt que de constituer un jeu entre l’obscur et le clair, l’ambition affichée est l’élimination de toute zone d’ombre.
Ainsi, loin d’être une robe sans couture8, le film que découpent les caméras est une couverture rapiécée tenant lieu d’habit neuf de l’empereur : à la fois transparente et couvrant tout le champ du réel, recomposée et intacte.
Film de vidéosurveillance
Le dispositif étant en place, que peut-on dire du « film »9 de vidéosurveillance ? On peut d’abord noter que, contrairement à la prétention première de tout archiver vingt-quatre heures sur vingt-quatre, il consiste toujours en un extrait : car tant qu’il ne se passe rien, le film est dénié (rushes à jeter). Si bien que, d’un point de vue économique, ce film est le moins rentable qui soit si l’on s’en tient au rapport entre ce qui est filmé et ce qui est utilisable. En effet, même à supposer que l’école de Lutry soit le terrain d’innombrables méfaits, sur vingt-quatre heures, la majorité du film serait dépourvue de la moindre péripétie et du moindre personnage.
En ce qui concerne la « mise en scène », elle se réduit au cadrage et au choix du décor (l’école, ici), le scénario étant laissé aux acteurs, tout comme le rythme. Le découpage tient au fait qu’il y a plusieurs caméras simultanément, mais il n’est pas organisé en articulations logiques. De même, il n’y a pas de montage, mais une sorte de para-montage qui consiste en l’alignement des différents moniteurs avec leurs points de vue dans la salle de surveillance. Ainsi, le « film » de Lutry, visible au commissariat, est constitué d’un split-screen de six images (trois en haut et trois en bas), toutes en plan fixe et en plongée10. C’est alors le regard du surveillant-spectateur qui constitue le montage, et pour lui seul – ce qui au fond n’est pas si différent du cinéma mainstream11. Dans une telle mise en scène, la seule dynamique est celle qui sépare le champ du hors-champ ; mais ce hors-champ étant presque nié – par l’angle des caméras qui filment jusqu’à l’horizon, par l’éclairage, par la délimitation du périmètre – il ne reste pas grand-chose de cette potentialité. Sans compter que le film de vidéosurveillance est tout entier dans son instantanéité ; il est toujours déjà à l’écran, en direct, qu’il se passe quelque chose ou qu’il ne se passe rien – de la sorte, toutes les « séquences » sont des plans figés, et les « plans » d’interminables séquences.
Supposons un film (par exemple celui qui a enregistré l’action de vandalisme12) : qu’est-ce qu’on pourrait y voir ? Des gens entrent dans le champ, ils se dirigent vers les caméras. Il y a tension, suspense, incertitude : si la caméra ne procède à aucune construction, celui qui agit le fait et entre dans une narration et un rythme. Il entre aussi dans un film, car le protagoniste qui se trouve dans le champ de la caméra se sait devant elle et se comporte autrement qu’en l’absence de la caméra. Des graffitis sont tagués sur les murs lors de cette action : ils s’adressent aux élèves, mais on peut aussi bien, via la caméra, les rapprocher des cartons du cinéma muet. Puis les personnages sortent des sprays de peinture noire, s’approchent des caméras, et soigneusement les recouvrent13. On a alors quelque chose qui s’assimile à cette vieille grammaire du cinéma qu’est le fondu au noir ou la fermeture à l’iris14 – même si, dans le cas présent, avec l’intervention directe sur le matériau, on pourrait également rapprocher ce film de l’avant-garde ou du cinéma expérimental.
Néanmoins, si le « film » de vidéosurveillance échappe en partie à ses surveillants, c’est toujours dans le lieu choisi par eux. A ce stade il est déjà possible de dire que ce « cinéma » est obnubilé par l’Espace, mais n’a aucune conscience du Temps. Le « temps réel » est sa seule préoccupation, et le rewind constitue ici non un rapport au temps mais une citation à comparaître, chargée de rendre présent ce qui est passé et de répéter ce qui n’a eu lieu qu’une fois. Le film lui-même disparaît alors totalement et ce que le surveillant regarde et croit voir, c’est la chose. Cette transparence est au centre du rapport aux images construit par la vidéosurveillance.
Agressions filmées
Filmer un passage à tabac avec un téléphone portable se rapproche apparemment de ce qu’on appelle le snuff movie15. Cependant, il y a une différence de taille : l’outil n’est pas indifférent, et filmer avec un téléphone implique toujours déjà la diffusion16. Ce qui résulte d’une telle pratique est plutôt une séquence qu’un film, tout comme la vidéosurveillance trouve finalement sa forme dans l’extrait-séquence. D’ailleurs, le succès de Youtube n’a-t-il pas entériné le devenir-séquence, voire le devenir-diffus, de tout film ?
Les conditions techniques du « happy slapping » et le cadre dans lequel il se déroule impliquent plusieurs choses. Tout d’abord, que si l’enregistrement n’avait pas lieu, l’acte lui-même n’aurait sans doute pas lieu non plus, contrairement à l’illusion qu’essaie de donner le film17. Ensuite, que celui qui filme est tout à la fois scénariste, acteur, chef opérateur, réalisateur et diffuseur. Evidemment, ce cumul de positions consiste plutôt en une absence de position : paradoxalement, il y a fuite complète du regard qui ne prend pas position. Tout est centré sur la victime, il faut qu’elle soit visible, mais nier que cette visibilité nécessite un dispositif et un regard. Le regard est ainsi immédiatement relégué dans le passif (enregistrer) et absorbé dans l’actif (frapper) – nulle place ne lui est plus laissée18. Il n’y a pas de montage, le côté « pris sur le vif » étant censé garantir par la transparence la vérité du document et de l’action.
Les films tournés dans ces conditions de violence – violence filmée, mais aussi bien violence dans le fait de filmer – impliquent aussi, à un niveau esthétique, l’« amateurisme » : des images sautantes, un son de piètre qualité, un cadrage approximatif et bien souvent l’obstruction du champ de vision par un corps ou un membre tiers. C’est là un point important. Dans ce type de « film », le hors-champ est jugé sans intérêt et construit comme tel, sans rapport dynamique entre le visible et l’invisible. L’obstruction ou l’obscurité gâche l’effet, car ce type de cinéma nie la dimension symbolique et prétend tout montrer.
Si la vidéosurveillance est obnubilée par l’espace, le « happy slapping » l’est par le temps : à la présence partout spatialisée des caméras répond le présent toujours disponible du téléphone portable. Cela tient en partie à certaines contraintes du « genre » : il faut à la fois filmer vite et durer, avant que l’action ne se termine ou qu’une circonstance extérieure n’y mette un terme. Cela dans le but d’obtenir une durée suffisante pour constituer un « clip » à diffuser ensuite sur Internet ou à transmettre à des complices comme « preuve » de l’acte. D’où une impression que le film est « arraché » au réel, ce qui renforce sa violence et son apparente vérité.
Mais finalement, qu’y voit-on ? Supposons un film, par exemple celui qui a été « tourné » dans ce préau d’école lausannois19 : sans doute, le début de la séquence est précipité, il n’y a pas d’introduction, les agresseurs intimident et cognent tout de suite. Une certaine confusion règne ; ce qui est en tout cas constamment visible ou perceptible, c’est la violence (comme rapport exercé). Le son supplée spectaculairement l’image, d’autant plus que, saturant rapidement dans les aigus, il renforce l’impression de violence. Le spectateur a l’impression de voir quelqu’un se faire rouer de coups, pas de voir un film : en même temps qu’un certain flou, il y a donc, paradoxalement, transparence. Etablissant un rapport de violence redoublée, l’agression filmée dénude son objet jusqu’au dernier degré pour y chercher la vérité. En adhérant ainsi totalement à l’équation visible = vrai, elle rejoint la vidéosurveillance.
Similitudes
Nous pouvons maintenant nous intéresser au rapprochement entre ces deux phénomènes. Si quelqu’un se fait passer à tabac dans la cour d’école de Lutry, il sera filmé ; les surveillants auront donc à leur disposition un film assez similaire à celui d’un « happy slapping ». Et comme, malgré toutes les précautions, il n’est pas exclu que ce qui est filmé par la vidéosurveillance se retrouve un jour sur Internet, la jonction avec le « happy slapping » est achevée. A l’inverse, si la police attrape les auteurs d’une agression filmée, comme ce fut le cas dans notre fait divers lausannois, le film, fonctionnant comme preuve du délit, en vient à se confondre avec un film issu de caméra de vidéosurveillance…
Ce rapprochement, pour forcé qu’il soit ici, n’est pas dépourvu de pertinence : il n’y a au fond pas de différence dans le rapport à l’image entre l’agresseur-filmeur et le vidéosurveillant20. Même si les films paraissent différents, ce qui régit les deux cas est une croyance en la transparence, en la toute-puissance des images qui remplacent la liberté du regard par la « vérité » du visible. Vidéosurveillance et « happy slapping » sont les deux faces d’une même pièce. Tous deux visent à produire techniquement la vérité dans un rapport de violence en ne laissant aucune marge à l’image.
Dans l’un des cas, le principal ennemi est le hors-champ externe (l’échappée), dans le second, le hors-champ interne (l’obstruction) ; mais le rapport au visible est le même, il prétend être immédiat et sans envers. Dans les deux cas, l’absence de montage se veut garante de vérité. Quant à la position, dans le dispositif, de celui qui filme, que ce soit le flic ou le voyou, elle est problématique : est-il filmeur ou spectateur ? A la confusion « incestueuse » de la place répond la confusion entre l’image et la vérité. À cela s’ajoute le fait que, dans les deux cas, le film n’existe que parce qu’il y a violence (sinon il est détruit dans un cas, non tourné ou non diffusé dans l’autre). Dans les deux cas, il n’est ensuite utilisé que s’il est « clair ». En outre, dans les deux cas, on part du principe que le rôle de l’actant (coupable ou victime) est écrit d’avance. En effet, ces dispositifs, non contents de prendre l’image pour la chose, créent en plus l’image de toute pièce : dans le cas du « happy slapping » c’est évident, mais dans le cas de Lutry, depuis la pose des caméras de vidéosurveillance, les seuls délits répertoriés aux abords du collège ont été dirigés… contre les caméras !
Au fond, ce sont des films où l’on ne voit littéralement rien, parce que ce qu’il y a à voir est déjà pris dans un champ de signification défini et préétabli : prouver, par l’assimilation du visible au vrai ; jouir, par la transparence qui efface la distance avec l’objet. Les deux « genres » visent ainsi l’obtention d’une image dégradée ou avilie de l’objet du film et, de fait, transforment tout filmé en victime du film. Le film lui-même devient donc l’arme de deux sujétions circulaires : si la vidéosurveillance ambitionne de tout couvrir (force centrifuge, être au centre et couvrir tous les points du cercle), le « happy slapping » prétend tout envelopper (force centripète, être tout autour du même centre). Tous deux se répondent absolument. Si bien que l’injonction-slogan que l’on retrouve sur un bon nombre de caméras de surveillance : « Souriez, vous êtes filmés », résonne étrangement avec le « Joyeux tabassage » (happy slapping).