Alain Boillat

L’œil d’Elephant : l’espace d’un regard

Cette étude envisage le film de Gus Van Sant à partir des théories de l’énonciation narrative, rediscutées à travers cet exemple singulier où le spectateur est convié – du moins en apparence – à adopter successivement, grâce à une « caméra subjective » dont on sonde toute l’ambiguïté, le point de vue de différents personnages. Ce contexte théorique permet de dévoiler certains mécanismes de l’organisation du film et les raisons de l’enraiement de l’identification aux figures de l’écran, fantômes qui semblent s’effacer devant une présence appuyée de la caméra rappelant qu’il s’agit avant tout d’un regard porté sur un fait divers, non d’une explication basée sur des phénomènes d’intériorisation psychologique. Elephant occupe à cet égard, comme l’auteur le montre ici, une position intermédiaire entre le film homonyme réalisé par Alan Clarke en 1989 pour la BBC et Bowling for Columbine de Michael Moore (2002). On y envisage la démarche du cinéaste de façon concrète, comme une manière d’arpenter un espace en prenant des personnages en « filature ».

Au plan narratif, Elephant (USA, 2003) de Gus Van Sant présente une structure éclatée, témoignant d’une attirance pour la périphérie d’un drame qui, durant les deux premiers tiers du film, se dessine avant tout en filigrane, à travers les virtualités dont se compose l’horizon d’attente du spectateur lorsqu’il y reconnaît les événements tragiques du lycée de Columbine¹. Les menues actions du quotidien sont mises en exergue dans la continuité de leur déroulement, au détriment de l’organisation causale d’actions nodales. S’il s’agit d’un récit « polyphonique » dédié à la « voix » (narrative)² d’un certain nombre de protagonistes identifiés dans des intertitres par la mention de leur prénom, les personnages nous sont toutefois montrés avec distance et peuvent être considérés comme faiblement construits en regard des canons usuels de la « psychologie du personnage » prônés par les « gardiens » du temple hollywoodien. Confrontant le spectateur à la pure extériorité de jeunes individus figurés comme des silhouettes errantes dont les pensées et motivations nous demeurent inaccessibles, Elephant semble faire usage de certains procédés communément associés à une volonté d’intériorisation – en particulier le flash-back et une technique de filmage que l’on pourrait considérer a priori comme parente de la « caméra subjective » – avec un régime flottant d’indifférence, de non-immersion dans l’action. Cette forme de distance n’est pas celle qu’instaure le deus ex machina du cinéma classique hollywoodien en régulant la transmission des informations narratives : paradoxalement, Van Sant se situe au plus près de ses personnages, si près que leur opacité foncière nous paraît manifeste. Le cinéaste met en évidence cette particularité de son cinéma lorsqu’il examine dans un entretien les raisons de l’échec de son remake du film Psychose (Psycho, Alfred Hitchcock, USA, 1960), qu’il compare à l’original :

« Le principal fossé tient à la relation aux personnages : lui [Hitchcock] en fait des objets soumis à une énorme tension, toujours croissante. Le public, alors, entre dans un rapport d’intensité à distance avec les personnages. Dans mes films, au contraire, c’est comme si je devenais moi-même le personnage […]. Les personnages que je filme, j’essaie de les regarder jusqu’au moment où je me confonds avec eux. »³

On pourrait croire en lisant ces propos que Van Sant prône une identification complète au personnage, mais il précise juste après qu’il est « un spectateur, un mateur », celui « qui regarde bouger des corps dans l’espace ». C’est dans le creux qui s’ouvre entre un rapport fusionnel au personnage et la conscience du statut voyeuriste de la caméra qu’il s’agit à notre sens d’aborder Elephant.

En premier lieu, les procédés qui fonctionnent supposément au bénéfice de l’intériorisation méritent d’être examinés de plus près. En effet, il faut remarquer que les retours en arrière n’endossent dans Elephant guère de fonction explicative, dans la mesure où leur amplitude est le plus souvent très faible (quelques heures, voire quelques minutes) et où leur insertion vise principalement à assurer un changement de piste narrative, à permettre qu’un personnage donné puisse être relayé par un autre en tant que « cible » du regard de la caméra (avant, pour la plupart d’entre eux, de devenir la cible des tueurs). Notons toutefois qu’une certaine hiérarchie est établie entre les protagonistes qui résulte en partie des modalités du flash-back. En effet, si chaque introduction d’un nouveau personnage (à l’exception de Benny) momentanément présenté comme « central » est accompagnée d’une analepse interne, l’unique retour en arrière remontant à une période antérieure à la journée du massacre est consacré aux (futurs) assassins, Eric et Alex⁴. Par conséquent, contrairement à ce qui fut fréquemment mis en évidence à la sortie d’Elephant afin de valoriser le film pour sa « finesse » par rapport au documentaire à thèse de Michael Moore (Bowling for Columbine, USA, 2002) sorti l’année précédente, le film de Van Sant n’est pas dépourvu de toute dimension explicative dans sa façon de nous conduire à la fusillade : les humiliations subies à l’école, l’absence totale de culture historique (patente dans les commentaires d’Alex et de son complice à propos d’un documentaire sur le nazisme diffusé à la télévision), l’influence néfaste des jeux vidéo, l’achat aisé d’armes via internet⁵ – couplé à une démission des adultes par rapport à leurs responsabilités de parents⁶ , voire le refoulement de l’homosexualité constituent autant de causes possibles du méfait⁷. Certes, ces différents aspects sont évoqués en passant, sans mise en exergue, ce qui contraste fortement avec la thèse unique à laquelle Moore subordonne l’intégralité de son film – celle qui consiste à voir dans le climat de peur et l’idéologie de l’autodéfense sciemment entretenus par les lobbys de l’industrie de l’armement la source des maux en question. Il faut néanmoins convenir que les tueurs bénéficient dans Elephant d’un traitement particulier visant à exposer leurs conditions de vie, alors que les autres personnages ne sont jamais montrés ailleurs qu’au lycée⁸.

Quant au filmage, caractérisé par de longs déplacement de l’appareil effectués à l’aide d’une steadicam (dont l’opérateur est parfois placé sur un chariot très mobiles), nous pourrions dire qu’il se rapproche de l’esthétique de la filature telle que la prônait le critique et scénariste italien Cesare Zavattini, l’un des principaux théoriciens du « néoréalisme » pour qui le cinéma devait prendre pour objet les moments quelconques du quotidien (en excluant toute morale) – on sait que Van Sant s’est réclamé pour Elephant de l’influence du film Jeanne Dielman de Chantal Akerman (Belgique/France, 1975)⁹ –, livrer un récit basé sur la seule filature (pedinamento), dans la durée, d’un personnage au gré de ses vagabondages et rencontres¹⁰. Cette dimension dédramatisante, quasi documentarisante se conjugue singulièrement dans Elephant avec un mode de captation qui emprunte certains procédés aux représentations « hyper-fictionnelles » des nouveaux médias dont l’essor est contemporain de la sortie du film¹¹. Gus Van Sant opère ainsi une fusion entre le cinéma dit « d’art et essai » et la culture de masse qui, nous le verrons, n’est pas sans conséquences sur le traitement du « point de vue ». Bien qu’il entende décrier les comportements déviants résultant de la consommation de nouveaux médias – les jeux vidéo sont présentés dans Elephant (ne serait-ce qu’en raison de la place qui leur est octroyée dans le développement du récit) comme un facteur d’aliénation de l’individu –, Gus Van Sant ne s’interdit paradoxalement pas d’en ingérer certaines composantes, comme il le fait pour l’ensemble de la culture médiatique dans laquelle il baigne.

Caméra arpenteuse et mosaïque cartographique

Les parcours présentés dans Elephant pour chacun des personnages individualisés ne sont pas prioritairement d’ordre narratif (on n’y trouve pas de clôture du récit, de processus de transformation de la caractérisation initiale, etc.) ni même sociologique (comme le serait l’étude de parcours de vie). Ils sont en fait appréhendés dans un sens tout à fait littéral : celui de la monstration, par l’image animée, d’un trajet effectué par un personnage – ce qui n’exclut pas que les attitudes de l’acteur/personnage en mouvement ou les lieux de départ et d’arrivée soient signifiants sur un plan sociologique. La dispersion, voire l’évanescence de potentiels foyers de focalisation est en quelque sorte compensée par un recentrement sur un espace-temps donné, arpenté en tous sens par les personnages et par l’appareil de prise de vues qui les prend en filature. En effet, les facettes de l’histoire racontée sont totalement chevillées à la topographie du lieu du fait divers, envisagé précisément dans la diversité et la banalité des actions qui le composent. L’importance de la configuration spatiale des lieux est d’ailleurs soulignée à plusieurs reprises dans le film : Alex effectue, un calepin à la main, des « repérages » dans le réfectoire (fig. 1), l’un des principaux lieux du massacre à venir ; il utilise ensuite, pour planifier le méfait et se concerter avec son complice, une représentation schématique de l’établissement scolaire, sorte de plan d’aménagement. A l’instar des tueurs, Van Sant cartographie l’espace du lycée pour mieux y déambuler au gré de longs déplacements réalisés à l’aide d’une steadicam. Ces mouvements d’appareil, aériens, sont à la fois fortement vectorisés par les allées ou couloirs, et flottants dans le rapport de proximité qu’ils entretiennent avec les personnages. En juxtaposant dans une même représentation les trajectoires de plusieurs protagonistes, le cinéaste quadrille le lieu du drame, ainsi que le suggère la mise en évidence, sur le plan plastique, de surfaces en damiers (comme le motif du plafond situé à l’arrière-plan du contrechamp sur Eric et Alex lorsqu’ils sont penchés sur le plan d’aménagement du lieu, répétant une dernière fois les phases de leur projet sanglant, fig. 2-3).

Il faut de plus noter que la police du comté de Jefferson a réalisé, pour reconstituer le déroulement de la fusillade du 20 avril 1999 au Lycée de Columbine, près d’une centaine de « schémas d’activité » (activity diagramms) qui rendent compte, à différents moments, de l’emplacement exact des deux tueurs Klebold et Harris, des victimes et des témoins, ainsi que des actions des différents acteurs du drame¹². Cette segmentation associée à des espaces spécifiques (les « crime scenes ») et son principe d’organisation de type topographique – chaque schéma est consacré à un sous-espace inscrit dans l’un des grands ensembles : l’extérieur et le parking, le niveau inférieur de l’immeuble, la cafétéria, la bibliothèque et le département des sciences – nous semblent également à l’œuvre dans la composition en mosaïque d’Elephant, qui constitue à cet égard une sorte de « simulateur », d’application en trois dimensions de ces instruments qui servent, par l’abstraction, à rendre le réel rétrospectivement lisible et appréhendable de façon panoptique¹³. Il est à ce titre significatif que l’édition MK2 du film sur support DVD ait opté pour un menu interactif organisé en fonction des parcours effectués par les différents personnages, le tracé de leurs déplacements apparaissant en couleur sur la reproduction, à l’écran, d’un croquis de la high school et de ses environs esquissé par Gus Van Sant, ainsi qu’en témoigne la signature du cinéaste apposée dans le bord droit de l’image (fig. 4-5). Cependant, la représentation spatiale d’Elephant ne tient pas de la vue aérienne en plongée sur l’établissement : Van Sant opte pour une approche immersive en filmant à hauteur d’homme, tandis que le ciel se présente comme l’horizon du regard.

Dans le rapport de police, les cartes constituent le pendant spatial d’une chronologie des faits établie avec une extrême minutie. Elle est présentée ainsi dans le document disponible sur le site de CNN :

« La chronologie a été mise à jour à de nombreuses reprises en fonction de l’obtention de nouvelles informations auprès des différentes sources. Le résultat se présente sous la forme d’une chronologie primaire [primary timeline] offrant un compte rendu sommaire des événements du 20 avril 1999 : les mouvements de Eric Harris, Dylan Klebold et des forces de police, l’organisation de la situation d’urgence et la couverture médiatique. Cette chronologie constitue la base d’une chronologie narrative [NARRATIVE timeline] plus détaillée et complète des événements qui est comprise dans le présent rapport. »¹⁴

La mise en scènes (au sens d’une série de crime scenes) proposée par Gus Van Sant s’inscrit dans une démarche similaire à l’établissement de la primary timeline évoquée dans ce rapport, qui se situe en deçà d’une opération de narrativisation. La compilation de sources provenant d’un grand nombre de témoins donne lieu dans Elephant à une structure polyphonique, suite d’éclairages fragmentaires qui dépendent de l’emplacement des protagonistes à un moment donné. Comparativement aux différents « acteurs » du drame mentionnés dans l’introduction de ce rapport, ce que Gus Van Sant nous donne à voir est très restreint : tout ce qui concerne les interventions extérieures – polices, médias, secours, etc. – est occulté au profit d’une vision de l’intérieur qui émane exclusivement des adolescents. En fait, on pourrait dire que le regard de la société sur l’événement est déplacé dans l’acte même de filmer (d’où, sans doute, ce mélange d’intériorisation et de mise à distance) : la « couverture médiatique » est ici prise en charge par le cinéma de fiction selon des procédures qui lui sont propres, notamment la création de personnages. La démarche du cinéaste – qu’il s’agit ici de concevoir de façon physique, comme un rythme de déplacement – est similaire à celle des tueurs qui entendent maîtriser l’espace et viser, apparemment au hasard et de façon désinvolte, ceux qui entrent dans leur champ de vision. A ce titre, Elephant actualise en quelque sorte dans sa genèse et son mode de filmage la coprésence que l’on trouve sur l’affiche de Bowling for Columbine (Michael Moore, 2002) d’une caméra et d’une arme à feu sur les épaules d’un cinéaste qui entend tirer à boulets rouges sur les défenseurs des lobbys de l’armement (fig. 6). D’ailleurs, cette association entre la prise d’images et l’industrie de l’armement, qui fut discutée dans ses fondements idéologiques par Paul Virilio à propos du cinéma¹⁵, peut être envisagée de façon plus large, notamment en termes d’archéologie des médias : du « fusil photographique » conçu par Etienne-Jules Marey¹⁶ en tant qu’instrument d’analyse du mouvement à la domination des jeux de tir dans les représentations « pixellisées » contemporaines, il y a sans doute là une filiation qui traverse différents dispositifs et pratiques (l’iconographie westernienne, les attractions foraines, les simulateurs de vol pour pilotes d’avions de chasse, etc.) qu’il serait sans doute intéressant d’appréhender dans une perspective intermédiale, voire gender.

L’emprunt effectué par Van Sant à certains jeux vidéo de combat d’une caméra située juste derrière le personnage (dans des jeux dits « à la troisième personne ») ne fait que renforcer l’« identification » à la posture des tueurs en termes d’investissement de l’espace¹⁷. Certes, un décalage s’opère toutefois, puisque le jeu vidéo auquel joue Alex est un exemple de shooting game « à la première personne », soit un type de représentation caractérisée par une « caméra » subjective rejetant le protagoniste hors-champ dont on ne voit poindre, au premier plan, que le canon de l’arme ; or ce point de vue n’est adopté qu’une seule fois dans le film, précisément dans l’un des inserts prospectifs qui ponctuent la récapitulation par Eric des étapes prévues pour la prise d’assaut de l’école¹⁸. Alors que les images comprises dans les sept autres inserts de cette séquence sont, dans la suite du film, soit reprises à l’identique et inscrites dans une temporalité plus longue, soit totalement élidées, ce plan-ci est le seul à constituer une variation sur un motif qui sera actualisé différemment, avec un point de vue « à la troisième personne », au moment de la représentation de la tuerie. Il en découle que le tir figuré « à la première personne » est strictement associé à l’imaginaire des tueurs, le statut d’insert provoquant une subjectivisation par le montage qui surdétermine – et, en l’occurrence, renforce – celle impliquée par le cadrage. Cet apax en termes de figuration du regard de l’assassin participe du discours relatif à l’influence néfaste des jeux vidéo sur les comportements des adolescents¹⁹ et souligne la volonté de Gus Van Sant de prendre une distance, d’opérer un décentrement par rapport à ce qu’il considère comme étant le « point de vue » emblématique octroyé aux gamers par le dispositif vidéoludique. En outre, il faut noter que la finalité interactive qui caractérise la représentation offerte par ce dernier est inappropriée au cinéma : certaines pratiques peuvent engager des implications fort différentes lorsqu’elles sont transférées dans un dispositif autre²⁰. Aussi, un jeu vidéo qui aurait été joué et dont le déroulement serait ensuite projeté sur l’écran d’une salle de cinéma serait probablement perçu en termes de construction du point de vue selon les codes cinématographiques, du moins partiellement²¹.

En dépit des conséquences résultant du transfert intermédial, l’adhésion au point de vue des tueurs demeure à notre sens « éthiquement » problématique dans Elephant en ce qu’elle reste déterminée par son emploi dans des jeux ayant pour seul objectif d’immerger le joueur/spectateur dans la mise en scène constamment réitérée d’une situation de massacre. Le cinéaste en a lui-même conscience lorsqu’il déclare dans un entretien s’être laissé « prendre au piège » de l’attraction d’un jeu vidéo, et qu’il constate que l’esthétique pour laquelle il a optée tend à rejouer celle d’un mode de représentation qu’il considère comme l’une des « sources » du massacre :

« Quand j’ai commencé à travailler sur le film, juste après Columbine […], je ne savais pas ce qu’était un jeu vidéo, je n’y avais jamais joué… J’avais touché aux plus anciens, à la fin des années 1970, mais je n’avais jamais joué sur un récent ; j’en ai donc trouvé un appelé Tomb Raider, et à force d’y jouer, je me suis laisser piéger, je suis devenu un accro, au point que lors du tournage du film qui a précédé Elephant, Gerry, mon intérêt portait sur la manière de fonctionner de la caméra dans ce jeu, la manière de suivre les personnages plus que de raconter une histoire. Il ne s’agissait pas d’imiter un jeu vidéo, mais plutôt d’observer comment le jeu s’était immiscé dans ma façon d’envisager le fonctionnement du cinéma. […] J’ai fait un film qui en quelque sorte a renvoyé comme en écho la tuerie à sa source originale, sans que cela ait été prévu. »²²

Même si Elephant n’imite pas littéralement le fonctionnement d’un jeu vidéo, on pourrait toutefois l’envisager comme une production vidéoludique (de très mauvais goût) qui reconstituerait le drame de Columbine en s’inspirant des images prises par les caméras de surveillance et véhiculées par les mass medias – ce principe a d’ailleurs été exploité, de façon « littérale », par Daniel Ledonne, concepteur d’un jeu dans lequel l’utilisateur occupe la place des tueurs lors de la tuerie de Columbine²³. En effet, le film de Van Sant tend à l’infra-narratif – ou à une forme de narrativité qui procède pour l’essentiel de la configuration spatiale elle-même²⁴ –, se présente comme un environnement nettement circonscrit et met à disposition du spectateur un certain nombre « d’avatars » choisis tour à tour. D’ailleurs, le cinéaste est allé jusqu’à concevoir pour Elephant un jeu vidéo qui prend pour décor et protagoniste le désert westernien et le (double) personnage éponyme de son film précédent, Gerry. Si l’élaboration de cette création vidéoludique s’explique sans doute par des raisons pratiques (les droits de citation d’un jeu comme Doom auraient sans doute été trop onéreux), il n’en reste pas moins que Van Sant, adepte du remake sous toutes ces formes (ainsi qu’en témoigne sa reprise plan à plan de Psycho d’Hitchcock), procède à une autocitation qui conduit à une transposition effective d’un film en jeu vidéo de combat : dans les inserts plein cadre sur l’écran d’ordinateur manipulé par Eric dans la chambre de son ami (espace de repli qui constitue la « matrice » du drame), la victime des coups de feu tirés est invariablement le personnage interprété dans Gerry par Casey Affleck, que l’on reconnaît à son T-shirt noir comportant un motif étoilé (fig. 7-8) ; or ce Gerry-là est « assassiné » également dans le film, du moins symboliquement²⁵. Cette « réécriture » vidéoludique d’un film à tendance expérimentale est certes ironique, mais elle n’en dénote pas moins une attirance pour ce type de représentations. Dans son ensemble, Elephant pourrait même être vu comme une adaptation vidéoludique (factice) d’un film hollywoodien standard puisque, ainsi que l’explique Van Sant, la source sur laquelle il se base est elle-même parente d’une sorte de « film » :

« Tout est parti du massacre dans le petit lycée américain de Columbine. La couverture médiatique a été énorme. J’avais l’impression de regarder un film d’exploitation, tant les images télé et les commentaires étaient dramatisés. »26

A cet égard, Elephant constitue une déclinaison, arty et « multimédia », d’un film à la facture traditionnelle virtuellement présent à travers le « devenir-images » du drame de Columbine. Cependant, en convoquant des motifs prévus pour un dispositif interactif, Gus Van Sant semble vouloir maximiser l’immersion dans le monde qu’il nous donne à voir et à entendre, comme s’il s’agissait d’accéder au hors-champ fantasmatique des images prises par les quatre caméras de surveillance lors du massacre de Littleton27, ou plutôt d’instituer la caméra du film elle-même en instance sinon de surveillance, du moins d’observation. Sorte de garde rapprochée, la caméra d’Elephant « prend en chasse » les personnages tandis que le montage tend à signifier que les tenants et aboutissants du drame échappent à toute entreprise de « compréhension ».

Il faut toutefois préciser que l’emprunt aux jeux « à la troisième personne » implique que les déplacements de caméra se désolidarisent des personnages, puisque nous ne voyons pas à proprement parler à travers leurs yeux. Cette autonomisation par rapport aux instances diégétiques est particulièrement manifeste lorsqu’un travelling latéral se met en place qui instaure un rapport non plus de proximité, mais de frontalité aux personnages. Ainsi, dans les séquences où les lycéennes choisissent un repas à la cafétéria, la caméra passe de l’autre côté du comptoir, et, dans un mouvement de droite à gauche amorcé par les protagonistes mais amplifié (comme s’il s’agissait, peut-on en penser dans un premier temps, de suivre une figurante qui a surgi au premier plan), elle rejette Brittany, Jordan et Nicole hors-champ pour sonder brièvement les « coulisses », du côté des cuisines (fig. 9-12) ; il en va de même au guichet du secrétariat, où la caméra quitte les adolescents dont elle suivait le déplacement – également de droite à gauche, indice d’un sens de « lecture » bouleversé – pour pivoter et découvrir, dans la pièce adjacente sur laquelle s’ouvre une porte, une réunion d’employés de l’établissement qui, de toute évidence, s’apprêtent à fêter un événement dont nous ne saurons rien. Cette séquence s’interrompt abruptement, sanctionnant le dépassement des limites que le cinéaste semble s’être fixées en termes de récit (l’accueil du personnage – qui n’est pas un élève du lycée – par l’exclamation enjouée « Surprise ! » demeure une énigme, un possible narratif non actualisé), de genre – il ne s’agit pas pour Van Sant de réaliser un documentaire sur une institution comme a pu le faire Frederick Wiseman dans High School (USA, 1968) – et, surtout, d’organisation spatiale.

Rarement en effet nous n’avons vu au cinéma – exception faite du cinéma expérimental, dont Elephant hérite de certains traits en les adaptant habilement à un cinéma d’auteur qui se veut « indépendant » – un tel souci de délimiter l’espace (de la fiction), qu’il s’agisse du respect de frontières diégétiques ou du travail sur les limites du cadre. Sans doute symptomatique d’une conception « spatialisante » de la représentation qui s’est généralisée avec les usages récents des nouvelles technologies28, cette tendance à faire primer l’espace sur l’action, le lieu sur le personnage, le descriptif sur le narratif, mérite une analyse de détail que nous proposons de mener à partir d’une séquence qui est à cet égard emblématique, située relativement au début du film et encadrée par deux plans quasi identiques du proviseur toisant avec méfiance un élève, John, situé hors-champ (fig. 13-25). Ce retour d’une même image (dont seule l’échelle scalaire varie) indique, au niveau de la temporalité, que tout ce qui a été montré dans la séquence que nous analyserons s’est déroulé simultanément à ce qui précédait l’arrivée au secrétariat de John, le premier personnage que nous avons accompagné dans ses déplacements29 – action décisive, puisqu’il rencontre sur son trajet les tueurs qui s’apprêtent à pénétrer, armés, dans le bâtiment. Par rapport à la piste narrative de ce personnage, la séquence dont nous traiterons, dédiée à partir de la fin du premier plan à Nathan (qui rejoint sa copine Carrie), semble plus périphérique : elle fait office de parenthèse avant le retour à John assis au secrétariat, soit dans l’un de ces lieux situés à la croisée des chemins, là où s’opèrent les bifurcations du récit et où la violence peut potentiellement éclater.

Le marquage (énonciatif) du terrain de jeu

La séquence en question débute par un long plan au cadrage obstinément fixe (en dépit d’un léger bouger de l’appareil de prise de vues qui témoigne de la présence du filmeur), comme si nous étions face à un moniteur d’une caméra de surveillance : les actions se déploient aléatoirement, indépendamment de l’acte de filmer et, souvent, dans l’espace hors-champ (fig. 14-24). Il s’agit d’un terrain de jeu sur lequel, au premier plan de l’image, des adolescents s’entraînent au football : les corps s’esquivent, s’agrippent, se heurtent, dans une agitation apparemment soustraite à toute règle, le spectateur étant incapable de comprendre quelque chose à la partie (pour autant qu’il y en ait une)30. Le caractère pluricentré de l’image rappelle les vues, elles aussi fixes31, du cinéma des premiers temps. L’occultation de tout ce qui excède la délimitation spatiale imposée à l’image – alors même que les joueurs sortent constamment du champ, comme un appel à les suivre qui demeure entravé (d’autant plus qu’Elephant obéit jusque-là au principe de la filature) – souligne la présence de la caméra, l’origine d’un regard assigné à un espace donné qui, en une légère plongée, enregistre « mécaniquement » le déroulement de l’action (car on comprend bien qu’il ne s’agit pas là du regard d’un personnage). Le hors-champ dont l’absence est exhibée ne concerne pas seulement le bord droit du cadre où les joueurs disparaissent puis d’où ils resurgissent, mais également ce que Noël Burch a appelé, dans sa typologie des espaces hors-champ, le « cinquième segment », c’est-à-dire le pan de « mur » correspondant à l’endroit où se situe la caméra32. En effet, l’un des joueurs s’élance à l’avant-plan pour se jeter sur le ballon (fig. 16), tandis que, plus tard, Nathan s’y penche pour saisir son sweat-shirt (fig. 20). Certes, la caméra reste indemne, intouchée par ces personnages qui se précipitent dans sa direction ; néanmoins, la place qu’elle occupe est ostensiblement signifiée dans le champ lui-même par de tels débordements dans un en deçà du champ dont le cinéma traditionnel prend soin de gommer toute trace. Ici, l’œil sous lequel se déroulent les actions affiche sa présence. Dans les termes proposés par les théories de l’énonciation au cinéma qui tentent de rendre compte de la façon dont un film est susceptible de rompre la transparence de l’histoire pour s’afficher en tant que discours33, on peut dire que l’ouverture de cette séquence d’Elephant, à notre sens emblématique de l’ensemble du film, se veut marquée au niveau de la monstration34 : le spectateur est invité à percevoir qu’une instance lui donne à voir le représenté, et non que le monde se donne à lui sans médiation aucune.

Par conséquent, le filmage affiche une indifférence à la vie des personnages, qui, présentée de façon fragmentaire, nous apparaît dès lors d’autant plus « réelle ». Au cours de ce plan, le personnage de Michelle, dont on sait la gêne qu’elle éprouve à faire du sport avec ses camarades, à être « l’objet des regards », vient momentanément s’inscrire dans le champ, seule, au premier plan et au centre de l’image (fig. 18) : dissimulant en partie les joueurs situés derrière elle qui deviennent dès lors secondaires, la jeune fille s’interrompt dans sa course pour regarder le ciel, dans un moment de rêverie souligné par un léger ralenti, comme s’il s’agissait pour Gus Van Sant de faire durer quelque peu cette part d’insaisissable (voire d’irrémédiable) inscrite en certains instants. Pratique récurrente dans le film, le ralenti tend à particulariser certains moments et certaines attitudes des personnages. Le plus marquant « consacre » l’instant où John joue avec le chien de l’un de ses camarades, alors que les tueurs s’approchent de lui à l’arrière-plan, traversant la pelouse. La variation de vitesse du défilement des images suggère l’imminence du drame, comme lorsque le ciel se couvre avant l’orage – motif qui correspond à ce que Michelle est probablement en train d’observer durant la ralenti de la séquence examinée ici. Les plans sur les nuages en mouvement sont quant à eux filmés en accéléré, ce qui provoque une même étrangeté que les ralentis sur les personnages, mais d’une manière qui semble affranchie de toute contrainte « terrestre ». L’irréalisation momentanée de la représentation qui résulte du ralenti se fait l’expression d’une fascination du cinéaste pour la captation même du monde dans ce qu’il recèle de fugitif, et tend à subjectiviser passagèrement l’image de l’intérieur, indépendamment du lieu d’où l’on regarde : en effet, cette singulière « respiration » de l’image est mise au bénéfice du ressenti de la joggeuse essoufflée, qui semble s’extraire, l’espace d’un instant – dans le sens où il s’agit d’un intervalle court, mais aussi, littéralement, d’un instant ancré dans un espace donné –, du malaise dont elle souffre. En gagnant le personnage comme le spectateur, la stase contemplative est l’un des procédés permettant au cinéaste de concilier l’asymétrie des regards – nous n’épousons pas celui de Michelle – et l’empathie perceptive (comme elle, nous avons « la tête dans les nuages », ces derniers étant visualisés ailleurs dans le film)35. Cette brèche dans le flux du quotidien a néanmoins tôt fait de se résorber pour laisser la place à la concrétude des corps et à l’inéluctable déploiement de mouvements énergiques (et virils).

La contemplation, en elle-même, postule l’exhibition d’un sujet du regard. Mais quel est ce lieu où « l’œil d’Elephant » semble s’être fixé, le temps de ce plan ? Pour saisir les implications d’un tel ancrage, il est nécessaire d’examiner la dynamique des entrées et sorties de champ, et l’inscription des actions dans la profondeur du champ (dont l’appréhension est favorisée sur le plan optique par l’utilisation d’une grande profondeur de champ). Au tout début du plan, trois coureurs passent en trombe devant la caméra, l’un chassant l’autre hors du champ (fig. 14), silhouettes floues au premier plan de l’image dont l’apparition successive introduit l’idée d’une cadence des entrées dans le champ, d’un jeu rythmique sur le vide et le plein. Or, lorsqu’ils passent à l’arrière-plan, ces coureurs suivent exactement la ligne blanche dessinée sur le gazon par une traînée de sable : on les voit subrepticement sur le bord droit du cadre – précisément là où Michelle poursuivra sa course, dont la trajectoire est également calquée sur cette ligne, avant de rejoindre le groupe de jeunes filles (fig. 19) –, puis à l’arrière-plan, suivant une trajectoire exactement parallèle au bord inférieur du cadre (fig. 17). Le trajet effectué par ces joggers respecte donc scrupuleusement la délimitation du terrain de football : à l’instar des concepteurs de plans d’aménagement semblables à celui dont se servent les tueurs pour planifier et optimiser la tuerie36, le cinéaste organise l’espace dans le « plan » (qui tient autant de l’unité filmique que du schéma d’architecte) en fonction des frontières que lui offre l’espace réel. La caméra, elle aussi, se trouve exactement sur la ligne, cette dernière étant remplacée par le bord même du cadre : le terrain de jeu est également celui de la fiction. Lorsque Nathan dépasse la ligne (et donc sort du cadre) pour ramasser son sweat-shirt, il préfigure la suspension de la logique centrifuge de l’image qui s’effectuera peu après, lorsqu’il sortira complètement du champ pour quitter le terrain. Dès lors, la caméra se met en mouvement pour le suivre. Etonnamment, cette rupture de la fixité du cadre n’occasionne aucune coupe, l’organisation filmique continuant de se jouer au strict niveau de la monstration, dans un plan unique dont la durée totale est de six minutes (si l’on considère que la première coupe intervient avec l’insert de la mention « Nathan & Carrie »).

Il nous paraît symptomatique que ce plan, dont nous avons relevé les caractéristiques et les implications en termes de marquage énonciatif, embraie sur l’une des filatures où la caméra demeure située dans le dos du protagoniste (fig. 22-24). Car nous sommes bien là dans un cas passablement différent de ce que François Jost a proposé de nommer « l’ocularisation interne primaire », soit l’assimilation exacte de l’œil-caméra au regard du personnage37 : le spectateur voit la même chose que ce dernier (mais, comme nous l’avons dit, pas tout à fait de la même manière) puisqu’il marche dans ses pas, mais il ne cesse, simultanément, de voir par ailleurs ce personnage même. Toutefois, la visualisation du personnage n’a qu’une très faible incidence en termes de focalisation puisque son visage, qui constitue le siège de l’identification (des affects), nous demeure caché38. Si certains plans dans lesquels la caméra est située très près de la tête du personnage (par exemple fig. 24) peuvent laisser penser que ce dernier apparaît en amorce (en vertu de ce que certains appellent une caméra « semi-subjective »), d’autres creusent la distance, comme cela est significativement le cas dans la seconde partie du plan dont il est question ici : la caméra se met certes en branle pour suivre Nathan (fig. 22) comme elle l’a fait pour John et Elias, mais elle semble affectée d’une sorte de pesanteur, comme si elle avait été engourdie à force d’avoir été rivée sur la même portion d’espace. Elle ne rejoint en effet pas Nathan qui s’éloigne, s’arrêtant à distance de ce dernier (fig. 23) tandis qu’il s’apprête à pénétrer dans le bâtiment par le franchissement d’un seuil auquel répond la frontière que s’est fixée la caméra en s’immobilisant. Même si, dans la suite du trajet parcouru par le jeune homme à l’intérieur et à l’extérieur du bâtiment, la caméra se montre tout à fait solidaire de son déplacement en conservant une distance faible et constante, ce plan-ci suggère qu’il n’y a pas nécessairement dans Elephant inter-dépendance entre les mouvements d’appareil et la marche des protagonistes. Instance libérée des contraintes diégétiques, la caméra exhibe sa présence, et porte un certain regard, presque entomologique, sur ces « insectes » qui s’agitent jusqu’à se donner la mort. Alors que le montage permet de construire, sur le plan de la narration, une structure polyphonique qui invite le spectateur à passer d’un personnage « focal » à l’autre (sans toutefois ne jamais briser le rapport d’extériorité qui est instauré avec chacun d’eux), l’affirmation systématique de la présence de la caméra et de choix marqués au niveau du filmage produit, sur le plan de la monstration, un fort effet « monophonique ». Bien qu’éclaté dans sa structure, Elephant paraît ainsi fortement homogène dans sa facture, affichant un style qui fait office de signature, ainsi que le remarque Edouard Arnoldy à propos des amples mouvements de caméra :

« […] ces travellings affichent un détachement certain vis-à-vis des personnages que la caméra croise, perd de vue et, parfois, retrouve au détour d’un couloir ou d’une rue. Van Sant reprend vite la main pour mettre les personnages à une juste distance, comme pour affirmer la place, cardinale, directrice, du cinéaste. »39

Dans le champ du cinéma « d’art et essai », une telle auto-désignation par le film de ses propres pratiques de filmage favorise (voire programme) une lecture de type esthétique et auteuriste.

Une « focalisation » sur la matière de l’image

La gestion du « point de vue » filmique dépend de l’endroit d’où chaque plan est filmé, mais aussi, tout simplement, de ce que nous donne à voir l’ensemble du film. Au hors-champ de l’image qui détermine certaines particularités de la monstration correspond l’éviction complète de portions de récit par le montage. A ce titre, Elephant se veut très elliptique et, à l’instar d’autres films du cinéaste (Gerry, Last Days,…), n’offre pas d’exposition permettant de livrer au spectateur certaines informations sur les adolescents à la dérive qui peuplent le film. Notre savoir sur eux se limite aux actions montrées, qui consistent le plus souvent en des déplacements, c’est-à-dire en un type de contenu narratif qui, traditionnellement au cinéma, disparaît dans des ellipses. Quant aux dialogues, fragments de discussions quotidiennes de jeunes gens dans les couloirs de leur école, ils sont rares et superficiels. Avant que les tueurs ne se mettent en route pour le lycée (à environ une heure du début du film), renforçant le statut central de la piste narrative dans laquelle ils s’inscrivent et autour de laquelle s’organisent toutes les autres jusqu’à, désormais, se fondre dans une chronologie unique, les inférences du spectateur sur la diégèse ne portent pas tant sur la construction des personnages que sur la compréhension de l’organisation temporelle. A cet égard, ce ne sont pas les protagonistes en tant que tels qui importent, mais les moments où ils se rencontrent. En effet, la convergence momentanée des pistes narratives permet au spectateur d’établir une relation de simultanéité entre les événements et, ainsi, de se faire progressivement une représentation mentale de l’espace-temps global de la diégèse. Comme une gare de triage, ces scènes-repères ordonnent la bifurcation des pistes en les situant temporellement les unes par rapport aux autres. En de tels instants – dont la représentation se présente parfois sous la forme d’un ralenti (John croisant les tueurs, Nathan passant devant le groupe de filles) –, le temps tel que l’appréhende le spectateur « se fixe » : ainsi n’est-ce pas un hasard si l’une de ces scènes, montrée à trois reprises dans le film (tout d’abord en suivant John, puis Elias, et enfin Michelle, qui traverse subrepticement le champ en longeant la paroi, fig. 26-28), est précisément dédiée à la « pose » de John devant Elias qui le photographie40. Le pendant cauchemardesque de cette rencontre surviendra plus tard, lorsqu’Elias photographiera l’assassinat de Michelle, avant d’être lui-même victime d’une balle.

De tels instants « prégnants », qui correspondent le plus souvent à des situations où, simplement, deux groupes de protagonistes se croisent41, montrent combien, dans Elephant, un point de vue donné se définit moins en lui-même que dans la relation contrastive qui est instaurée avec d’autres pistes. Même si, comme on l’a dit, un style de filmage identique unifie l’ensemble des pistes, chacune d’elles tend toutefois à se singulariser, ne serait-ce qu’à travers la démarche propre à chaque actrice ou acteur. Chacun des personnages, clairement identifié par son habillement pourvu d’un sigle distinctif (souvent un logo) et d’une couleur dominante immédiatement reconnaissable, imprègne les images consacrées à la piste narrative qui lui est associée. Si Gus Van Sant n’opte pas pour un usage aussi clairement subjectivisant de la couleur que celui de Zang Yimou dans Hero (Chine, 2002)42, la séquence de « rencontre » entre les trois personnages que nous avons mentionnée ci-dessus témoigne de l’attribution à chaque personnage d’une dominante chromatique : l’image tend vers le beige pour les plans appartenant à une séquence « focalisée » sur John, vers le bleu pour Elias et vers le blanc pour Michelle43. Eric, le tueur, apparaît quant à lui beaucoup moins « lumineux » que ses camarades. On rétorquera que c’est là un critère subjectif (précisément !), contestable en de nombreux plans en fonction des conditions d’éclairage du moment de la prise de vues. Mais c’est pourtant bien ainsi que Gus Van Sant touche au cœur de l’expression filmique d’un « point de vue » sur le monde : il ne s’agit pas principalement d’un mode d’organisation narratif, mais d’une valence particulière conférée au « grain » de l’image. En alternant, grâce aux variations de mise au point, les contours à la netteté tranchante avec des zones floues qui contaminent l’écran jusqu’à le menacer de devenir une surface abstraite, Van Sant et son caméraman Harris Savides44 font du point de vue une question avant tout plastique et sensorielle. Dans Elephant, l’usage du « plan-séquence en profondeur de champ » est anti-bazinien (à l’exception du premier plan de la séquence du terrain de football analysée ci-dessus) dans la mesure où, en raison des nombreux changements de focale et de mise au point, il vise à orienter ostensiblement le regard du spectateur, se substituant au montage ; pourtant, c’est justement grâce à cette esthétique que le film touche à « l’ambiguïté du réel » qui était si chère au critique français45, et baigne chaque image d’une subjectivité diffuse.

D’un Elephant à l’autre

Même si la critique a fréquemment relevé la mise à distance des personnages chez Van Sant, son film n’est pas rétif à toute manifestation d’émotions. Il suffit pour s’en convaincre de le comparer au film dont Gus Van Sant s’est inspiré au point d’en emprunter le titre : Elephant d’Alan Clarke (GB, 1989) (fig. 29-35). La froideur clinique de ce court métrage réalisé pour la BBC tient à la systématicité et à l’austérité avec lesquelles sont juxtaposées les différentes séquences qui le composent, toutes exclusivement consacrées à la représentation de meurtres sordides et totalement gratuits. Dans ce film, chaque nouvelle scène possède son autonomie et nous montre le déplacement d’un personnage dont nous ne savons rien jusqu’à un endroit désert où il abat quelqu’un de sang froid avec une arme à feu. La structure tripartite telle qu’elle est envisagée dans la conception aristotélicienne du récit est réduite ici à sa plus simple expression : situation banale et calme au début (néanmoins tendue vers une complication en raison de l’allure décidée des protagonistes, puis, une fois que le principe est compris de spectateur, en raison de l’imminence du surgissement de la violence), renversement avec les coups de feu puis retour désenchanté à une forme de tranquillité avec les plans immobiles et rapprochés sur le corps de la victime qui, sous une forme parente des photographies de police documentant une scène de crime, offrent presqu’invariablement une clôture à la séquence.

Elephant de Van Sant s’inspire notamment du film homonyme au niveau de certains principes de filmage, puisque Clarke suit également, avec une caméra fréquemment située dans le dos des personnages (fig. 31) et perpétuellement en mouvement, les différents tueurs qui parcourent de vastes espaces parsemés de bâtiments suburbains délabrés à la recherche de leur (ou d’une ?) victime. Toute comme Van Sant, le film nerveux et brutal de Clarke explore des espaces, des « zones » qu’il traverse en suivant, à une distance variable, les tueurs qui se précipitent pour accomplir leur sinistre tâche ; ainsi trouve-t-on également une scène située sur un terrain de football, dont les lignes blanches qui passent sous les pieds de l’assassin puis sous le corps de la victime semblent quadriller le lieu de la tuerie (fig. 32-33). Lorsque les gens se croisent dans l’Elephant de Clarke – dans des instants où, comme chez Van Sant, une grande importance est accordée à ce qui se déroule dans la profondeur de l’image (fig. 33-35) –, la mort est inévitablement au rendez-vous. Plus encore que chez Van Sant, les personnages demeurent muets ; et, ici, nulle musique de Beethoven ni grondements du ciel pour adoucir le drame ou le charger d’un souffle romantique : le film de Clarke s’en tient inflexiblement aux seuls bruits de fond de la circulation sur lesquels se détachent les claquements secs des détonations. L’éviction de toute émotion au profit d’une mécanicité des actes qui confine à l’absurde nous permet de mesurer l’écart qui sépare ce court métrage de facture expérimentale du film de Gus Van Sant : comme le dit Serge Kaganski dans le livret de l’édition DVD MK2 d’Elephant qui comprend également, en supplément, le film de Clarke, « celui de Van Sant est plus sensuel, peuplé de véritables personnages, empli de chair et de fiction ». Ce qui donne consistance aux êtres qui traversent les salles du lycée avec sadisme ou effroi tient avant tout à la manière dont le film de Van Sant parvient à nous immerger dans son monde, ne serait-ce, parfois, que l’espace d’un (passionnant) regard.

↑

¹ Nous tenons à remercier chaleureusement Alain Boillat pour sa précieuse contribution à la rédaction du présent article.

² Nous empruntons la notion de « musique anempathique » à Michel Chion, qui précise à son propos qu’elle « nous fait voir le fond d’indifférence du monde. Dans cette mise en perspective, l’intensité émotionnelle n’est pas diminuée, au contraire, mais portée à un autre niveau » (Michel Chion, Le son au cinéma, Paris, Cahiers du cinéma, 1985, p. 125). Il précisera dans un ouvrage ultérieur : « L’indifférence de la musique est justement signifiée au spectateur pour que celui-ci l’investisse comme un miroir où se reflètent la solitude et le dérisoire de son propre destin » (Michel Chion, Un art sonore, le cinéma. Histoire, esthétique, poétique, Paris, Cahiers du cinéma, 2003, p. 384).

³ Notion empruntée à François Jost, L’œil-caméra. Entre film et roman, Lyon, PUL, 1987, p. 57.

⁴ Alexandre Tylski, « L’oreille qui entend au loin », disponible sur le CD-Rom Elephant : un film de Gus Van Sant, Nice, Scérén/CRDP Académie de Nice, 2003.

⁵ Hildegard Westerkamp est une compositrice de musique électroacoustique allemande, née en 1946. Voir http://www.sfu.ca/~westerka/.

⁶ Frances White est une compositrice américaine de musique instrumentale et électronique. Voir http://www.rosewhitemusic.com/.

⁷ A ce titre, la musique joue un rôle similaire à la mise en cadre, dont Alain Boillat montre, dans l’article du présent dossier, qu’elle produit un effet monophonique par-delà la polyphonie narrative. En ce qui concerne cette séquence montrée à trois reprises, voir fig. 26-28 de l’article de Boillat.

⁸ Le générique de fin mentionne la source suivante : « Supernatural infinite space (Kawabata) and Waikiki easy meat (Mano) ». Ces morceaux ont été écrits et interprétés par Acid Mother Temple et The Melting Paraiso U.F.O.

⁹ Lorsque, dans Le son au cinéma, Michel Chion définit les trois zones d’ancrage du son par rapport à l’image (in, off et hors-champ), il met précisément l’accent sur la perméabilité de ces trois catégories (Michel Chion, Le son au cinéma, op. cit., pp. 32-44).

¹⁰ Marcel Proust, « Journées de lecture », dans Contre Sainte-Beuve, Paris, Gallimard, 1971 [1954, posthume], pp. 162-163 [nous soulignons].

¹¹ Charles Rozen, Les sonates pour piano de Beethoven, un petit guide, Paris, Gallimard, 2007, p. 20.

¹² En fait, la dédicace est communément reprise pour donner un titre à l’œuvre.

¹³ Max Unger, « Beethoven and Therese von Malfatti », The Musical Quarterly, vol. 11, no 1, 1925, pp. 63-72.

¹⁴ L’émission « Le mot du jour » du 9 septembre 2009 sur France musique évoque des recherches plus récentes sur l’identité de « Elise ». http: //sites.radiofrance.fr/-francemusique/em/mot-jour/emission.php?e_id=70000040&d_id=395000314&arch=1.

¹⁵ Pierre-Alain Clerc, Discours sur la rhétorique musicale, consultable en ligne : http://www.peiresc.org/Clerc.pdf, p. 47.

¹⁶ Cité dans id., p. 49.

¹⁷ Hector Berlioz, « Concerts de M. Liszt », Journal des débats, 25 avril 1835, cité dans J. G. Prod’homme, Les sonates pour piano de Beethoven, Paris, Delagrave, 1944, p. 126.

¹⁸ Charles Rozen, op. cit., p. 146.

¹⁹ J. G. Prod’home, op. cit., p. 124.

²⁰ Gus van Sant cité par Damien Barthelemy dans Elephant : un film de Gus Van Sant [Ressource électronique], Scérén/CRDP Académie de Nice, Nice, 2003.

²¹ « So foul and fair a day I have not seen », Macbeth, Acte I, scène 3. Ce vers est cité par Alex, dans un bref soliloque prononcé au moment de la tuerie.

²² Charles Baudelaire, « Mon cœur mis à nu », chapitre XL, dans Œuvres complètes, tome 1, Paris, Gallimard (coll. « La Pléiade »), p. 703.

²³ Charles Baudelaire, « Spleen », dans Les Fleurs du Mal, Paris, Gallimard, 1972 [1857], p. 113.

²⁴ François René de Chateaubriand, René, Paris, Pocket, 1999 [1802], p. 129.

²⁵ Ibid.