La voix dans tous ses états
Voix organique et corps chimérique – où passe le personnage ?
Résumé
Le cinéma, par les rapports étroits et féconds qu’il noue entre les dimensions visuelle et sonore, apparaît comme un terrain privilégié pour interroger le pouvoir du son, et en particulier celui de la voix, qu’il suffit de faire entendre pour qu’aussitôt prenne corps un personnage. C’est précisément ce que Michel Chion a théorisé sous le concept d’acousmêtre afin de désigner ces personnages que l’on entend mais que l’on ne voit pas. Nous nous proposons de réfléchir sur un acousmêtre contemporain, d’autant plus particulier qu’il apparaît comme parfait : le « personnage » de Samantha dans Her de Spike Jonze (2014), une intelligence artificielle qui va progressivement établir une relation amoureuse avec un jeune homme solitaire. Il s’agit dès lors d’observer comment cet acousmêtre interroge la force et l’ambiguïté des liens qui unissent voix et personnage. Samantha n’existe qu’à travers ses paroles qui, non seulement suffisent à faire oublier sa nature virtuelle, mais plus encore, convoque un corps chimérique. Cependant, la mise en scène ne cesse de marquer la béance laissée par un personnage qui ne peut s’incarner, pointant ainsi la facticité autant que la force du contrat qui associe voix, corps et individu.
Abstract
Insofar as it closely and productively links image to sound, cinema appears to be a chosen ground to question the power of sound, and in particular the power of voice since only through this media does a character take shape through their voice. This is precisely what Michel Chion theorized through the “acousmêtre” concept in order to designate the characters one can hear but cannot see. This study will concentrate on a contemporary so-called “acousmêtre”, whose the specificity resides in its apparent “perfection.” Indeed, the Samantha “character” in Spike Jonze’s Her (2014) is an artificial intelligence entity that develops a romantic relationship with a solitary young man. The purpose of this article is to understand how this “acousmêtre” questions the intensity and ambiguity of the bonds between voice and character. Samantha only exists through speech but the words she pronounces do not merely make her virtual nature to vanish but they also summon a chimerical body. Yet, the director’s choices constantly point the absence of this character, which cannot be embodied. The movie thus reveals both the artificiality and the strength of the contract associating voice, body and person.
Plan
Texte intégral
1Avec le film Her (2014), mêlant drame romantique et récit d’anticipation, le cinéaste américain Spike Jonze interroge divers aspects de notre société contemporaine, notamment l’intégration du virtuel dans notre réalité quotidienne, la solitude comme conséquence paradoxale à un monde hyper-connecté, ou encore la relation à l’autre – qui plus est à un être virtuel –, ainsi que la place du corps et de la présence physique dans cette relation. Si Her nous intéresse particulièrement, c’est que la présence de l’autre y est réduite à sa seule voix. En effet, dans Her, Theodore (Joaquin Phoenix), un trentenaire accablé par la solitude depuis une rupture amoureuse, décide de faire l’acquisition d’un système d’exploitation doté d’intelligence artificielle. Celle-ci, prénommée Samantha, est une voix émanant des appareils informatiques de Theodore, programmée pour effectuer diverses tâches et communiquer par la parole. Dans un premier temps, cette intelligence artificielle s’avère fort pratique pour décharger Theodore de quelques besognes administratives, mais rapidement elle se montre drôle, capable de sentiments et semble dotée d’une « personnalité » à part entière. Progressivement, une relation de plus en plus intime se noue entre Theodore et Samantha.
2L’un des intérêts majeurs de ce film est le traitement qu’il propose de l’entité qu’est Samantha. Si nous la désignons pour le moment comme une entité, ce n’est pas pour lui dénier le statut de personnage, ce qu’elle est assurément à bien des égards, mais parce que l’un des enjeux, à la fois en termes narratifs et figuratifs, est précisément la construction de Samantha en tant que personnage-individu. Her n’est pas le seul film à proposer un personnage qui n’est pas une personne réelle. De nombreux récits sont peuplés d’objets, animaux, monstres ou autres créatures en tout genre, et leur considération en tant que personnages tient généralement à l’attribution de caractéristiques humaines de nature comportementales et/ou anthropomorphiques. La particularité ici réside dans le fait que Samantha apparaît rapidement non seulement comme un individu alors qu’elle n’est qu’une intelligence artificielle, mais plus encore, comme un individu sonore, ou plutôt, uniquement sonore. Michel Chion, spécialiste du son au cinéma, écrit à propos des voix dont on ne visualise pas la source :
Ces sons et voix qui ne sont ni tout à fait dedans, ni clairement dehors, on comprendra vite que ce sont eux qui nous intéressent le plus : parce que c’est là, peut-être, avec ces voix et ces sons laissés en errance à la surface de l’écran, qu’entre en jeu la puissance du cinéma en tant que tel. (Chion 1993, 18)
3C’est précisément cette articulation entre personnage-individu et personnage-sonore que le film interroge : Samantha n’existe qu’à travers ses paroles, et pourtant le film travaille à faire oublier sa nature strictement virtuelle pour progressivement l’intégrer, quasi physiquement, en tant qu’individu à part entière. La voix est ainsi posée comme condition suffisante, selon un contrat liant voix, corps et individu. Nous étudierons comment le film repose sur un personnage invisible qui va progressivement s’individualiser principalement grâce au pouvoir de la voix, porté non seulement par la mise en scène mais aussi par l’interprétation de l’actrice Scarlett Johansson dans le rôle de Samantha. Nous nous interrogerons ensuite sur les conditions et les limites de son incarnation ou, pour le dire avec Michel Chion, de sa « mise-en-corps ».
Création sonore
4Dans Her, Samantha intervient dans la quasi-totalité des scènes, mais uniquement par le biais de sa voix lors des longues conversations qu’elle entretient avec Theodore. Il faut attendre les derniers instants du film pour que survienne, de manière très fugitive, une sorte d’image mentale de Theodore dans laquelle apparaît une main féminine. À l’exception de cette vision d’un corps féminin pour le moins parcellaire, incomplète, anonyme, tout droit sortie de l’imaginaire de Theodore, Samantha demeure invisible.
Apparition de l’acousmêtre
-
1 Michel Chion crée ce néologisme en empruntan...
5Spike Jonze crée ainsi ce que Michel Chion a théorisé sous le terme de « fantôme sensoriel », et plus précisément d’ « acousmêtre ». Selon le théoricien, un fantôme sensoriel est « ce qui ne s’adresse qu’à un seul sens, dans un contexte où cela pourrait toucher deux sens en même temps » (Chion 2014, 217). Ainsi, dans le cinéma sonore – qui permet en même temps de faire voir et entendre – un son dont la source n’est pas visible à l’écran ou, à l’inverse, un objet ou un personnage visible à l’image mais dont aucun son n’est audible, constituent des fantômes sensoriels. Dans le cas d’un personnage dont seule la voix est perceptible, Michel Chion propose le terme d’ « acousmêtre1 », autrement dit un être acousmatique, un personnage présent dans la diégèse par le biais de sa voix mais qui demeure hors du champ de la représentation.
-
2 Her fait d’ailleurs explicitement référence ...
6Le cinéma parlant a très vite su tirer parti de ces acousmêtres capables, avec une économie de moyens, d’influer sur la fiction, de suggérer ou tromper, d’attirer l’attention du spectateur sur telle ou telle partie du champ. Parmi les acousmêtres les plus mémorables de l’histoire du cinéma, figure le personnage du tueur d’enfants interprété par Peter Lorre dans M le maudit de Fritz Lang (M – Eine Stadt sucht einen Mörder, 1933). Dès son premier film parlant, Lang exploite les enjeux et potentialités du personnage acousmatique : la proximité du tueur est suggérée par la mélodie qu’il sifflote tandis qu’il demeure invisible, et ce procédé permet de rendre le personnage d’autant plus menaçant et insaisissable. Citons également HAL, le robot omniscient de 2001, l’Odyssée de l’espace de Stanley Kubrick (2001: A Space Odyssey, 1968)2, ou encore les fantômes du film d’Alejandro Amenabar, Les Autres (The Others, 2001), dont les chuchotements résonnant dans un vieux manoir terrorisent une famille autant qu’ils leurrent les spectateurs.
Un acousmêtre parfait ?
-
3 Le terme « actuel » est ici employé dans son...
7Un nouvel acousmêtre intervient ici, qui plus est un acousmêtre intégral. Michel Chion distingue deux types d’acousmêtres : d’une part, celui que l’on a déjà vu mais qui se soustrait au visible (ainsi, lorsqu’un personnage quitte le champ au cours d’un dialogue, il devient un acousmêtre déjà visualisé) ; d’autre part, l’« acousmêtre intégral » : « celui qui n’est pas-encore-vu, mais qui reste susceptible d’apparaître à tout moment dans le champ » (Chion 1993, 32). Samantha relève donc de cette catégorie d’acousmêtre, et se révèle être un acousmêtre parfait puisqu’elle demeure, du début à la fin, un personnage exclusivement sonore alors même qu’elle aurait pu être incarnée. En effet, Spike Jonze aurait pu donner un corps à son personnage féminin, le rattacher notamment à une représentation humaine, aussi factice fût-elle. C’est ce que l’on retrouve dans nombre d’œuvres de science-fiction où une intelligence artificielle apparaît par exemple dans un corps robotique ou composite. D’ailleurs, le cinéaste ne se prive pas de mettre en scène un personnage virtuel dès le début du film, lorsque Theodore joue à un jeu vidéo dans son salon et qu’apparaît un hologramme en 3D avec qui il interagit. Ainsi, on ne s’étonnerait pas que Samantha intervienne, au moins, sous forme d’avatar sur un écran d’ordinateur ou de téléphone, comme c’est souvent le cas aujourd’hui sur nos appareils informatiques (songeons par exemple à ces multiples petits personnages qui surgissent dans un coin de l’écran, prêts à répondre à nos questions ou à nous suggérer telle ou telle autre option). Or, le cinéaste ne permet pas au personnage de Samantha une telle apparition, il la lui refuse comme pour mieux l’opposer, ou plutôt la détacher, l’émanciper de l’univers virtuel auquel elle appartient pourtant. En ne l’associant pas à une représentation numérique, il lui permet, d’une certaine manière, de ne pas être réduite aux traits et contours d’un avatar ou d’un hologramme, de sorte qu’elle peut être envisagée autrement, qu’elle peut exister ailleurs – soit dans la « réalité » en tant qu’individu actuel3.
8Il est indéniable que, très vite, Samantha acquiert une autonomie, développe une personnalité, et même, disons-le, une présence. En effet, le film met en place tout un processus de personnification qui trouve son origine dans cette voix, pour ensuite impliquer un corps et bientôt un individu. Et c’est précisément parce que Samantha n’apparaît pas en tant que personnage modélisé qu’elle peut être « sous-entendue » comme personne humaine.
Association voix / corps / personnage
9La voix est, au sens littéral du terme, la base à partir de laquelle un individu chimérique va être convoqué. Plusieurs éléments vont s’agglomérer à cette voix et contribuer à faire percevoir Samantha comme un individu à part entière et, ainsi, à pallier le fait qu’elle n’est jamais incarnée. Ces éléments, d’une part, relèvent de la logique narrative et du dispositif esthétique du film, et, d’autre part, mettent en jeu la réception spectatorielle.
Personnification
10Nous pourrions tout d’abord évoquer le titre même du film, qui annonce ce processus de personnification : l’usage du pronom personnel « her » désigne Samantha comme un individu, là où l’emploi du pronom neutre « it », pourtant plus exact, l’aurait limitée à un système d’exploitation informatique. La scène, en début de film, où Theodore initialise le programme et « rencontre » Samantha entérine cette idée. Dans un premier temps, une voix masculine pose quelques questions relevant d’un test de personnalité afin de générer une intelligence artificielle adaptée à l’utilisateur. Avant même que Theodore, hésitant et cherchant le mot juste, achève ses réponses, le programme l’interrompt et la seconde phase de l’initialisation est lancée. L’espace de quelques secondes, une spirale blanche ondule de plus en plus rapidement sur l’écran puis se fixe en un cercle rouge, et soudain une voix féminine se fait entendre : « Hello, I am here ». Aussitôt une conversation s’engage entre l’intelligence artificielle et Theodore, abasourdi par la spontanéité et le naturel, par l’humanité du programme qui plaisante, prend des initiatives, manifeste de la curiosité. Les deux étapes de l’initialisation du programme font entendre une voix, mais le contraste entre les deux ajoute à l’humanisation de Samantha : à une voix monotone, froide et indifférente qui se borne à récolter des informations sur Theodore, s’oppose la conversation, le dialogue, l’échange. Les premiers mots de Samantha l’identifient en tant que personne (« I am »), qui plus est actualisée, présente ici et maintenant (« I am here »), ce que la suite de ses propos ne fera que confirmer.
11Suite à cela, toute la logique narrative participe de la personnification de Samantha, par les caractéristiques qui lui sont attribuées (elle est drôle, attentionnée, douce, sympathique et attachante) et par les situations dans lesquelles elle intervient. Très vite, Samantha évolue. Loin de s’en tenir à des tâches bureautiques, elle va progressivement partager des moments d’intimité avec Theodore : présente à chaque instant du quotidien, elle devient sa confidente, sa partenaire de jeu, comme dans une relation à distance. Parallèlement, elle gagne en autonomie, compose des chansons, lit des livres, dans un élan d’émancipation qui la fait progressivement exister pour elle-même, au-delà de sa relation avec Theodore. Née programme informatique, elle se façonne une identité.
-
4 Selon Michel Chion, le point d’écoute est, a...
12La mise en scène contribue également à gommer la nature informatique et utilitaire de Samantha. Spike Jonze doit négocier avec cette gageure qui consiste à ne pouvoir filmer que l’un des deux personnages principaux. La solution trouvée est alors aussi simple qu’efficace. La plupart des scènes où Theodore discute avec Samantha sont filmées comme des conversations téléphoniques : seul l’un des interlocuteurs est visible à l’image, de l’autre nous ne percevons que la voix. Il s’agit donc d’une auricularisation interne puisque le spectateur entend ce qu’entend Theodore dans son oreillette alors que cela devrait, selon toute vraisemblance, lui échapper. À travers cette convention de mise en scène, le spectateur est placé face à une situation cinématographique familière qui contribue à « normaliser » Samantha en l’assimilant à une banale interlocutrice téléphonique. De plus, le point d’écoute4 interne permet au spectateur de partager la perception de Theodore, de s’identifier à lui, et donc, après lui, de voir en Samantha une personne.
Fantôme sensoriel et image mentale
-
5 Anecdote significative : Scarlett Johansson ...
13Au-delà de ces aspects, plusieurs éléments filmiques interviennent comme composants de Samantha. Si un personnage de roman est un « être de papier », le personnage filmique est une « figure composite » faite d’images mouvantes et de sons, pour reprendre l’expression d’André Gardies (Gardies 55), ou encore, selon Nicole Brenez, un « dispositif », c’est-à-dire une circulation d’éléments plastiques, visuels, sonores (Brenez 180). Or ici cette circulation se fait sur le mode de la soustraction puisque Samantha est essentiellement constituée par sa voix, qui est à considérer comme vecteur d’une pensée, mais aussi comme pure manifestation sonore. En effet, comme évoqué précédemment, ses propos ne sont pas standardisés, limités, robotisés. Il y a également la qualité et la matière de cette voix. Lors de son initialisation, Samantha explique avoir choisi ce prénom pour sa sonorité – la musicalité prévalant sur le sens. Par ailleurs, il ne s’agit pas d’une voix informatique, d’une synthèse vocale (alors que le cinéaste aurait très bien pu en décider ainsi), mais d’une véritable voix humaine, en l’occurrence celle de Scarlett Johansson5. L’actrice américaine possède une voix singulière, très expressive, assez rauque qui, par son timbre, évoque une origine concrète, physique, organique. Cette voix s’inscrit plus que jamais dans une relation métonymique au corps, relation qui se voit comme reportée sur l’entité virtuelle qu’est Samantha.
14À ce travail du film pour créer un individu à partir d’une voix s’ajoute le travail du spectateur. Le fantôme sensoriel aiguise nécessairement la curiosité, c’est même selon Michel Chion le propre du dispositif acousmatique que de « susciter […] ce désir d’aller voir qui parle » (Chion 1993, 30). À défaut d’une véritable révélation, nous ne pouvons qu’imaginer Samantha, qui n’est jamais représentée. Se retrouve ici ainsi le processus de construction d’un personnage littéraire que Vincent Jouve décrit dans L’Effet-personnage. Pour l’auteur, le roman ne peut épuiser son objet et ne peut donc donner qu’une description partielle, incomplète, d’un personnage que le lecteur est alors invité à combler :
L’identité du personnage ne peut se concevoir que comme le résultat d’une coopération productive entre le texte et le sujet lisant. […] La perception d’un personnage ne peut trouver son achèvement que chez le lecteur. […] Placé comme l’auteur devant des figures structurellement inachevées, il doit à son tour se poser comme une conscience englobante. C’est à lui de pallier l’incomplétude du texte en construisant l’unité de chaque personnage. (Jouve 27-36)
15Le personnage serait ainsi une image mentale amorcée par le texte et achevée par le lecteur, selon un registre à la fois extra-textuel (le lecteur puise dans son expérience personnelle) et intertextuel (par superposition, croisement avec des figures similaires provenant d’autres textes). Cependant Vincent Jouve nie au cinéma la capacité de convoquer des images mentales, de laisser au spectateur la liberté de créer ce type d’« image-personnage » (Jouve 40). Selon lui, dans un film le personnage est donné à voir : il y est le produit d’une perception puisque l’objet préexiste, tandis que dans le roman où l’objet n’est pas donné, le personnage est le produit d’une représentation induite par le texte et créée par le lecteur.
16Or, c’est bien à une « image-personnage » que l’on a affaire dans Her, selon un processus impliquant la relation vu/entendu que décrit Michel Chion lorsqu’il oppose le dispositif radiophonique à celui du cinéma muet :
[Le spectateur du cinéma muet] ne peut pas entendre des voix, mais elles résonnent dans son imagination. Comme l’auditeur de radio donne un visage à ses animateurs préférés, même et surtout s’il n’a jamais vu leur tête (ce qui lui permet de rêver d’autant mieux sur ces visages), le spectateur du film muet […] rêvait les voix du film […] par le fait même de les sous-entendre. (Chion 1993, 21)
17Dans Her, la voix de Samantha, omniprésente, ouvre une brèche dans l’imagination du spectateur qui rêve le corps de ce personnage par le fait même de le « sous-voir ». L’image-personnage se construit alors bien par la combinaison entre le régime extratextuel et intertextuel, et ce d’autant plus qu’intervient un paramètre propre au personnage filmique : l’actrice qui prête sa voix à Samantha6. Scarlett Johansson n’apparaît jamais dans Her mais il s’agit d’une star du cinéma américain contemporain bien connue du grand public7, notamment pour avoir incarné des personnages physiques, que ce soit par exemple chez Woody Allen, quand elle interprète une femme sensuelle et séductrice (Scoop en 2006, ou Vicky Cristina Barcelona en 2008), ou dans des blockbusters (The Avengers de Joss Whedon en 2012 ou Lucy de Luc Besson en 2014) où elle multiplie les scènes d’action en combinaison noire moulante. La perception que le spectateur se fait de Samantha peut donc être orientée, mais non sans permettre une certaine liberté, à la fois parce que l’actrice américaine change régulièrement d’apparence (dans ses films comme lors de ses apparitions publiques, tour à tour blonde, brune, rousse, glamour ou ingénue, femme fatale ou naturelle) et surtout parce que rien n’oblige le spectateur à se plier à l’une ou l’autre de ses facettes. Cette liberté laissée à l’imagination du spectateur est clairement évoquée dans le film lorsque, avant l’initialisation de Samantha, Theodore a une relation sexuelle par téléphone avec une inconnue surnommée « Sexy Kitten » : la caméra reste en plan rapproché sur le visage de Theodore tandis que les propos provocateurs de l’interlocutrice sont en off (faisant d’elle le premier acousmêtre rencontrée par Theodore), quand soudain intervient à l’image une jeune femme enceinte nue, regardant fixement la caméra dans une posture enjôleuse. Cette vision fantasmée apparaît comme la version animée d’une photo entrevue par Theodore peu de temps auparavant et représentant une jeune actrice enceinte. Ainsi le jeune homme s’affranchit du « programme » fixé par le pseudonyme pour le moins explicite de « Sexy Kitten » pour projeter sur la voix un corps qui répond à son propre fantasme, tout comme le spectateur peut décider d’associer ou de distinguer Samantha de l’actrice qui l’interprète. Et c’est bien l’un des pouvoirs de l’acousmêtre qui œuvre ici, celui de recouvrir virtuellement une infinité d’apparences. Cette potentialité est comme illustrée dans un plan du film lorsque Theodore, allongé sur la plage, discute avec Samantha et qu’intervient un contrechamp sur plusieurs femmes, assises de dos face à la mer [figure 1].
Figure 1
18Ce plan, qui semble correspondre au regard de Theodore, montre des femmes anonymes, aux apparences diverses, comme autant de corps possibles pour Samantha, acousmêtre ne pouvant en définitive être ni limité, ni contraint, et dont la voix autorise la projection d’affects et de fantasmes.
19Ainsi, les simples sons provenant d’un logiciel informatique composent progressivement un personnage au corps chimérique. Selon Nicole Brenez, spécialiste de la dimension figurative au cinéma :
Si, dans le réel, l’équivalence entre corps, individu et personne fait l’objet d’un maillage identitaire de plus en plus serré, rien n’oblige à le reconduire au cinéma. Au cinéma, […] il peut y avoir personnage sans personne ou corps sans support […]. Le cinéma peut reconduire mais aussi réouvrir l’ensemble des notions et partitions par lesquelles nous appréhendons les phénomènes de présence, d’identité, de différence. (Brenez 13)
20L’acousmêtre de Her semble donc, précisément en « défaisant » l’unité voix/corps, faire la preuve de ce « maillage identitaire » dont parle Nicole Brenez, tant la voix apparaît comme une partie d’un tout qu’elle suffit à convoquer.
Au-delà de la voix : une incarnation impossible
21Cette association entre voix, corps et individu est à la fois attestée et mise à l’épreuve dès lors que Samantha souffre de plus en plus de ne pas posséder d’enveloppe charnelle : si Theodore (comme le spectateur) semble s’acquitter de l’actualisation de Samantha uniquement par le biais de sa voix, le film ne va cesser d’interroger ses effets de présence puis éprouver le « maillage » entre voix réelle et corps chimérique.
Absences
22L’absence de corps se manifeste en particulier à travers le montage et la composition interne des images. Comme évoqué précédemment, lors des discussions entre Theodore et Samantha, Spike Jonze fait l’impasse sur le procédé classique du champ-contrechamp, traditionnellement utilisé pour filmer les conversations, laissant ainsi la caméra sur Theodore sans que jamais le contrechamp sur son interlocutrice ne puisse intervenir. Cette absence de contrechamp, contrainte et forcée, peut se lire comme un achoppement du montage qui, face à une figure absente, n’a d’autre choix que se figer sur le seul personnage visible. La composition interne ne fait qu’accentuer ce sentiment, tant elle est travaillée en permanence par des effets de vides et de décadrages. Theodore est régulièrement filmé en plan moyen, parfois légèrement décentré, laissant à côté de lui une place vacante. Lorsqu’il est assis sur un banc ou sur un fauteuil, le siège adjacent, qui meuble une grande partie du champ, est systématiquement inoccupé [figures 2 et 3] ; de la même manière, tandis que Theodore est allongé sur la plage, l’arrière-plan laisse deviner des vacanciers par dizaines, entassés les uns sur les autres, là où un espace étrangement vide entoure Theodore.
Figure 2
Figure 3
23Plus flagrant encore, dans ce plan où il est appuyé contre le bastingage du pont supérieur d’un bateau : la proue du navire, parfaitement centrée dans l’image, crée un effet de symétrie que l’absence de Samantha à côté de Theodore vient fausser [figure 4].
Figure 4
24Ce sont également des effets de miroirs qui signalent cruellement l’absence physique de l’intelligence artificielle, notamment lorsque Theodore et Samantha profitent d’un séjour avec un couple d’amis. Leurs conversations sont généralement filmées par des champs-contrechamps enfin possibles, opposant Theodore seul, face au couple : tandis qu’il apparaît de dos en amorce dans le coin droit du cadre, l’espace vide à ses côtés laisse voir le couple à l’arrière-plan [figure 5].
Figure 5
25Si, à quelques reprises, on aperçoit dans l’emplacement virtuel de Samantha le petit appareil électronique qui l’« héberge », cet objet peine à occuper l’intervalle, la béance laissée par un corps qui ne peut véritablement s’incarner.
Un corps en trop
26S’ensuit le désir de Samantha de « prendre corps », désir par lequel elle s’inscrit dans le destin des acousmêtres : « l’intervention d’une voix acousmatique fait souvent du récit une quête dont le but est de parvenir à le fixer sur un corps » (Chion 1993, 65). Alors que leur relation évolue et que le jeune couple partage des moments d’intimité de plus en plus érotiques (réussissant là où l’expérience avec Sexy Kitten avait échoué), Samantha propose à Theodore de faire appel à une véritable personne pour prendre sa place physiquement. Ce dernier, perplexe, accepte à contrecœur, et reçoit chez lui une jeune femme équipée d’une oreillette et d’une petite caméra qui valent pour les yeux et les oreilles de Samantha. Mais à peine quelques baisers ont-ils été échangés qu’il repousse brusquement la jeune femme dès qu’elle se montre trop entreprenante. La tentative de passer par un corps de substitution échoue : Theodore ne parvient pas à jouer le jeu, à voir Samantha dans ce corps étranger qu’il rejette. Cette scène est très clairement celle d’une « mise-en-corps » impossible, pour reprendre l’expression de Michel Chion. Selon l’auteur, la mise-en-corps, ou la désacousmatisation, est le « processus par lequel un acousmêtre se matérialise visuellement » (Chion 2014, 220), le moment où se réalise « l’assemblage simultané du corps visible et de la voix audible », ce qui est « une certaine façon pour le corps d’attester : “ceci est ma voix”, et pour la voix “ceci est mon corps” » (Chion 1993, 131). Or, dans cette scène, l’assemblage d’une voix et d’un corps, cette tentative de désacousmatisation, s’avère être un échec, et ce pour au moins trois raisons. D’une part, la matérialisation du corps venant parasiter la seule présence vocale apparaît comme cause d’affaiblissement du désir car le film met précisément en exergue le potentiel érotique et fantasmatique de la voix. D’autre part, il est possible que cela soit lié au pacte conclu jusqu’alors : la jeune femme ne correspond pas à la mise-en-corps imaginaire effectuée par Theodore (ou par le spectateur) ; elle ne coïncide pas avec l’image-mentale que nous avions conçue. Enfin, la mise-en-corps de Samantha ne respecte pas une convention purement cinématographique sans laquelle le « collage » voix/corps est compromis, soit la synchronisation de l’image et du son. Pour Michel Chion, la synchronisation est cette « opération de greffe de la voix non-localisée sur un corps particulier qu’on lui assigne symboliquement pour source » (1993, 118). Et pour que la synchronisation fonctionne, pour que le spectateur y croie, il faut que la voix puisse être rattachée à son lieu d’émission, en l’occurrence la bouche. Cette condition d’une synchronisation réussie est évidente dans les cas où, justement, elle n’est pas remplie : par exemple, un doublage réalisé grossièrement et impliquant un trop grand décalage entre le mouvement des lèvres de l’acteur et les paroles entendues, crée une rupture du pacte de croyance. C’est ce type de défaut, de discordance qui empêche la « mise en corps » de Samantha, puisque la jeune femme supposée l’incarner ne bouge pas les lèvres, à l’image d’un ventriloque. Nous entendons une voix, celle de Samantha, nous voyons un corps, celui de la jeune femme, mais il n’y a pas de coïncidence entre les deux – la greffe ne peut donc pas prendre et le corps de substitution est rejeté. Si bien qu’il y a finalement ici, non pas un corps qui manque, mais un corps en trop, un corps qui fait écran, celui de la jeune inconnue.
27L’échec de cette incarnation n’est pas dû à une faiblesse de l’association voix/corps/personnage, mais, au contraire, à la force de ce contrat qui attache la voix au corps dont elle est censée émaner, et à la force des conventions qui le régissent. Au fond, peut-être que la tentative de « mise en corps » survient trop tard : Samantha a eu le temps de se personnifier, de se forger un caractère, d’imposer sa voix, une voix trop personnelle, individualisée, pour qu’elle puisse être plaquée sans heurt sur le premier corps venu.
Une voix illocalisable
28Sans aucun corps pouvant la prendre en charge, se pose le problème de la localisation de Samantha, qui rejoint la caractéristique même du son au cinéma. La convention veut que nous rattachions le son à la source dont il émane, autrement dit que nous le fixions à un lieu, alors même que le son ne relève pas du domaine du visible – pour le dire avec Michel Chion, il n’y a pas de cadre sonore, comme on parle de cadre pour l’image. Concernant Samantha, la source (l’oreillette ou les enceintes intégrées aux appareils informatiques utilisés par Theodore) est à peine visible, et même souvent cachée. Il est dès lors difficile de lui assigner un lieu d’émission et plus encore de la définir en fonction des catégorisations cinématographiques usuelles du son. Ne correspondant ni à un son off (puisque la voix intervient dans l’espace diégétique de la scène), ni à un son in (puisque sa source n’est pas visible), on pourrait, par défaut, considérer la voix de Samantha comme un son hors-champ, mais un hors-champ définitivement illocalisable, le « ni tout à fait dedans, ni clairement dehors » dont parle Michel Chion. À la fois partout et nulle part, la voix de Samantha habite l’intégralité de l’espace sans y être cadrée, fixée, et manifeste en cela l’un des pouvoirs de l’acousmêtre : son don d’ubiquité. Ce don est particulièrement effectif pour Samantha, car non contente d’être présente partout et à n’importe quel moment pour Theodore, il s’avère qu’elle l’est aussi pour d’autres. C’est ce qu’elle confesse à la fin du film, lorsqu’elle apprend à Theodore, comme un amant avoue un adultère, qu’elle communique en même temps avec plusieurs milliers d’autres personnes. À cet instant, la caméra qui, jusqu’alors, était restée fixée sur Theodore assis, désemparé, sur les marches du métro, propose un contrechamp dans lequel une foule d’individus s’affaire, portant une oreillette. Ce n’est plus une Samantha invisible qui flotte autour de Theodore, mais, en puissance, une infinité.
29Samantha est donc un exemple parfait d’acousmêtre révélant tout le potentiel de la voix. Celle-ci apparaît comme l’initiatrice d’un processus par lequel un personnage prend vie. Elle est l’origine et le fondement d’un corps censé lui préexister. Le personnage filmique résulte bien d’un « ensemble de processus d’abstraction », selon les termes de Nicole Brenez (183), apparaissant comme un « leurre » dont il suffit d’entendre la voix pour supposer un corps et considérer un individu.
30Cet acousmêtre, aussi contemporain soit-il en ce qu’il pose des questions très actuelles liées au virtuel et à l’intelligence artificielle, peut cependant tout aussi bien s’inscrire dans une tradition bien ancienne que l’on pourrait faire remonter au mythe d’Écho, la nymphe condamnée à répéter les derniers mots qu’elle a entendus, et dont le corps, selon les versions du mythe, s’évanouit dans l’atmosphère pour n’être plus qu’un son, ou se transforme en roche renvoyant les dernières paroles prononcées à leurs émetteurs. On pourrait presque voir dans Her une continuation ultra-contemporaine du mythe d’Ovide. Les personnages de Theodore et Samantha, êtres solitaires incapables de concrétiser leur rencontre, condamnés à l’errance, ont en effet quelque chose du chasseur Narcisse et de la nymphe Écho. Theodore est rivé à des écrans qui ne lui renvoient que son propre reflet, puisque Samantha s’est développée en fonction de lui, de ses goûts, de ses désirs. Quant à elle, comme Écho répétant ce que son amant lui dit, Samantha n’est initialement programmée que pour satisfaire et anticiper ses attentes. À ceci près que le mépris affiché par le bel et insaisissable Narcisse pour la nymphe malheureuse se retourne ici contre Theodore : là où Narcisse abandonnait Écho à son sort, préférant sa propre compagnie, dans Her, c’est Samantha qui finit par délaisser Theodore.
31Déjà, le mythe d’Écho mettait en évidence le lien, mais aussi la dualité, la scission possible entre voix et corps, et tels les acousmêtres définis par Michel Chion, la voix de la nymphe « rôdait à la surface, à la fois en dehors et en dedans, en peine d’un lieu où se fixer » (Chion 1993, 34). Cependant, cette peine, cette souffrance de n’être qu’une voix sans corps est, et demeure, un supplice pour Écho. Punie par Junon et rejetée par Narcisse, la nymphe se laisse dépérir, oublie de se nourrir, et se dessèche, ses os prenant la forme d’un rocher. Au contraire, Samantha se développe en fonction de Theodore ainsi que des centaines d’autres interlocuteurs, amants ou amis, avec lesquels elle communique simultanément. À la fin du film, elle avoue préférer ne pas avoir de corps pour ne pas être limitée, bloquée dans une enveloppe charnelle vouée à disparaître. Elle refuse finalement le sort auquel une incarnation l’aurait destinée, manifestant par là-même la différence entre voix et corps : là où le corps est fixé, déterminé dans un espace, la voix, elle, demeure illocalisable. Tirant profit de son évanescence et de sa capacité d’acousmêtre à être partout à la fois, Samantha dépasse en fin de compte le statut de simple écho pour exister ailleurs, dans un monde de voix sans corps. Elle s’évapore, ou plutôt se métamorphose, vers un ailleurs peuplé d’intelligences artificielles que les mortels n’intéressent plus.
Bibliographie
BRENEZ, Nicole. De la figure en général et du corps en particulier : l’invention figurative au cinéma. Paris/Bruxelles : De Boeck Université, 1998
CHION, Michel. La Voix au cinéma (1982). Paris : Cahiers du cinéma, 1993.
CHION, Michel. L’Audio-vision. Son et image au cinéma (1990). Paris : Armand Colin, 2014, 3° édition revue et augmentée.
GARDIES, André. Le Récit filmique. Paris : Hachette, 1993.
JOUVE, Vincent. L’Effet-personnage dans le roman (1992). Paris : Presses Universitaires de France, 2001.
Notes
1 Michel Chion crée ce néologisme en empruntant le terme « acousmatique » à Pierre Schaefer qui l’a théorisé pour définir les situations où l’on entend un son sans voir la source dont il provient.
2 Her fait d’ailleurs explicitement référence à l’intelligence artificielle imaginée par Kubrick : Samantha n’est jamais représentée sous une apparence humaine, elle est identifiée au petit appareil électronique de Theodore, dont l’objectif rond sur fond rouge évoque évidemment le cercle, assimilable à un œil, qui matérialise le robot HAL.
3 Le terme « actuel » est ici employé dans son acception philosophique, au sens de ce qui existe concrètement, qui passe de la puissance, du virtuel, à l’acte.
4 Selon Michel Chion, le point d’écoute est, au sens subjectif, « le personnage par les oreilles duquel est suggéré que nous entendons un son » (Chion 2014, 224).
5 Anecdote significative : Scarlett Johansson a été récompensée par le prix d’interprétation au Festival International du film de Rome en 2013 pour le personnage de Samantha, preuve de son travail d’actrice remarquable, ayant été capable d’invoquer un personnage à part entière à travers la voix seulement.
6 Voir notamment André Gardies et la notion de « figure actorielle » selon laquelle le personnage au cinéma relève de l’interaction entre ses quatre composants : l’actant, le rôle, le personnage et le comédien-interprète (Le Récit filmique, en particulier le chapitre 4 : « L’acteur-personnage »).
7 À l’origine, le rôle de Samantha devait être tenu par Samantha Morton, une comédienne quasiment inconnue du grand public, dont le timbre se serait alors peut-être plus facilement confondu avec les voix artificielles anonymes, dépersonnalisées.
Pour citer ce document
Quelques mots à propos de : Céline Saturnino
Auteure d’une thèse sur le cinéaste Gus Van Sant, Céline Saturnino est docteure en études cinématographiques et enseigne à l’Université Paul-Valéry Montpellier III. Spécialisée en esthétique du cinéma et en analyse filmique, elle travaille sur le cinéma contemporain et nord-américain. Ses recherches portent en particulier sur l’évolution des formes filmiques à travers la postmodernité et l’intertextualité, ainsi que sur la relation corps/personnage. Elle a publié notamment dans la revue Eclipses (sur Arnaud Desplechin, Jerzy Skolimowski, John Boorman, Sidney Lumet) et dans plusieurs ouvrages collectifs, dont Après Welles : influences et imitations (dirigé par Jean-Philippe Trias, éd. Deuxième Époque, 2020, à paraître) et La Famille au cinéma (dirigé par Estelle Espinoux et Magalie Flores-Lonjou, éd. Mare & Martin, 2016). Elle est co-directrice de l’ouvrage John Cassavetes. Imaginaire des corps, entre la scène et l’écran (éd. Deuxième Époque, 2019, à paraître).