Courte-Focale.fr : Dossier - Performance Capture et Cinéma Virtuel

Performance capture
Cinéma virtuel
Le cas de La planète des singes

« Ce qui reste encore à faire, c’est la création à l’écran d’un humanoïde, avec des yeux, un nez, etc., qui pourrait exprimer des émotions de façon crédible. À mon sens, la création d’Humphrey Bogart ou de Marilyn Monroe – même si je comprends en quoi l’idée est attirante pour beaucoup de gens – a quelque chose de dérangeant. Ce ne sera jamais qu’une approximation. Ne nous leurrons pas : on ne pourra jamais ressusciter la manière de jouer de quelqu’un. Mais une application de cette technologie pourrait être valable dans une histoire qui suivrait par exemple Mel Gibson sur quarante ans : vous pouvez recréer un Mel Gibson de 15 ans par images de synthèse et lui demander de l’interpréter… »

Que James Cameron soit un visionnaire est depuis longtemps idée acquise. Toujours à la recherche de défis à surmonter, passionné par les avancées technologiques et perfectionniste invétéré, le cinéaste prévoyait déjà, à l’époque de cette affirmation faite au cours d’une interview au magazine Première en 2000, l’une des évolutions prochaines de son art. Il n’est d’ailleurs pas interdit de penser qu’il songeait là à son futur Avatar, dont il avait rédigé le scénario quelques années auparavant et qu’il avait dû se résoudre à ne pas mettre en images, faute de technologie adéquate. Cette évolution, c’est évidemment la performance capture. Enfin, il faudrait plutôt dire que c’est « évidemment », la performance capture. Et oui, car au gré de plans de communication confus autour de cet outil, de relents réactionnaires et d’un désintérêt total et parfaitement incompréhensible des journalistes à son égard, le fait est là : la performance capture demeure une éternelle anonyme, incomprise et rejetée. En 2011. Sept ans après que Le Pôle Express, premier film ayant bénéficié de son apport, aurait dû mettre en émoi la planète Cinéma.

Reste qu’en sus de cette introduction du procédé dans un long-métrage, le film de Robert Zemeckis fut aussi l’initiateur d’une révolution, elle aussi passée inaperçue et encore aujourd’hui passée sous silence même par ceux ayant enfin adopté les possibilités de la performance capture. Lors d’une interview donnée à Harry Knowles en Juillet 2009, le réalisateur parla de « cinéma virtuel ». Il s’agissait à cet instant de définir plus précisément ce qui faisait l’essence du film pour lequel il était alors en pleine promo, Le drôle de Noël de Scrooge. Mais du coup, quels rapports entretiennent performance capture et cinéma virtuel ? Quel lien unit Le Pôle Express, Monster House, Renaissance, Cars, Happy Feet, La légende de Beowulf, Le drôle de Noël de Scrooge, Avatar, The Prodigies, Milo sur Mars et Le Secret de la Licorne ? Et puis c’est quoi le cinéma virtuel nom de Dieu ?!!
Petite précision en préambule. Dans la forme que prend ce dossier, nous avons volontairement décidé de séparer deux étapes d’un même mécanisme créatif. En l’occurrence, en nous attardant sur la méthodologie particulière qui nous intéresse aujourd’hui, nous avons décidé de parler distinctement de ses deux composantes principales, à savoir la performance capture et le cinéma virtuel. Néanmoins, si Robert Zemeckis lui-même différencie ces deux notions, il n’est pas rare, dans la presse en particulier, de désigner la totalité du procédé par le seul terme « performance capture », à des fins de raccourci, de simplification. Si ce souci de terminologie n’a au final que peu d’importance tant que ce qu’elle implique est compris, il était important de préciser que les lignes à venir ont « seulement » pour but de reposer, le plus clairement possible on l’espère, les bases dudit mécanisme en définissant précisément ce qui en fait l’essence.

PERFORMANCE CAPTURE

« Ni l’histoire ni la qualité de l’animation n’émeuvent, surtout si on les compare avec la dernière production Pixar en date… » – Gérard Delorme, Première, à propos du Pôle Express
« Petit film d’animation au ton joyeusement macabre, Monster House n’offre pas de prouesses technologiques… » – Emmanuel Denis, L’écran fantastique
« Quand deux géants hollywoodiens s’attaquent à un petit Belge, cela donne un film d’animation en 3D. » – Véronique Trouillet, Studio Ciné Live, octobre 2011, à propos du Secret de la Licorne
« Steven, Tintin est votre premier film en performance capture… » – Véronique Trouillet, dans le même magazine, le même mois, le même article.
« This is not an animated film. » – James Cameron à propos d’Avatar

L’approche est simple et compliquée à la fois. Simple, dans la mesure où certains pré-requis ont été assimilés. Il n’est pas rare de voir la performance capture comparée à de l’animation, à de la rotoscopie ou à sa version « light », la motion-capture. Si cette dernière a un lien direct avec la technique qui nous intéresse ici, elle n’a en revanche rien à voir avec les deux précédentes. Comme son nom l’indique, on parle de films d’animation lorsque tous les éléments qui le constituent résultent d’un travail d’animateurs. Il s’agit là d’un travail image par image, dont la succession créera le mouvement voulu. Si acteurs il y a, ils ne sont là en partie que pour prêter leurs voix aux personnages. De même, leur présence (qu’il s’agisse des interprètes vocaux des personnages ou tout autres acteurs), si elle est nécessaire à la rotoscopie, n’influe pas sur le résultat final en termes de jeu d’acteur. Leur performance ne sert que de support à l’animateur qui créera lui-même l’animation, en s’en inspirant ou en en reproduisant les mouvements.
Mais la confusion principale provient de la nuance entre motion et performance capture. Prenons à titre d’exemple Final Fantasy, film d’animation ayant eu recours à la motion-capture. Pour ce film, des acteurs se sont essayés à la capture de mouvements. Vêtus d’une combinaison en lycra, sur lesquels sont placés des points, des marqueurs réfléchissant des rayons infrarouges, les acteurs interprétaient les rôles des personnages à des fins de réalisme. Une technique maintenant bien connue de tous, et notamment utilisée sur Le Seigneur des anneaux, avec Gollum. Andy Serkis lui prêtait son corps, et les mouvements du personnage dans le film étaient les siens. Seulement, le travail des animateurs était là encore d’une importance capitale. Dans le cas de Final Fantasy, il n’y avait pas de capteurs sur le visage, pas plus que sur les mains des acteurs. Toutes ces parties-là devaient être animées, littéralement, tout comme le visage de Gollum l’a été (dans les deux films précités, il n’était pas rare de se servir d’une vidéo de l’acteur enregistrant la voix afin de reproduire, image par image, les mouvements réels du visage le plus fidèlement possible).

« Avec la performance capture, Harrison (Ford, ndlr) pourrait faire des films Indiana Jones aussi longtemps que Steven (Spielberg, ndlr) le souhaiterait. » – James Cameron, Empire, Août 2010

Partons du fait établi que dans Monster House, le personnage de D.J n’a pas été animé par ordinateur, mais réellement joué par Mitchel Musso. Concrètement, comment cet adolescent, aussi physiquement normal que vous et moi, est-il devenu ce bonhomme ultra maigrichon aux traits caractéristiques ?
Tout d’abord, en étroite collaboration avec Gil Kenan, le réalisateur, sont créés des dessins précis du personnage, de son apparence finale. Une sculpture basée sur ceux-ci est ensuite réalisée, donnant donc une version « en 3d », en volume, de D.J. La sculpture est numérisée dans la foulée : une version numérique et en trois dimensions de D.J est désormais disponible. À celle-ci, on rajoute les textures, les couleurs et autres détails, comme les tâches de rousseur par exemple. Le personnage est tel qu’il apparaîtra dans le film, à la différence qu’il sera « animé » par le jeu des acteurs.

On l’a dit, l’acteur occupe une place primordiale au sein du procédé. Il en constitue l’essence.
Là se trouve la différence entre motion capture (mo-cap) et performance capture (perf-cap). Pour cette dernière, on cherche à obtenir une « performance ». Autrement dit, si l’acteur bouge un doigt, s’il fait un mouvement à peine perceptible des lèvres, tout ceci sera enregistré sur ordinateur. Contrairement à Gollum, ce ne sont plus uniquement les mouvements du corps qui seront ceux du personnage, mais aussi ceux du visage dans sa totalité. De même qu’au seul niveau du corps, les mouvements sont encore plus précis (à titre d’exemple, 35 capteurs sur le corps pour Final Fantasy, 80 pour Monster House, et sans compter le visage ! Ne parlons même pas de Beowulf et ses 250 capteurs au total pour un seul acteur). Vous l’aurez compris, la perf-cap est une version « upgradée » de la mo-cap, elle est sa version ultime, la plus fine qui soit. On éludera volontairement les progressions faites au sein même de la perf-cap pour la rendre encore plus perfectionnée qu’elle ne l’était le film d’avant (avec l’usage de caméras HD placées devant le visage de l’acteur, notamment). Voix, yeux, lèvres, mains… Dans Le secret de la Licorne, Jamie Bell EST Tintin. Dans Avatar, Zoe Saldana EST Neytiri.

« La performance capture consiste à capturer les mouvements du visage et du corps des acteurs. » – Robert Zemeckis

Si cet outil permet ainsi d’incarner quiconque, il n’en possède pas moins de nombreux autres avantages. Le tournage se déroule, généralement (le cas de La Planète des singes : les origines, est particulier (voir conclusion du dossier)), dans un studio appelé le Volume. Parce que ce studio… a du volume, oui. C’est à l’intérieur de celui-ci que le tournage va avoir lieu. La pièce est entourée par des caméras infrarouges sur lesquelles vont se refléter les capteurs présents sur les combinaisons des acteurs. Le Volume est ainsi inondé d’infrarouges, et les ordinateurs qui reçoivent les informations (l’ensemble des points, des capteurs des combinaisons, et donc le jeu des acteurs) ne « voient », n’enregistrent rien d’autre que l’infrarouge. Le tournage se révèle ainsi particulier.

Dans un film en prises de vues réelles, le tournage, rarement chronologique, s’organise autour de multiples facteurs, d’ordre techniques ou plus simplement météorologiques. Le jeu des acteurs peut être saccadé, au sens où ils ne peuvent jouer une scène entière si le découpage du réalisateur ne le permet pas. Le changement des angles de caméras, les mises en place, un changement de valeur de plan, les coordinations éventuelles entre acteurs et opérateurs… Tout cela prend du temps et la scène – le jeu des acteurs par extension – est fragmentée.
Rien de cela avec la performance capture. Par exemple, si les décors présents dans le film le sont aussi dans le Volume, ils le sont dans une version spécifique puisqu’uniquement constitués de fils de fer, afin de ne pas bloquer les infrarouges et ainsi saisir la performance sous tous les angles possibles. Les acteurs peuvent ainsi interagir comme leurs personnages avec décors ou accessoires. Et à partir de là, c’est la notion même de liberté, celle rabâchée et voulue par certains cinéastes « du réel » qui laissent leurs acteurs improviser, qui est totalement redéfinie.

« Ce procédé enlève le crayon des mains de l’animateur pour le mettre entre celles de grands acteurs. » – Steve Starkey, producteur entre autres du Pôle Express

Dans le volume, un acteur peut jouer une scène entière d’un seul trait. Il n’y a pas de machinerie, de marques à respecter, de coupure entre les prises. La performance peut être capturée pendant les changements de décors, pas de temps à attendre un changement de pellicule. L’acteur ne doit s’occuper que de son jeu et des émotions qu’il cherche à traduire. Dans le même ordre d’idées, le tournage peut très bien être chronologique, puisque ne dépendant pas de facteurs extérieurs. Une sensation de liberté totale, et en soi une forme d’expérimentation qui plaît énormément aux personnes concernées, les acteurs. À tel point que pour l’anecdote, le producteur de Monster House avait demandé à son réalisateur une wishlist des acteurs qu’il désirait, son casting idéal, en le prévenant que jamais il n’aurait tout le monde. Ce fut pourtant le cas.
Mais d’autres évidences découlent du procédé.

« Quand je pense à Monster House, à quoi ressemblerait idéalement DJ ? Même si Mitchell, qui interprête DJ, est adorable, ce n’est pas le DJ que j’imagine quand je ferme les yeux. Le DJ que je vois a des traits exagérés, a de grands yeux, il est incroyablement maigre… » – Gil Kenan, réalisateur de Monster House.

Tout simplement. Que Mitchel Musso ne ressemble pas à D.J n’a aucune importance. Que Simon Pegg et Nick Frost n’aient rien à voir avec Dupond et Dupont, peu importe ! Le cinéaste n’a uniquement à se préoccuper que de la capacité d’un acteur à tenir le rôle voulu. Ray Winstone, qui a notamment été choisi pour incarner Beowulf grâce à sa voix, s’émerveille : « On peut faire 1 mètre 70, être un peu enrobé, ne pas être un Apollon et jouer un héros de presque deux mètres avec des abdos ! ». N’importe quel acteur peut ainsi jouer n’importe qui. Et outre les paradoxes que cela peut impliquer, cela ouvre des possibilités tout simplement faramineuses, et Kathleen Turner jouant la maison dans Monster House n’en est qu’une infime partie. Ray Winstone joue bien aussi le dragon dans La légende de Beowulf. Rien n’empêcherait un enfant de cinq ans d’interpréter un vieil homme, pas plus que cela n’a empêché Jim Carrey d’incarner une ombre dans Le drôle de noël de Scrooge !
Et Tom Hanks de se voir confier cinq rôles dans Le Pôle express, dont celui du jeune héros ; ou Steven Spielberg de venir faire un caméo dans Le secret de la Licorne sans même que l’on puisse se douter qu’il est juste devant nous (le brocanteur, qui vend la maquette à Tintin).
En merveille technologique qu’elle est, la perf-cap autorise donc une liberté totale dans le rôle et le jeu, ainsi que dans la rapidité d’exécution. Est-il donc utile de préciser qu’en combinant les deux, un acteur jouant deux rôles peut passer de l’un à l’autre quand il le souhaite ?

À gauche : Tom Hanks. Au centre : Tom Hanks. À droite : Tom Hanks.

« Curieusement, jouer plusieurs personnages m’a libéré parce que je pouvais, en tant que moitié de la scène, mettre des choses bizarres ou spécifiques, et de l’autre côté je me rappelais de certains de ces moments et je pouvais m’appuyer dessus. » – Tom Hanks

En termes de rapidité, le résultat est assez clair. Pour La légende de Beowulf, une séquence aurait nécessité une journée de travail en prises de vues réelles, selon Robert Zemeckis. Avec la performance capture, cela lui a pris quarante minutes, la première heure du tout premier jour de tournage.

Mais revenons à cette notion de liberté. Car outre celle rattachée aux acteurs, il y a là aussi tout un champ des possibles ouvert au cinéaste. Par exemple, le design de Grendel dans le film précité a été revu suite à la performance de Crispin Glover. Voyant l’acteur beaucoup jouer avec son front, il a été décidé d’enlever les furoncles qui parsemaient cette partie du personnage. En outre, la performance capture n’est qu’une étape à l’échelle du film fini. Car une fois les performances enregistrées sur ordinateurs, les techniciens sont chargés de gérer les nuages de points qui les constituent. En reliant les points entre eux, ils obtiennent le « squelette » du personnage. Aussi, si la performance de l’acteur constitue le squelette d’un héros, l’apparence du personnage obtenue en amont en est la peau. Un maquillage numérique, ni plus ni moins. Concrètement, la performance capture constitue pour le cinéaste l’étape de la direction d’acteurs. L’étape préalable à la révolution dite du « cinéma virtuel ».

CINÉMA VIRTUEL

Vous vous souvenez sans doute tous du flot de logorrhées absurdes qui ont accompagné la sortie d’Avatar il y a bientôt deux ans, et en partie les cris de terreur poussés face à l’incarnation du mal en personne : la 3D. Notamment, le même non-argument délirant qui revenait systématiquement dans la bouche de ses opposants, à savoir « Bergman il avait pas besoin de la 3D pour faire de bons films » et autres « Non mais franchement, dans la prise de position anti-avortement de Juno, elle aurait apporté quoi la 3D ? ». Incapables de différencier les deux-trois couillons qui aimeraient s’amuser à convertir le Nosferatu de Murnau et le procédé en lui-même, l’occasion était évidemment parfaite pour cracher sur une vague opportuniste qui n’avait même pas encore eu lieu. Et qui, deux ans après, commence déjà à s’estomper (les films convertis à la va-vite se font plus rares, la caméra Fusion du duo Pace-Cameron est régulièrement utilisée) ou n’a tout simplement jamais existé (Les films en prises de vues réelles sortant en 3D sont ouvertement moins nombreux que ceux en 2D). Comme si au fond, toute technologie nouvelle était vouée à être adoptée sur tout long-métrage existant. C’est l’un des arguments délirants qui revient en boucle lorsque le cinéma virtuel est abordé. Qu’importe la compréhension de ce dernier, oser parler de futur du cinéma le concernant revient, pour beaucoup, à le généraliser à tous les films, à tous les genres. Un réflexe de paranoïa incompréhensible, surtout qu’il suffirait de se questionner trente secondes sur l’apport du cinéma virtuel pour un film tel que… Polisse. Non pas tant par rapport au film lui-même, que par la seule volonté de sa réalisatrice à réfléchir, à penser sa mise en scène (ou à ne pas le faire, dans le cas présent). Car plus que jamais, le cinéma virtuel constitue un aboutissement en termes visuels, et son utilisateur a avant tout à cœur de pousser au plus loin ses désirs d’expérimentation sur des projets qui le nécessitent.

« Avant d’avoir le cinéma virtuel, on n’avait que deux formats de films. Les films photographiés (en 2D) et les films d’animation. Le cinéma virtuel se situe un peu entre les deux. C’est une manière de présenter un roman graphique filmé, de faire des films qui ne devraient pas être animés, des films qui sont trop élaborés ou impossibles à faire pour de vrai, mais des films très graphiques, qui ont un côté très roman graphique et surréaliste. » – Robert Zemeckis

Vous l’aurez compris, le cinéma virtuel sert, aujourd’hui en tout cas, à donner vie à un univers. Un univers sinon impossible, en tout cas difficile à recréer dans un film live. Et il suffit d’avoir vu deux films d’animation dans sa vie pour comprendre au premier coup d’œil qu’une pareille façon de faire ne peut se satisfaire d’une telle comparaison. Les personnages sont vivants, autant que le sont les acteurs, ont des comportements humains grâce à l’apport de la performance capture. Ainsi le cinéma virtuel a-t-il un apport considérable pour donner vie à l’univers d’Hergé ou de Charles Dickens tels qu’ils les avaient imaginés. Peut-être moins, lorsqu’il est question d’un long-métrage plus classique. Autant la performance capture pourrait avoir un intérêt logique dans le cadre d’un long comme Le ciel peut attendre d’Ernst Lubitsch (on nous conte la vie du personnage incarné par Don Ameche de son adolescence jusqu’à sa mort), autant l’univers dépeint ne justifie pas nécessairement son utilisation et celle du cinéma virtuel. Encore que cela puisse se discuter : après tout, le cinéma virtuel n’a que sept ans et ses capacités ne peuvent que croître, afin de se voir finalement destiné à tout type de cinéma. Mais celui-ci peut amener à créer une hyper-réalité, un monde fait de CGI mais qui, par son photoréalisme ou la crédibilité poussée à l’extrême de ses composants (les acteurs en priorité), provoque des émotions qu’aucun film photographié ou d’animation ne saurait restituer. Venons-en aux faits.

En ayant émancipé le tournage de la mise en scène, en ayant recentré celui-ci sur sa seule direction d’acteurs, Robert Zemeckis et ses équipes ont littéralement bouleversé la méthodologie nécessaire à la fabrication d’un film, celle utilisée depuis les origines. Le mécanisme traditionnel est constitué de trois parties bien distinctes. La pré-production, qui consiste à préparer le film en question (scénario, plannings, financement, charte graphique, etc…) et qui sera ponctué d’un certain nombre de contraintes : disponibilité des acteurs, coordination des équipes, financement insuffisant, réécriture du scénario… La production, à savoir le tournage, durant laquelle le réalisateur collabore avec ses chefs de poste, ses acteurs, effectue sa mise en scène. Le tout, là aussi blindé de contraintes, le temps principalement mais aussi des accidents divers, la météo… La post-production, elle, est la période durant laquelle l’agencement des prises effectuées pendant le tournage va aboutir au film projeté dans les cinémas. Montage, musique, mixage, etc… La contrainte la plus évidente : le tournage est terminé ! Il n’est généralement plus possible de faire des plans supplémentaires, et les images disponibles doivent aboutir à un résultat homogène et cohérent. En d’autres termes, jamais un film ne correspond totalement à la vision originale qu’en avait son réalisateur. À cela, on pourrait citer divers constats de ce genre de la part de grands cinéastes. Où simplement vous conseiller de visionner l’indispensable Lost In La Mancha de Keith Fulton et Louis Pepe, ou l’excellent making-of du The Devil’s Rejects de Rob Zombie.

Le cinéma virtuel se pose comme la solution, ou en tout cas une alternative, aux contraintes des tournages classiques. Une fois les performances de ses acteurs enregistrées, c’est désormais tout le processus de mise en scène qui reste à élaborer. Le réalisateur, en collaboration avec ses chefs de poste, va donc créer le monde dans lequel ses personnages vont prendre vie. Le tout sur ordinateur : qu’il s’agisse de la chambre des gamins dans Monster House ou de l’antre de Grendel dans La légende de Beowulf, les décors sont créés en 3D dans leur intégralité, telle une maquette des endroits voulus, mais dans leurs équivalents numériques. Les personnages, déjà interprétés, sont par la suite installés dans leur environnement. Et là, c’est à l’imagination du réalisateur de faire le reste.

« En 3D, soudainement, on se retrouve avec cet espèce de potentiel extraordinaire, où on peut revenir perpétuellement dans les scènes et cadrer à l’infini, et c’est quelque part quelque chose de complètement magique et complètement abyssal. » – Christian Volckman, réalisateur de Renaissance

Vous l’aurez compris, mise en scène (production) et montage (post-production) sont désormais réunis en une seule et même étape de travail, et ont lieu après le tournage. Désormais, c’est la liberté au sens large du terme qui guide le cinéaste qui, avec l’univers de son film présent devant ses yeux, va pouvoir effectuer sa mise en scène telle qu’il la désire. À l’aide de son chef-opérateur et d’outils informatiques simulant n’importe quel instrument cinématographique réel (focales, objectifs, dolly, grue…), le réalisateur dispose d’une caméra virtuelle, littéralement libre de ses mouvements, grâce à laquelle il pourra matérialiser la moindre de ses envies. Il la place où il le veut, en fonction du storyboard ou de la performance des acteurs, lui fait faire le mouvement qu’il veut, quand il veut et où il veut. Et surtout, il peut répéter ses prises autant qu’il le souhaite : les performances des acteurs sont définies, enregistrées et donc reproductibles à l’infini. Si un acteur a bougé un doigt à un instant T et que le réalisateur juge cela intéressant, rien ne l’empêche d’aller filmer ce doigt : le jeu a été capturé dans sa totalité, indépendamment d’un angle de caméra ou de l’échelle d’un plan. En trois dimensions, en volume.
Et pour des cinéastes aussi « visuels » que Steven Spielberg où James Cameron (et c’est tout sauf un hasard si ce sont eux qui s’y essaient avant les autres), c’est évidemment du pain béni. Plus que cela, cela peut revenir à une nouvelle appréhension de la grammaire cinématographique, une manière de débrider les attentes les plus folles que beaucoup ont passé leur vie à chercher à concrétiser. Mais prenons plutôt le cas de Robert Zemeckis, précurseur dans le domaine du cinéma virtuel. Le monsieur a toujours, dans ses films, tenté de faire des choses impossibles, de s’émanciper des lois de la physique, tout comme le numérique a réellement bouleversé ses velléités de metteur en scène. Certains plans de Contact ou de Forrest Gump en témoignent. Qui veut la peau de Roger Rabbit en est un manifeste on ne peut plus clair. Mais pour bien mesurer l’ampleur des possibilités offertes par le cinéma virtuel et de la nouvelle façon de penser qu’elle peut impliquer, attardons-nous sur quelque chose d’aussi bête qu’une simple transition. Dans Apparences, dans le cas présent.

Au début du premier plan, la caméra cadre ses personnages en plan taille avant d’effectuer un léger travelling avant, se rapprochant de l’épaule gauche de Michelle Pfeiffer avant de stopper sa marche. Par un simple cut, le second plan le suit directement : le décor a changé, mais la situation est identique, la mère enlaçant sa fille. Par effet de symétrie, la caméra se situe maintenant derrière l’actrice et effectue un très léger travelling arrière. Il y avait là une volonté claire de la part de Zemeckis de simuler une continuité entre les deux plans, mais une continuité elliptique. Le fait que le montage soit nécessaire pour que Zemeckis arrive à ses fins peut démontrer, rétrospectivement, sa frustration à ne pas pouvoir modifier le décor en temps réel tout en n’ayant pas à arrêter le travelling initial. Le cinéma virtuel a radicalement changé la donne sur ce simple point. Il suffit de voir Le drôle de Noël de Scrooge pour s’en convaincre. En un plan-séquence démentiel, suite à l’arrivée du fantôme des Noëls passés, Robert Zemeckis effectue des mouvements de caméras virtuoses, durant lesquels celle-ci traverse les époques en temps réel ! Disparition / apparition de personnages, transformation du décor en une fraction de seconde : le cinéma virtuel l’autorise, et le cinéaste peut enfin faire aboutir sa démarche de la façon la plus totale. Dans la même logique, imaginez ce qu’un réalisateur comme Alfred Hitchcock en aurait fait ?! Déjà, dans The lodger (1927), celui-ci recherchait l’expérimentation à des fins de fluidité narrative. Ou Murnau, qui dans L’Aurore, la même année, libérait sa caméra pour donner vie au chef-d’œuvre que l’on connaît ?

« En tant que réalisateur, je peux faire ce que je veux. Je peux mettre la caméra n’importe où, je peux demander la météo que je veux, je peux demander les éclairs que je veux et en même temps j’ai quand même la magie du jeu des acteurs. » – Robert Zemeckis

Le réalisateur de Retour vers le futur confie ici l’une de ses grandes obsessions. Lui qui répète plus de quarante fois dans le commentaire audio de Scrooge que Jim Carrey EST Scrooge, EST AUSSI le fantôme des noëls passés, replace l’acteur au cœur de la méthodologie dont il est l’instigateur.
Nous l’avons vu, le cinéma virtuel autorise la concrétisation de toutes les idées possibles en termes de mise en scène. Nous ne nous attarderons pas plus là-dessus, vous avez sans doute tous déjà vu Le secret de la licorne, et la poursuite de l’aigle vous a sans doute fait frôler l’infarctus. Néanmoins, il a souvent été passé sous silence certaines possibilités pourtant clairement monstrueuses, et dont les acteurs constituent l’épicentre.

Au moment de la performance capture, les acteurs interprètent les interactions qu’ont les personnages entre eux. Ils se regardent ou peuvent se toucher. En prises de vues réelles, dans le cas d’un contact physique, le réalisateur choisit en règle générale un plan ou ledit contact est visible, où totalité ou parties des acteurs se touchent. De fait, ceux-ci deviennent indissociables l’un de l’autre, ils ne pourront changer de position ou de timing au moment du montage. Et on l’a vu, la performance capture enregistre le jeu, à ceci près que les données obtenues sont des points sur un écran, pas un plan prêt à être exploité. Ainsi, les performances sont saisies individuellement, et rien n’empêche le réalisateur d’en modifier le timing. Admettons que deux acteurs se soient regardés en même temps au moment du tournage en perf-cap, parce que le scénario l’imposait. Il est tout à fait possible que dans le film, le moment ou l’acteur 1 regarde l’acteur 2 ait été avancé ou retardé, tout en laissant le timing d’origine de l’acteur 2. Pour diverses raisons, mais parce que ce choix semblait être meilleur que celui d’origine.

Dans la catégorie possibilités illimitées, le cas de Scrooge par exemple. Un plan du film réunit le fantôme des noëls passés en compagnie du vieux Scrooge, de Scrooge tel qu’il était petit garçon et tel qu’il fut adolescent. Jim Carrey interprête les quatre personnages.
Dans une des séquences où intervient le même fantôme, un personnage danse, effectue une cascade, puis a une attitude plus calme. Ce personnage est incarné tantôt par un danseur, tantôt par un cascadeur, tantôt par l’acteur, en fonction de son comportement. Parfaitement inconcevable à la vision du film. La vraie prouesse ? Le personnage fait tout cela… au sein d’un seul et unique plan. Oui, le réalisateur a combiné plusieurs performances, de personnes différentes, en une performance unique et en un seul plan ! Si un acteur a fait un mouvement qui pourrait très bien conclure une autre performance sur une autre scène, la fusion est possible. Tout, l’est.

Attention néanmoins. Cinéma virtuel et performance capture ne sont pas nécessairement dépendants. Dans le cas de Renaissance par exemple, c’est la motion-capture qui fut employée dans le cadre du cinéma virtuel, et non la perf-cap. De même, John Lasseter a usé de cette méthodologie pour une des séquences de course de Cars. Et il n’y a pas de cinéma virtuel dans La planète des singes : les origines. En revanche, les singes sont totalement interprétés par des acteurs, Andy Serkis en tête. Et bien sûr, si un tel dossier a pour but de permettre la compréhension d’un ensemble créatif, il est évident que nous n’avions pas pour but d’être exhaustifs. Perf-cap et cinéma virtuel n’en sont qu’à leurs balbutiements, et sont voués à prendre toujours plus d’ampleurs en termes de possibilités.

« La bonne nouvelle c’est qu’on peut tout faire. La mauvaise, c’est qu’il faut tout faire. » Jack Rapke – Producteur du Drôle de noël de Scrooge

MAJ (14/01/2012) LE CAS DE LA PLANETE DES SINGES

On l’a dit, celui-ci est particulier. Dans la mesure où la performance capture s’émancipe pour la toute première fois du cinéma virtuel, il est de bon ton de revenir, en tout cas brièvement, sur l’évolution d’une technologie enfin à la portée du cinéma en prises de vues réelles. On entend par là qu’un acteur équipé d’une combinaison de perfcap peut dorénavant se mêler à un casting plus « classique » pour interpréter son personnage, tout en continuant à être « capté » différemment de celui-ci.

Comme le rappelle Dan Lemmon, superviseur des effets visuels sur le film, les sessions de perfcap ne pouvaient jusqu’alors prendre place que dans un environnement qui lui était dédié (le fameux volume). Il fallait en général plusieurs jours pour l’installer comme pour l’étalonner, tout comme il était habituel qu’une douzaine d’opérateurs soit nécessaire pour s’occuper de l’équipement et des données à collecter. Dans le cas d’un film comme La planète des singes, où la performance capture doit sinon fusionner, en tout cas s’adapter à un mode de tournage différent du sien, il était nécessaire de rendre tout cela plus flexible, plus rapide à mettre en œuvre.
Mais en dehors de problèmes d’ordre purement technique, il va de soi que la technologie se devait de franchir une nouvelle étape de son évolution. Depuis Le pôle express, outre la volonté des différents réalisateurs d’adopter le procédé couplé au cinéma virtuel pour des raisons que nous évoquions plus haut, la limitation au volume se faisait aussi par nécessité. De par son fonctionnement, il était impossible d’effectuer cela en extérieurs, notamment à cause des reflets pouvant mettre à mal la captation. Dans le même ordre d’idées, la lumière du soleil était une nouvelle donne à prendre en considération. Il a ainsi été décidé de remplacer les habituels marqueurs par des LED (ou diodes électroluminescentes) à infrarouges. Concrètement, celles-ci émettent de courts mais intenses rayons de lumière, et ce en synchronisation avec l’obturateur des caméras adéquates qui reçoivent le rayon. Et dans le cas d’une vitesse d’obturation très lente (autrement dit, l’obturateur reste plus longtemps ouvert et laisse donc passer plus de lumière), il est possible de passer outre la lumière ambiante pour obtenir un repère optimal pour la perfcap.

Bien sûr, la création de caméras permettant de capter ces rayons en plein jour n’est pas la seule nouvelle donnée. Par exemple, certains avantages que nous avons présenté en première partie de notre dossier n’ont plus lieu d’être, notamment l’infinie liberté dans le jeu : qui dit prises de vues réelles dit généralement découpage et décors.
Comme se plaisent à le répéter certains membres de l’équipe du film dans les bonus du blu-ray, le tournage rappelle par bien des aspects celui de Qui veut la peau de Roger Rabbit ?. En tout cas dans le sens où l’une des deux étapes des prises de vue est identique. Car deux étapes il y a. La première est celle qui nous a été présentée au détour de multiples featurettes : Andy Serkis (ou tout autre acteur jouant un singe) interprète son personnage, vêtu de sa combinaison et en compagnie des autres acteurs, devant la caméra. La seconde consiste à retourner les mêmes plans à l’identique, mais sans l’acteur de perfcap. On appelle cela un clean plate, soit la même méthode de tournage que sur le film de Robert Zemeckis précédemment cité. La raison à tout cela est simple : Andy Serkis (entre autres, encore une fois) est plus grand que César. Du fait du tournage live, il est nécessaire de dupliquer les prises de vues afin que la caméra sache ce qu’elle doit filmer derrière le comédien (puisque celui-ci obstrue le champ, ne serait-ce qu’à cause de la caméra braquée sur son visage) afin de restituer le décor de façon exacte lors du « remplacement » de Serkis par son double numérique.

Il était également d’usage de filmer les scènes de César avec un acteur de la même taille que celui-ci (en l’occurrence, une jeune fille). Car entre autres textures et animations à créer (les poils, par exemple), la lumière était aussi à prendre en compte. Andy Serkis étant plus grand que le singe qu’il incarne, la lumière agit différemment sur lui que sur son personnage. La jeune fille servait alors de référence pour restituer correctement son impact sur une taille précise.

6 Comments

On 29 octobre 2011 at 13 h 57 min

Jonathan Placide Says

Très bon dossier, et c’est vraiment important que les gens comprennent ce qu’est le cinéma virtuel et la performance capture. Mais c’est pas demain la veille, malheureusement.
En lisant diverses critiques de journaux, dits super-intellectuels (Positif ou les Cahiers du Cinéma pour ne pas les citer), le simple fait qu’une scène utilisant des images de synthèse puisse être mise en scène, n’a toujours pas été ainsi assimilé. Combien de fois a-t-on lu que tel réalisateur laissait sa place aux effets spéciaux ?
Sinon, je crois avoir aperçu une petite erreur dans votre texte. A savoir le fait que mise en scène et montage sont réunis en une seule étape. C’est vrai, mais pas forcément. Le cinéma virtuel s’adapte aux moyens de tournage du réalisateur. Et le réalisateur peut décider de sa mise en scène au moment de la post-production, ou alors au moment de la production. Cameron sur Avatar utilisait ainsi une caméra lors de la production et avait un rendu approximatif de ce qu’il filmait. Alors que Zemeckis, entre autres, avait choisi effectivement d’effectuer sa mise en scène en post-prod’. Et c’est justement une des choses intéressantes du cinéma virtuel, à savoir le choix.
J’avais une petite question : Ne croyez-vous pas qu’il faudrait également faire un article sur la stéréoscopie ? Pas forcément son historique, mais ce qu’elle apporte réellement. J’ai l’impression que les gens ne comprennent pas ce qu’est la 3D exactement. La plupart croit qu’il s’agit seulement de nous envoyer des objets en pleine face. Il suffit de lire les réactions des spectateurs à la sortie de Tintin où la grande majorité estime que la 3D ne sert à rien, et qu’elle était mieux exploitée dans la pub Haribo ou Oasis juste avant.

PS : Il y a un lien mort : « l’expérimentation » juste au-dessus de l’extrait de Scrooge.

On 29 octobre 2011 at 14 h 09 min

Guillaume Lasvigne Says

Ce n’est pas tant une erreur qu’un oubli volontaire. Je l’ai précisé, cet article n’est pas exhaustif. Il s’agissait avant tout de bien redéfinir les deux notions, de la liberté qu’elles impliquaient. Les aménagements des différents réals, les progressions futures, si elles sont passionnantes, n’étaient pas importantes dans le cadre de ce seul dossier. Je n’ai pas non plus évoquer les caméras de référence par exemple, qui ont leur importance.

On 3 novembre 2011 at 11 h 15 min

tangoche Says

Bravo les enfants!

On 20 mai 2013 at 23 h 31 min

Fred Says

Très bon dossier, très instructif. Je n’avais pas conscience de toutes les libertés apportées par la performance-capture.Merci d’avoir pris le temps de le rédiger. Vous répétez qu’un un acteur est l’égale de l’image de synthèse vue à l’écran, (par exemple Jim Carrey EST Scrooge), alors pensez-vous que cette performance d’acteur est égale à celle d’un acteur filmé en prises de vues réelles, et que donc un acteur de cinéma virtuel peut, lui aussi, prétendre à gagner un oscar ou un césar de meilleur acteur ? Avant de lire votre dossier j’aurais répondu non, j’avais l’impression qu’à l’écran il ne restait plus grand chose de la prestation de l’acteur réalisée pendant le tournage, et que celle-ci avait été modifiée, retouchée, améliorée, transformée par tous les outils informatiques. Mais finalement, votre dossier me fait penser qu’au contraire, le jeu d’acteur reste proche de ce qui a été filmé, et justement un des enjeux est d’arrivée à reproduire le plus fidèlement possible.

On 20 mai 2013 at 23 h 57 min

Guillaume Lasvigne Says

Déjà, il faut garder à l’esprit que ce qui est vu à l’écran n’est pas une image de synthèse. Ce qui est vu à l’écran est l’acteur, maquillé numériquement, de la même manière que n’importe quel acteur d’un film en prises de vues réelles est lui aussi maquillé. Les deux performances sont juste captées différemment.

« alors pensez-vous que cette performance d’acteur est égale à celle d’un acteur filmé en prises de vues réelles »

Tout dépend ce que vous entendez par « égale ». Du point de vue de la mise en scène, on peut sans doute la considérer comme « supérieure » dans la mesure où c’est la totalité de la performance qui est captée (la totalité des mouvements de tous les membres du corps), et n’est donc plus restreinte à un cadre, à un axe de caméra. Le réalisateur peut utiliser n’importe quelle partie de la performance sous tous les angles possibles et imaginables selon les besoins, et surtout, a posteriori de la captation.

Sinon, le procédé est en perpétuelle évolution, au niveau des yeux par exemple. Malgré la perfection apparente de l’acting dans Avatar, il n’est pas impossible qu’Avatar 2 fasse encore mieux. Quand bien même il est tout aussi possible qu’on ne le distingue pas au premier coup d’oeil. De même que cette fois-ci, la performance capture se fera aussi sous l’eau, ce qui va sans doute donner lieu à de nouveaux procédés de captation, ou en tout cas une évolution de ce qui a été fait précédemment.

Le jeu d’acteur n’est pas « proche » de ce qui a été filmé, il n’est pas « reproduit ». Ce qu’il y a à l’écran, en tout cas dans les prods récentes, EST la performance de l’acteur (je sous-entends qu’au niveau des yeux par exemple, dans Beowulf notamment, tout n’était pas parfait). Un oscar pour un rôle de ce type ? Clairement. Zoë Saldana est incroyable dans Avatar, et la presse a souvent relayé la potentialité d’une nomination à l’oscar pour Andy Serkis vis-à-vis de son rôle dans La planète des singes… La principale frontière reste la compréhension de la perfcap. Et quitte à caricaturer, mais il n’en est rien, je le pense vraiment, je n’ai pas vu un seul acteur de perfcap être mauvais. La compréhension du procédé, un gros rôle, et il est très probable qu’une nomination à l’oscar soit obtenue.

On 7 avril 2015 at 19 h 31 min

Mélissa Says

Bonjour, Merci pour ce texte très intéressant. Dans le cadre d’un travail plus ciblé sur le jeu d’acteur, et maintenant que la planète des singes, l’affrontement est sorti, avez vous une idée de la préparation physique que la perfcap exige du comédien en comparaison à un film « normal »? Il doit y avoir un travail immense à faire sur la conscience de soi et de son corps, sur le port de la combinaison? le fait de transporter des caméras sur soi (devant le visage) etc … Avez vous des idées, des infos?

Performance Capture et Cinéma Virtuel

Articles similaires

6 Comments

Laisser un commentaire Annuler la réponse.

Lire les articles précédents :

Harakiri