Dans l’exposition « Surréalisme » qui ouvre le 4 septembre au Centre Pompidou résonne la voix d’André Breton lisant son fameux « Manifeste du surréalisme ». Explications avec Axel Roebel, chercheur acousticien, qui a permis cette reconstitution.
Avez-vous déjà « cloné » plusieurs voix ?
Axel Roebel. Oui, nous avons en 2022 « ressuscité » la voix parlée (non pas chantée) de Dalida, pour une émission de Thierry Ardisson. Et nous avons reconstitué en 2023, à la demande du journal Le Monde, l’appel du 18 juin du général de Gaulle, dont aucun enregistrement n’a été retrouvé. À la différence des outils « text-to-speech », qui génèrent à partir d’un texte une voix synthétique souvent robotique et monotone, la technologie de clonage vocal que nous avons élaborée à l’Ircam permet de reproduire une voix en conservant un son naturel et en modulant ses émotions. Nos modèles utilisent l’apprentissage profond (deep learning). Les performances des outils d’intelligence artificielle (IA) grâce à des supercalculateurs toujours plus puissants nous permettent d’obtenir un résultat bien plus rapidement aujourd’hui qu’il y a encore deux ou trois ans. Actuellement nous utilisons Jean Zay, un des trois superordinateurs français dédiés au calcul scientifique d’une puissance de 36 pétaflops (36 millions de milliards d’opérations par seconde), situé sur le campus d’Orsay, au laboratoire de l’Institut du développement et des ressources en informatique scientifique (Idris).
À partir de quelles sources avez-vous travaillé pour reconstituer la voix d’André Breton ?
A. R. Nous travaillons à partir de trois sources sonores différentes. Nous utilisons d’une part une base de voix de 120 locutrices et locuteurs français, qui parlent chacun 30 à 60 minutes, en lisant des textes sur un ton standard. Nous disposons par ailleurs d’enregistrements de la voix d’André Breton datant des années 1940/1950, alors qu’il approchait les 50 ans. Ils nous permettent de définir la tessiture de sa voix, son « ADN » vocal en quelque sorte. Mais ces enregistrements ne sont pas suffisamment complets, par exemple nous n’avons pas toutes les combinaisons de hauteur et de durée de sa voix, ni tous les diphones, c’est-à-dire toutes les transitions entre deux phonèmes.
Enfin, troisième source, nous avons fait enregistrer à un acteur le texte du Manifeste mais aussi d’autres phrases, en lui demandant d’imiter l’expressivité de la voix de Breton, la voix « cible ». C’est le comédien Hughes Jourdain, âgé de 31 ans, l’âge d’André Breton lorsqu’il a écrit le Manifeste, qui s’est prêté à ce jeu de l’imitation. Nous avons besoin de cette voix « source » d’un acteur car l’IA ne sait pas s’adapter à un contexte. Quand deux interlocuteurs dialoguent, ils réagissent chacun aux intonations de l’autre, modulent et modifient leur voix en permanence. Donc de même qu’au cinéma, les réalisateurs utilisent la gestuelle d’un acteur quitte à transformer ensuite son apparence physique, à changer la couleur de sa peau par exemple ; en audio, nous utiliserons les intonations de l’acteur pour combiner ensuite sa voix avec celle de la voix cible.
Vous procédez en plusieurs étapes ?
A. R. Nous débutons par une phase de préapprentissage du modèle : grâce à la base des 120 locuteurs, nous « comblons les trous » de ce qui n’est pas disponible dans les enregistrements d’André Breton (les diphones manquants par exemple), mais dont nous avons besoin pour enregistrer le texte du Manifeste. Nous utilisons environ une vingtaine d’heures de calcul pour cette première étape.
Puis dans une seconde phase dite d’affinage (ou fine tuning), nous concentrons le modèle sur les deux voix, cible (celle de Breton) et source (celle du comédien). C’est à cette étape que le modèle se spécialise et recompose les deux voix entre elles, toujours en respectant des paramètres comme l’intonation, l’émotion. Cette étape se fait en une dizaine d’heures. Ensuite, dans une troisième phase, le modèle peut « tourner » et convertir des phrases aléatoires de l’acteur pour y apporter la couleur ou le timbre de la voix d’André Breton. On peut donc transformer facilement autant de phrases que nécessaire. En revanche, si le modèle doit travailler sur une autre paire de voix source et cible, il faut reprendre tout cet apprentissage depuis le départ.
La voix obtenue est-elle tout à fait identique à l’originale ?
A. R. Non, une personne exercée reconnaît que la voix n’est pas totalement naturelle, notamment à cause des silences au sein desquels on peut entendre des bruits robotiques un peu étranges. Un ingénieur du son travaille donc ce résultat pour s’approcher le plus possible de l’original, mais ce ne peut pas être totalement parfait. C’est un peu comme en vidéo, les images de synthèses progressent en qualité, mais des détails très fins peuvent encore être repérés par un professionnel : par exemple dans le regard d’une personne, une même lumière ne se reflète pas de façon cohérente, dans l’œil droit ou dans l’œil gauche, ce qui ne se retrouve pas dans les images d’animation.
Êtes-vous aujourd’hui capables d’imiter n’importe quelle voix ?
A. R. S’il s’agit de restaurer la voix d’une personne disparue, tout dépend bien sûr des enregistrements disponibles : plus on dispose de temps d’enregistrement de la voix cible, meilleur sera le résultat. Nous sommes aussi tributaires des bases de locuteurs existant sur le marché, qui généralement proposent des voix d’un âge moyen et parlant sur un ton neutre. En outre, ces bases ne sont pas disponibles dans toutes les langues ; Si vous avez besoin de reconstituer une voix très âgée, très jeune ou très expressive, le rendu ne sera pas satisfaisant. En ce qui concerne les voix de personnalités « clonées », nous sommes plutôt sur un marché de niche, sur des demandes artistiques, mais nous travaillons aussi sur de nombreuses autres applications, par exemple sur les modèles « text-to-speech », dans le contexte d’applications pour livres audio afin que les textes soient lus avec plus d’expressivité. ♦
————————————————————
Une exposition labyrinthe
La voix reconstituée du poète et écrivain français André Breton (1896-1966), chef de file du mouvement surréaliste, est au cœur de l’exposition « Surréalisme, l’exposition du centenaire », qui retrace plus de quarante années d’une exceptionnelle effervescence créative, de 1924 à 1969. Cette voix guide les visiteurs dans la découverte de son Manifeste du surréalisme, texte écrit en 1924, conçu à l’origine comme préface à son recueil de poèmes en prose « Poisson soluble ». « Je crois à la résolution future de ces deux états, en apparence si contradictoires, que sont le rêve et la réalité, en une sorte de réalité absolue, de surréalité, si l’on peut ainsi dire », affirme ainsi André Breton, posant les bases d’un mouvement esthétique et politique qui voulut répondre à la double injonction de Marx, « transformer le monde », et à celle de Rimbaud, « changer la vie ». Il définit ainsi le surréalisme : « Automatisme psychique pur par lequel on se propose d’exprimer, soit verbalement, soit par écrit, soit de toute autre manière, le fonctionnement réel de la pensée. Dictée de la pensée, en l’absence de tout contrôle exercé par la raison, en dehors de toute préoccupation esthétique ou morale. »
Adoptant la forme d’un labyrinthe, figure chère aux surréalistes, l’exposition rayonne autour d’un « tambour » central au sein duquel est présenté́ le manuscrit original du Manifeste, prêt exceptionnel de la Bibliothèque nationale de France. À la fois chronologique et thématique, le parcours est rythmé par différents chapitres évoquant les figures littéraires ayant inspiré le mouvement (Lautréamont, Lewis Carroll, Sade…) et les principes poétiques qui structurent son imaginaire (l’artiste-médium, le rêve, la pierre philosophale, la forêt…). Textes, films, dessins, photographies, peintures issues des principales collections publiques et privées internationales sont présentées ici, et notamment des œuvres symboliques du mouvement avec des tableaux de Salvador Dali, René Magritte, Giorgio de Chirico, Max Ernst, etc. ♦
À voir
Exposition « Surréalisme », du 4 septembre 2024 au 13 janvier 2025, Centre Pompidou, Paris.
Informations et billetterie