Alors que les gens se préparent à l'impact perturbateur de l'intelligence artificielle sur les emplois et la vie quotidienne, ceux qui sont dans le monde des livres audio disent que leur domaine est déjà en train de se transformer.
L'IA a la capacité de créer des enregistrements à consonance humaine - à la vitesse d'une chaîne de montage - tout en contournant au moins une partie des services des professionnels humains qui, depuis des années, vivent de leur voix.
Beaucoup d'entre eux connaissent déjà une forte baisse d'activité.
Tanya Eby est comédienne voix à plein temps et narratrice professionnelle depuis 20 ans. Elle a un studio d'enregistrement chez elle.
Mais au cours des six derniers mois, elle a vu sa charge de travail diminuer de moitié. Ses réservations ne durent désormais que jusqu'en juin, alors que dans une année normale, elles se prolongeraient jusqu'en août.
Beaucoup de ses collègues signalent des déclins similaires.
Alors que d'autres facteurs pourraient être en jeu, a-t-elle déclaré à l'AFP, "il semble logique que l'IA nous affecte tous".
Il n'y a pas d'étiquette identifiant les enregistrements assistés par l'IA en tant que tels, mais les professionnels disent que des milliers de livres audio actuellement en circulation utilisent des "voix" générées à partir d'une banque de données.
Parmi les plus avant-gardistes, DeepZen propose des tarifs qui peuvent réduire le coût de production d'un livre audio à un quart, voire moins, de celui d'un projet traditionnel.
La petite compagnie basée à Londres puise dans une base de données qu'elle a créée en enregistrant les voix de plusieurs acteurs qui ont été invités à parler dans une variété de registres émotionnels.
"Chaque voix que nous utilisons, nous signons un accord de licence et nous payons les enregistrements", a déclaré le PDG de DeepZen, Kamis Taylan.
Pour chaque projet, a-t-il ajouté, "nous payons des redevances en fonction du travail que nous faisons".
Tout le monde ne respecte pas cette norme, a déclaré Eby.
"Toutes ces nouvelles entreprises surgissent qui ne sont pas aussi éthiques", a-t-elle déclaré, et certaines utilisent des voix trouvées dans des bases de données sans les payer.
"Il y a cette zone grise" exploitée par plusieurs plateformes, a reconnu Taylan.
"Ils prennent votre voix, ma voix, les voix de cinq autres personnes combinées, ce qui crée simplement une voix distincte … Ils disent que cela n'appartient à personne."
Toutes les sociétés de livres audio contactées par l'AFP ont démenti avoir recours à de telles pratiques.
Speechki, une start-up basée au Texas, utilise à la fois ses propres enregistrements et les voix des banques de données existantes, a déclaré le PDG Dima Abramov.
Mais cela ne se fait qu'après la signature d'un contrat couvrant les droits d'utilisation, a-t-il déclaré.
Avenir de la coexistence ?
Les cinq plus grandes maisons d'édition américaines n'ont pas répondu aux demandes de commentaires.
Mais des professionnels contactés par l'AFP ont indiqué que plusieurs éditeurs traditionnels utilisent déjà l'IA dite générative, qui peut créer des textes, des images, des vidéos et des voix à partir de contenus existants, sans intervention humaine.
"La narration professionnelle a toujours été et restera au cœur de l'expérience d'écoute Audible", a déclaré un porte-parole de cette filiale d'Amazon, un géant du secteur américain du livre audio.
"Cependant, à mesure que la technologie de synthèse vocale s'améliore, nous voyons un avenir dans lequel les performances humaines et le contenu généré par la synthèse vocale peuvent coexister."
Les géants de la technologie américaine, profondément impliqués dans le domaine en développement explosif de l'IA, poursuivent tous l'activité prometteuse des livres audio à narration numérique.
"Accessible à tous"
Au début de cette année, Apple a annoncé qu'elle se tournait vers les livres audio racontés par l'IA, une décision qui, selon elle, rendrait la "création de livres audio plus accessible à tous", notamment les auteurs indépendants et les petits éditeurs.
Google propose un service similaire, qu'il décrit comme "la narration automatique".
"Nous devons démocratiser l'industrie de l'édition, car seuls les plus célèbres et les grands noms sont convertis en audio", a déclaré Taylan.
"La narration synthétique vient d'ouvrir la porte aux vieux livres qui n'ont jamais été enregistrés, et à tous les livres du futur qui ne seront jamais enregistrés à cause de l'économie", a ajouté Abramov de Speechki.
Compte tenu des coûts de l'enregistrement humain, a-t-il ajouté, seuls 5 % environ de tous les livres sont transformés en livres audio.
Mais Abramov a insisté sur le fait que la croissance du marché profiterait également aux acteurs de la voix.
"Ils gagneront plus d'argent, ils feront plus d'enregistrements", a-t-il déclaré.
L'élément humain
"L'essence de la narration est d'enseigner à l'humanité comment être humain. Et nous sommes convaincus que cela ne devrait jamais être confié à une machine pour nous apprendre à être humain", a déclaré Emily Ellet, actrice et narratrice de livres audio qui a cofondé le Professional. Association des narrateurs de livres audio (PANA).
"La narration", a-t-elle ajouté, "devrait rester entièrement humaine".
Eby a souligné une critique fréquente des enregistrements générés numériquement.
Comparé à un enregistrement humain, a-t-elle déclaré, un produit d'IA "manque de connectivité émotionnelle".
Eby a dit qu'elle craignait, cependant, que les gens ne s'habituent à la version générée par la machine, "et je pense que c'est ce qui se passe tranquillement."
Son souhait est simplement "que les entreprises fassent savoir aux auditeurs qu'elles écoutent un morceau généré par l'IA... Je veux juste que les gens soient honnêtes à ce sujet".
© 2023 AFP
Citation: Les narrateurs de livres audio disent que l'IA enlève déjà des affaires (2023, 14 mai) récupéré le 14 mai 2023 sur
Ce document est soumis au droit d'auteur. En dehors de toute utilisation loyale à des fins d'étude ou de recherche privée, aucune partie ne peut être reproduite sans l'autorisation écrite. Le contenu est fourni seulement pour information.
Source