Table of Contents
Le groupe de presse CMA Média a récemment lancé un nouvel outil de synthèse vocale, dénommé MaX, Media Audio Experience. Ce dispositif, qui sera déployé dans plusieurs de ses titres à partir de janvier 2026, promet d’adapter des articles écrits en audio avec une voix humanisée.
Une innovation en phase de test
Depuis juin, les abonnés de La Provence ont remarqué l’apparition d’un nouveau bouton sur le site et l’application mobile du journal. MaX est actuellement en phase de test sur les interfaces de ce quotidien marseillais, avant d’être étendu à l’ensemble des publications sous la bannière de CMA Média, incluant La Tribune et La Tribune Dimanche.
Fonctionnement de MaX
La promesse de MaX est de transformer le texte écrit par les journalistes en contenu audio grâce à l’intelligence artificielle. Le développement de cet outil est le résultat d’une collaboration entre plusieurs entités, dont BGG X, la filiale technologique du Boston Consulting Group, le laboratoire d’IA Kyutai, ainsi que Gemini, la branche IA de Google, et Mistral AI. L’outil s’inspire également de la radio, bénéficiant de la contribution de journalistes de RMC, qui font partie de CMA Média.
Démo au salon VivaTech
Ce mercredi, les acteurs du projet se sont réunis au salon VivaTech sur le stand de CMA CGM, la maison mère de CMA Média, pour présenter cette nouvelle innovation. L’occasion de découvrir MaX en action sur un article publié le 10 juin dans La Provence, qui traitait d’un navire humanitaire de soutien à la Palestine.
Imitation de la voix humaine
Pour utiliser MaX, il suffit d’accéder à l’article souhaité sur le site ou l’application mobile, puis de lancer la lecture. Une voix féminine introduit le titre, suivie du corps de l’article après un court jingle. La voix de synthèse, clonée à partir d’une actrice de doublage par Kyutai, parvient à reproduire efficacement les intonations humaines. Malgré quelques imperfections, elle est presque indiscernable d’un enregistrement humain.
Révisions et personnalisation du contenu
À la deuxième écoute, des modifications peuvent être notées dans le texte oral. Par exemple, le terme « arraisonné » est remplacé par « intercepté » pour un rendu plus accessible. Les longues citations sont souvent adaptées pour une meilleure intelligibilité. Le dispositif inclut également une fonctionnalité de personnalisation, développée par Mistral AI, qui permet de générer des contenus audio selon les préférences de l’utilisateur.
Une réponse aux attentes du public
Bien qu’il soit encore trop tôt pour évaluer pleinement l’impact de MaX, cet outil de CMA Média pourrait accélérer la production de contenus audio pour ses différents titres de presse. Cette innovation arrive à un moment où plus d’un Français sur deux entre 15 et 80 ans écoute des contenus audio numériques quotidiennement, selon Médiamétrie.