
Hudson AI, une entreprise spécialisée dans l'intelligence artificielle vocale pour les médias, a annoncé le 25 la mise à jour de sa solution de doublage par IA, « Hudson Studio ». Cette mise à jour vise à améliorer la précision des expressions émotionnelles et à automatiser le flux de production du doublage. Le produit, anciennement appelé « Timber », s'appelle désormais « Hudson Studio ».
Hudson Studio est une solution intégrant les technologies d'IA vocale nécessaires à la production et au doublage multimédia, notamment la séparation des voix, la séparation des locuteurs, la transcription vocale (STT), la synthèse vocale (TTS) et la conversion vocale (VC). Elle permet d'extraire les dialogues des vidéos pour générer des sous-titres ou de synthétiser une narration et un doublage avec la voix et l'émotion souhaitées. Compatible avec plus de 80 langues, elle possède une structure modulaire, offrant ainsi la possibilité de sélectionner et de combiner les fonctionnalités selon les besoins.
Cette mise à jour améliore la précision de l'expression émotionnelle du doublage par IA, reflétant automatiquement les émotions subtiles du personnage et les éléments de son jeu non verbal. Les fonctionnalités d'édition pour l'utilisateur ont également été améliorées, lui permettant d'affiner le ton émotionnel et de recevoir des suggestions d'étiquettes émotionnelles similaires grâce au « Système d'étiquettes directionnelles ».
Les fonctionnalités d'automatisation des flux de travail ont également été améliorées. L'IA segmente automatiquement l'audio et la vidéo, reconnaît les locuteurs, analyse le contexte et les émotions des scènes pour générer des traductions naturelles et traite l'ensemble du processus, de la synthèse vocale au contrôle qualité. Grâce à cela, 30 séries et 500 heures de doublage ont pu être produites en trois mois environ.
Hudson AI prévoit de transformer Hudson Studios en un agent de doublage IA entièrement automatisé à l'avenir, en l'optimisant pour répondre à une demande de doublage saisonnière et à volume élevé pour les plateformes OTT, les chaînes FAST et les plateformes mondiales de séries dramatiques courtes.
Le PDG Shin Hyun-jin a déclaré : « Cette mise à jour nous permet de refléter les émotions détaillées de l'orateur tout en réduisant le temps de production grâce à l'automatisation du flux de travail », ajoutant : « Elle peut simultanément résoudre les problèmes de budget, de qualité et de calendrier pour les plateformes médiatiques qui nécessitent un doublage de masse. »
- Voir plus d'articles connexes
You must be logged in to post a comment.