
La startup d'IA vocale Humelo (PDG Yongseok Kwon) a annoncé le 7 qu'elle participerait au « 2025 International Streaming Festival (ISF 2025) » qui se tiendra à Busan du 22 au 25 août et dévoilerait officiellement sa technologie vocale de nouvelle génération « DIVE Engine ».
L'ISF 2025 est un événement majeur lié à l'industrie du streaming, co-organisé par le ministère des Sciences et des TIC et la ville métropolitaine de Busan, avec la participation de producteurs de contenu nationaux et internationaux, de sociétés de plateformes et de startups technologiques, se concentrant sur les industries OTT et des technologies des médias.
Hummel présentera sa technologie phare lors de l'« Investment Showcase », programme officiel de l'ISF 2025, qui se tiendra à l'hôtel Paradise de Busan le 23. Cet événement permettra aux startups du secteur des technologies de contenu de présenter leurs technologies et leurs modèles économiques aux investisseurs nationaux et internationaux ainsi qu'aux acheteurs internationaux.
Lors de cet événement, Hummel présentera la viabilité commerciale et la compétitivité technologique de sa technologie de synthèse vocale, FRTTS (Few-shot Real-time TTS). FRTTS reproduit la voix de chaque locuteur en environ une minute d'apprentissage vocal et génère un doublage multilingue en temps réel avec une latence inférieure à 0,3 seconde. Elle prend en charge cinq langues, dont le coréen, l'anglais, le japonais, le chinois et l'espagnol. Hummel affirme que cette technologie contribue à réduire le temps et le coût du doublage de contenu.
Hummel dévoilera également pour la première fois lors de cet événement sa technologie de nouvelle génération, le « DIVE Engine » (Deep-context Interactive Voice Engine). Cette technologie va au-delà de la simple synthèse vocale : elle reconnaît le flux de la conversation et le contexte émotionnel et les intègre à la voix. Hummel explique que cette technologie améliorera l'immersion des contenus nécessitant une expression émotionnelle et permettra un doublage multilingue plus naturel qu'auparavant.
Hummel a récemment rejoint l'alliance coréenne K-FAST (télévision gratuite en streaming financée par la publicité) en tant que partenaire technologique, validant ainsi la viabilité commerciale de sa technologie FRTTS. De plus, Hummel offre au grand public la possibilité de découvrir cette technologie grâce à sa plateforme de courts métrages audio IA, « Sori Studio », destinée aux pays anglophones.
Le PDG Kwon Yong-seok a déclaré : « Le moteur DIVE est la prochaine étape de la technologie vocale IA et a une grande applicabilité dans l'industrie mondiale du contenu », ajoutant : « La technologie sera en mesure de renforcer simultanément la compétitivité des créateurs et des plateformes. »
You must be logged in to post a comment.