
ボイスAIスタートアップヒュメロ(代表クォン・ヨンソク)は、8月22日から25日まで釜山で開催される「2025国際ストリーミングフェスティバル(International Streaming Festival 2025、以下ISF 2025)」に参加し、同社の次世代音声技術「DIVEエンジン」
ISF 2025は科学技術情報通信部と釜山広域市が共同主催するイベントで、OTTおよびメディア技術産業を中心に国内外のコンテンツ制作会社、プラットフォーム企業、技術スタートアップなどが大挙参加するストリーミング産業関連主要イベントだ。
ヒュメロは23日、釜山パラダイスホテルで開かれるISF 2025公式プログラム「投資誘致ショーケース」を通じて核心技術を披露する予定だ。同ショーケースは、コンテンツ技術スタートアップが国内外の投資家やグローバルバイヤーを対象に自社の技術力とビジネスモデルを紹介する席だ。
ヒュメロは今回のイベントを通じて自社の音声合成技術「FRTTS(Few-shot Real-time TTS)」の商用性と技術競争力を紹介する。 FRTTSは約1分分の音声学習で個別話者の声を複製し、0.3秒以下の遅延時間で多言語ダビングをリアルタイム生成できる技術で、韓国語を含めて英語、日本語、中国語、スペイン語など5つの言語を支援する。ヒュメロ側は、この技術がコンテンツダビングの時間とコストの削減に貢献していると明らかにした。
これと共にヒュメロは次世代技術である「DIVEエンジン(Deep-context Interactive Voice Engine)」を今回のイベントで初めて公開する。この技術は、単純な音声合成を超えて、会話の流れと感情の文脈を認識し、それを音声に反映することが特徴である。ヒュメロはこれを通じて感情表現が必要なコンテンツの没入度を高め、従来より自然な多言語ダビングの実現が可能だと説明した。
ヒュメロは最近、韓国型広告ベースの無料ストリーミングテレビ(K-FAST)アライアンスに技術パートナーとして参加し、これによりFRTTS技術の商業利用可能性を検証した。また、英米圏対象AIオーディオショーツプラットフォーム「サウンドスタジオ」を通じて一般消費者向けの技術体験機会も設けている。
クォン・ヨンソク代表は「DIVEエンジンはAI音声技術の次の段階で、グローバルコンテンツ産業での適用可能性が高い」とし「技術が製作者とプラットフォームの競争力を同時に強化できるだろう」と明らかにした。
You must be logged in to post a comment.