인공지능 기술로 경기 성장 둔화 위기 넘는 K-기업

국내 경제 성장률 둔화가 이어지며 기업의 시름이 커지고 있다. 여기에 국책 연구기관이 지속적인 경기 하향 전망을 내 놓으며 경제 위기가 닥칠 것으로 예상하는 등 국내 경제·산업 전반에 대한 우려가 확대되고 있다. 한국개발연구원(KDI)은 올해 1월부터 3개월 연속 국내 경기의 하방 압력이 커지고 있다고 진단했다. 건설업 부진과 주요 수출 품목인 반도체 수출 가격이 하락하는 가운데 대외 불확실성 확대 영향이 파급되며 수출 증가세가 둔화하고 있다는 설명이다.

이에 기업들은 효율적인 인력 운용과 비용 절감을 위해 외부 서비스를 적극 활용하고 있다. 변동성이 큰 외부 환경보다 통제 가능한 내부 효율을 끌어올리는 데 집중하려는 것이다. 해외 무역 대금 정산이나 결제가 잦은 기업들은 절차가 간편하고 언제든 이용할 수 있는 서비스를 활용해 내부 필요 인력을 최소화하고 잦은 직원 교육과 훈련이 필요한 경우 AI 기반의 서비스를 이용하는 것이 대표적이다.

◆ 생성형 AI 기반 솔루션으로 신속한 업무 적응 지원, 아이브릭스 ‘에이전트 티’

인공지능(AI) 전문기업인 ㈜아이브릭스(대표 채종현)이 개발한 에이전트 티는 신입 상담사의 모의 상담 트레이닝을 지원하는 생성형 AI 기반 솔루션으로 AI가 학습 내용을 분석하고 평가해 상담 역량을 높일 수 있도록 도와준다.

에이전트 티는 신입 상담사에게 생성형 AI로 학습한 다양한 상담 사례를 제공하고 상황별 대응 능력 향상을 위해 ▲상담 트레이닝 ▲후처리 ▲학습 분석 ▲학습 관리 등 네 가지 주요 기능을 제공한다. 상담 애플리케이션을 통해 실제 업무 프로세스와 유사한 학습 환경을 제공하고, 상담 종료 후에는 상담 분류 및 요약 등의 후처리 작업을 실습함으로써 신입 상담사가 업무에 신속하게 적응할 수 있도록 설계됐다.

특히 딥러닝 TTS(Text To Speech, 음성 합성) 기술을 활용해 성별, 연령, 고객 상황별 목소리를 제공함으로써 실제 상담 환경에서 접할 수 있는 다양한 고객 유형에 대해 미리 체험하고 연습할 수 있다. 이 밖에도 관리자는 실시간 데이터 분석을 통해 개인별, 상담유형별, 그룹별 학습 결과를 실시간 모니터링할 수 있어 상담사별 학습 취약점을 피드백하고, 학습 추천 기능을 통해 상담 내용을 보완할 수 있다.

◆ 기업 해외 송금 절차 간소화로 기업 효율 운영, 센트비즈

글로벌 외환 토탈 솔루션 기업 센트비(대표 최성욱)는 무역 대금 등 해외 결제 및 정산이 필요한 기업에 간소화된 송금 업무 절차와 합리적인 수수료 등 기업 친화적인 서비스를 제공해 인기를 얻고 있다.

최대 1일 이내로 빠르고 안전한 해외 송금이 가능하며 최초 1회만 기업 서류를 등록하면 추가 등록 없이 송금 업무가 가능해 매번 정보를 기입하는 불편함을 없앤 것도 강점이다. 대량의 송금 업무도 수취인 정보를 간단하게 엑셀로 등록하기만 하면 반복 업무 없이 쉽고 빠르게 진행되기 때문에 업무에 투입되는 시간과 비용을 절감하고 효율적인 인력 운영이 가능하다.

또 영미권, 유럽 및 아시아 전역, 중남미를 포함해 최대 174개 국가로 간편하고 안전한 다국 통화 정산을 지원한다. 기존 은행을 이용한 해외 송금 시 발생하는 높은 고정 비용 및 환전 비용 대비 최대 70% 낮은 수수료로 서비스를 제공해, 잦은 해외 송금 및 결제∙정산이 필요한 기업과 유관 업무 담당자들에게 큰 호응을 얻고 있다.

센트비는 금융 분야 전문 변호사를 주축으로 구성된 리걸&컴플라이언스 부분을 운영하고 있어 송금·결제 과정에서 발생할 수 있는 모든 위험에 대해 철저하게 관리한다. 또, 기업 친화적인 서비스와 국가 간 거래의 필수인 안전성을 바탕으로 현재 900개 이상의 센트비즈 기업 고객을 보유하고 있다.

◆ 한국어 특화 멀티모달 언어모델, 카카오 ‘카나나’

카카오 인공지능 서비스 ‘카나나(Kanana)-o’는 텍스트, 음성, 이미지 등 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 인공지능(AI) 모델이다.

이용자는 텍스트·음성·이미지 중 어떠한 조합으로 질문을 입력하더라도 카나나-o를 통해 처리할 수 있고 상황에 맞는 텍스트나 자연스러운 음성 입력에도 응답을 생성해낼 수 있다.

카카오는 서로 다른 모델을 합치는 모델 병합 기술을 기반으로 이미지 처리에 특화된 카나나-v와 오디오 이해·생성에 특화된 카나나-a 모델을 통합해 단기간 내에 효율적으로 카나나-o를 개발했다.

특히 대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조와 억양, 어미변화 등을 정밀하게 반영했다. 이에 따라 카나나-o는 제주도, 경상도 등 지역 방언을 인식하고 이를 표준어로 변환해 자연스러운 음성을 생성할 수 있다.

카카오에 따르면 카나나-o는 한국어 및 영어 벤치마크(성능 검증)에서 글로벌 최고 AI 모델과 유사한 수준을 기록했고 한국어 벤치마크에서는 높은 우위를 보였다. 감정 인식 능력에서는 한국어와 영어 모두에서 큰 우위를 기록하며 감정까지 이해하고 소통할 수 있는 AI 모델의 가능성을 입증했다.

 


  • 관련 기사 더 보기

K-companies overcome economic slowdown crisis with AI technology

As the domestic economic growth rate continues to slow, companies are becoming increasingly anxious. In addition, concerns about the domestic economy and industry in general are growing as government-funded research institutes continue to present downward economic forecasts and predict an economic crisis. The Korea Development Institute (KDI) diagnosed that downward pressure on the domestic economy has been increasing for three consecutive months since January of this year. It explains that the slowdown in the construction industry and the decline in export prices of semiconductors, a major export item, are causing the impact of increased external uncertainty to spread and slow the growth of exports.

Accordingly, companies are actively utilizing external services for efficient human resource management and cost reduction. They are trying to focus on increasing controllable internal efficiency rather than the volatile external environment. Companies that frequently settle or settle overseas trade payments are using services that are easy to process and available at any time to minimize the number of internal personnel required, and in cases where frequent employee education and training are required, they are using AI-based services.

◆ Supporting rapid work adaptation with generative AI-based solutions, Ibricks ' 'Agent T'

Agent Tea, developed by AI specialist company Abrix (CEO Jong-Hyeon Chae), is a generative AI-based solution that supports mock counseling training for new counselors, helping them improve their counseling skills by having AI analyze and evaluate learning content.

Agent Tea provides new counselors with a variety of counseling cases learned through generative AI and provides four main functions: ▲counseling training ▲post-processing ▲learning analysis ▲learning management to improve situational response capabilities. It is designed to help new counselors quickly adapt to work by providing a learning environment similar to the actual work process through the counseling application and practicing post-processing tasks such as classifying and summarizing counseling after the end of the counseling.

In particular, by utilizing deep learning TTS (Text To Speech, voice synthesis) technology to provide voices according to gender, age, and customer situation, you can experience and practice in advance for various types of customers that you may encounter in an actual consulting environment. In addition, managers can monitor learning results by individual, consulting type, and group in real time through real-time data analysis, so they can provide feedback on learning weaknesses by counselor and supplement the consulting content through the learning recommendation function.

◆ Simplifying overseas remittance procedures for companies to operate more efficiently, Sentbiz

Sentbe (CEO Sungwook Choi), a global foreign exchange total solution company, is gaining popularity by providing business-friendly services such as simplified remittance procedures and reasonable fees to companies that require overseas payments and settlements, such as trade payments.

Fast and safe overseas remittance is possible within 1 day, and the company documents can be registered only once for the first time, so remittance work can be done without additional registration, eliminating the inconvenience of entering information each time. Even for large remittance work, simply registering the recipient information in Excel can be done easily and quickly without repetitive work, so the time and cost invested in work can be reduced and efficient human resource management is possible.

It also supports simple and safe multi-currency settlements in up to 174 countries, including English-speaking countries, Europe, Asia, and Central and South America. It is receiving great responses from companies and related business personnel who require frequent overseas remittances and settlements, as it provides services with fees that are up to 70% lower than the high fixed costs and exchange costs incurred when sending money overseas using existing banks.

Sentbe operates a legal & compliance division comprised of financial specialist lawyers, and thoroughly manages all risks that may arise during the remittance and payment process. In addition, based on business-friendly services and the safety essential for cross-border transactions, Sentbe currently has over 900 Sentbe corporate clients.

◆ Korean-specific multimodal language model, Kakao's 'Kanana'

Kakao's artificial intelligence service 'Kanana-o' is an artificial intelligence (AI) model that can simultaneously understand and process various forms of information, such as text, voice, and images.

Users can input questions in any combination of text, voice, and image and process them through Kanana-o, and it can generate responses in context-appropriate text or natural voice input.

Kakao developed Kanana-o efficiently in a short period of time by integrating the Kanana-v model, which is specialized in image processing, and the Kanana-a model, which is specialized in audio understanding and generation, based on model merging technology that combines different models.

In particular, it precisely reflects the special speech structure, intonation, and suffix changes of the Korean language by utilizing a large-scale Korean dataset. Accordingly, Kanana-o can recognize regional dialects such as Jeju Island and Gyeongsang Province and convert them into standard language to generate natural speech.

According to Kakao, Kanana-o recorded similar levels to the global top AI models in Korean and English benchmarks (performance verification), and showed a significant lead in the Korean benchmark. In terms of emotion recognition capabilities, it showed a significant lead in both Korean and English, proving the possibility of an AI model that can understand and communicate emotions.


  • See more related articles

人工知能技術による景気成長の鈍化危機を超えたK企業

国内経済成長率の鈍化が続き、企業のしわが大きくなっている。これに国策研究機関が持続的な景気下方見通しを出し、経済危機が迫ると予想するなど、国内経済・産業全般に対する懸念が拡大している。韓国開発研究院(KDI)は今年1月から3カ月連続で国内競技の下方圧力が大きくなっていると診断した。建設業不振と主要輸出品目である半導体輸出価格が下落する中、対外不確実性拡大の影響が波及し、輸出増加傾向が鈍化しているという説明だ。

これにより、企業は効率的な人材運用とコスト削減のために外部サービスを積極的に活用している。ボラティリティの大きい外部環境よりも制御可能な内部効率を引き上げることに集中しようとするのだ。海外貿易代金の精算や決済が頻繁な企業は、手続きが簡単で、いつでも利用できるサービスを活用して内部必要人材を最小化し、頻繁な職員教育と訓練が必要な場合、AIベースのサービスを利用するのが代表的だ。

◆生成型AIベースソリューションで迅速な業務適応支援、アイブリックス「エージェントティー」

人工知能(AI)専門企業である(株)アイブリックス(代表チェ・ジョンヒョン)が開発したエージェントティーは新入相談士の模擬相談トレーニングを支援する生成型AI基盤ソリューションでAIが学習内容を分析して評価して相談能力を高めるのに役立つ。

エージェントティーは新入相談士に生成型AIで学習した多様な相談事例を提供し、状況別対応能力向上のために▲相談トレーニング▲後処理▲学習分析▲学習管理など4つの主要機能を提供する。相談アプリケーションを通じて実際の業務プロセスと同様の学習環境を提供し、相談終了後は相談分類や要約などの後処理作業を実習することで、新入相談士が業務に迅速に適応できるように設計された。

特にディープラーニングTTS(Text To Speech、音声合成)技術を活用して、性別、年齢、顧客状況別の声を提供することで、実際の相談環境で接することができるさまざまな顧客タイプについて事前に体験して練習することができる。この他にも、管理者はリアルタイムデータ分析を通じて個人別、相談タイプ別、グループ別の学習結果をリアルタイムで監視でき、相談士別の学習脆弱性をフィードバックし、学習推薦機能を通じて相談内容を補完することができる。

◆企業海外送金手続きの簡素化で企業効率運営、セントビーズ

グローバル為替トータルソリューション企業セントビー(代表チェ・ソンウク)は、貿易代金など海外決済及び精算が必要な企業に簡素化された送金業務手続きと合理的な手数料など企業に優しいサービスを提供して人気を得ている。

最大1日以内に迅速かつ安全な海外送金が可能で、最初の1回だけ企業書類を登録すれば追加登録なしで送金業務が可能で、毎回情報を記入する不便さをなくしたのも強みだ。大量の送金業務も、受取人情報を簡単にエクセルに登録するだけで、繰り返し業務なしで簡単かつ迅速に進行されるため、業務に投入される時間とコストを削減し、効率的な人材運営が可能だ。

また、英米圏、欧州およびアジア全域、中南米を含む最大174カ国で簡便で安全な多国通貨決済を支援する。既存の銀行を利用した海外送金時に発生する高い固定費用及び両替費用に比べて最大70%低い手数料でサービスを提供し、頻繁な海外送金及び決済・精算が必要な企業や関連業務担当者に大きな呼応を得ている。

セントビーは金融分野の専門弁護士を主軸で構成されたリーガル&コンプライアンス部分を運営しており、送金・決済過程で発生する可能性のあるすべてのリスクについて徹底的に管理する。また、企業に優しいサービスと国家間取引の必須である安全性をもとに、現在900社以上のセントビーズ企業顧客を保有している。

◆韓国語特化マルチモーダル言語モデル、カカオ「カナナ」

カカオ人工知能サービス「カナナ-o」は、テキスト、音声、イメージなど多様な形態の情報を同時に理解して処理できる人工知能(AI)モデルだ。

利用者はテキスト・音声・画像のどんな組み合わせで質問を入力してもカナナ-oを通じて処理でき、状況に合ったテキストや自然な音声入力にも応答を生成することができる。

カカオは、異なるモデルを合わせるモデルマージ技術を基に、画像処理に特化したカナナ-vとオーディオ理解・生成に特化したカナナ-aモデルを統合し、短期間内に効率的にカナナ-oを開発した。

特に大規模な韓国語データセットを活用して韓国語の特殊な発話構造とイントネーション、語尾変化などを精密に反映した。これにより、カナナ-oは済州島、慶尚道など地域方言を認識し、それを標準語に変換して自然な音声を生成することができる。

カカオによると、カナナ-oは韓国語と英語のベンチマーク(性能検証)でグローバルトップAIモデルと同様のレベルを記録し、韓国語のベンチマークでは高い優位を示した。感情認識能力では、韓国語と英語の両方で大きな優位を記録し、感情まで理解して疎通できるAIモデルの可能性を立証した。


  • 関連記事をもっと見る

K公司利用人工智能技术克服经济放缓危机

随着国内经济增速持续放缓,企业担忧情绪日益加剧。人们对国内经济和整个产业的担忧日益加剧,政府资助的研究机构不断发布下行经济前景预测并预测经济危机。韩国开发研究院(KDI)诊断称,自今年1月以来,国内经济下行压力已连续3个月加大。原因在于,建筑业不景气、主要出口产品半导体出口价格下跌等外部不确定性增加的影响不断蔓延,导致出口增长放缓。

因此,公司正在积极利用外部服务来有效地管理人力资源并降低成本。目标是专注于提高可控的内部效率,而不是不稳定的外部环境。经常处理海外贸易结算或支付的公司通常使用简单且随时可用的服务,以最大限度地减少对内部人力的需求,并在需要频繁进行员工教育和培训时使用基于人工智能的服务。

◆ 通过基于生成式人工智能的解决方案支持快速工作适应, Ibricks的“Agent T”

Agent Tea 由 AI 专业公司 Abrix(代表:蔡钟铉)开发,是一种基于生成式 AI 的解决方案,支持新咨询师的模拟咨询培训,通过 AI 分析和评估学习内容,帮助他们提高咨询技能。

Agent Tea为新晋咨询师提供通过生成式AI学习到的各种咨询案例,并提供▲咨询训练▲后处理▲学习分析▲学习管理四大功能,提升情境应对能力。旨在通过咨询应用程序提供与实际工作流程相似的学习环境,并通过练习咨询结束后对咨询进行分类和总结等后处理任务,帮助新咨询员快速适应工作。

特别是利用深度学习TTS(Text To Speech,语音合成)技术,根据性别、年龄、顾客情况提供语音,让用户针对实际咨询环境中可能遇到的各种类型的顾客提前体验和练习。此外,管理员还可以通过实时数据分析,实时监控个人、辅导类型、小组的学习成果,辅导员对学习弱点进行反馈,并通过学习推荐功能补充辅导内容。

◆ 简化海外汇款流程,让企业更高效地运营, Sentbiz

全球外汇综合解决方案公司 Sentbe(代表理事长崔成旭)通过向需要进行贸易支付等海外支付和结算的公司提供简化的汇款程序和合理的费用等商业友好型服务而受到欢迎。

快捷安全的海外汇款,1天即可完成,且只需登记一次企业文件后,无需另外登记即可进行汇款工作,免去了每次输入信息的不便。即使是批量汇款工作,也只需在Excel中登记收款人信息即可快速轻松地完成,无需重复工作,减少了工作投入的时间和成本,并实现了高效的人力资源管理。

还支持英语国家、欧洲、亚洲、中南美洲等多达174个国家的简单、安全的多币种结算。与使用现有银行进行海外汇款时产生的高额固定成本和兑换费用相比,该服务的费用可低至 70%,受到了需要频繁进行海外汇款和支付/结算的公司以及相关工作负责人的热烈欢迎。

Sentbee 设有法律与合规部门,主要由专门从事金融领域的律师组成,并彻底管理汇款和付款过程中可能出现的所有风险。此外,基于便捷的商务服务以及跨境交易的本质安全,Sentbiz目前拥有超过900家企业客户。

◆ 韩语特有的多模态语言模型, Kakao的‘Kanana’

Kakao的人工智能服务“Kanana-o”是一种可以同时理解和处理文本、语音和图像等各种形式信息的人工智能(AI)模型。

用户可以以文本、语音和图像的任意组合输入问题,并通过 Kanana-o 进行处理,它可以以适合上下文的文本或自然语音输入生成答案。

Kakao通过结合不同模型的模型合并技术,整合专注于图像处理的Kanana-v模型和专注于音频理解与生成的Kanana-a模型,在短时间内高效地开发了Kanana-o。

具体来说,我们利用大规模韩语数据集来精确反映韩语词汇独特的语音结构、语调和变位。因此,Kanana-o 可以识别济州岛和庆尚道等地方方言,并将其转换为标准语言以产生自然的语音。

Kakao表示,Kanana-o在韩语和英语基准测试(性能验证)中达到了与世界顶尖AI模型相当的性能水平,并在韩语基准测试中表现出显著的领先优势。在情绪识别能力方面,它在韩语和英语方面都表现出了很大的优势,证明了能够理解和传达情绪的人工智能模型的可能性。


  • 查看更多相关文章

Les entreprises K surmontent la crise du ralentissement économique grâce à la technologie de l'IA

Alors que le taux de croissance économique nationale continue de ralentir, les entreprises sont de plus en plus préoccupées. Les inquiétudes concernant l’économie nationale et l’industrie en général augmentent, les instituts de recherche financés par le gouvernement présentant continuellement des perspectives économiques à la baisse et prédisant une crise économique. L'Institut coréen de développement (KDI) a diagnostiqué que la pression à la baisse sur l'économie nationale s'est accrue pendant trois mois consécutifs depuis janvier de cette année. L’explication est que la croissance des exportations ralentit alors que l’impact de l’incertitude extérieure accrue se propage dans un contexte de ralentissement du secteur de la construction et de baisse des prix à l’exportation des semi-conducteurs, un produit d’exportation majeur.

En conséquence, les entreprises utilisent activement des services externes pour gérer efficacement les ressources humaines et réduire les coûts. L’objectif est de se concentrer sur l’augmentation de l’efficacité interne contrôlable plutôt que sur l’environnement externe volatil. Les entreprises qui gèrent fréquemment des règlements ou des paiements commerciaux à l’étranger utilisent généralement des services simples et disponibles à tout moment pour minimiser le besoin de main-d’œuvre interne et utilisent des services basés sur l’IA lorsqu’une formation fréquente des employés est nécessaire.

◆ Soutenir l'adaptation rapide du travail avec des solutions génératives basées sur l'IA, Ibricks « Agent T »

Agent Tea, développé par la société spécialisée en IA Abrix (PDG Jong-Hyeon Chae), est une solution générative basée sur l'IA qui prend en charge la formation de conseil simulée pour les nouveaux conseillers, les aidant à améliorer leurs compétences en conseil en demandant à l'IA d'analyser et d'évaluer le contenu d'apprentissage.

Agent Tea fournit aux nouveaux conseillers une variété de cas de conseil appris grâce à l'IA générative et offre quatre fonctions principales : ▲formation au conseil ▲post-traitement ▲analyse de l'apprentissage ▲gestion de l'apprentissage pour améliorer les capacités de réponse situationnelle. Il est conçu pour fournir un environnement d'apprentissage similaire aux processus de travail réels via une application de conseil, et pour permettre aux nouveaux conseillers de s'adapter rapidement au travail en pratiquant des tâches de post-traitement telles que la classification et la synthèse du conseil après la séance de conseil.

En particulier, en utilisant la technologie d'apprentissage profond TTS (Text To Speech, synthèse vocale), les voix sont fournies en fonction du sexe, de l'âge et de la situation du client, permettant aux utilisateurs d'expérimenter et de s'entraîner à l'avance pour différents types de clients qui peuvent être rencontrés dans un environnement de conseil réel. De plus, les administrateurs peuvent surveiller les résultats d'apprentissage par individu, par type de conseil et par groupe en temps réel grâce à une analyse des données en temps réel, fournir des commentaires sur les vulnérabilités d'apprentissage par conseiller et compléter le contenu du conseil grâce à des fonctions de recommandation d'apprentissage.

◆ Simplifier les procédures de transfert de fonds à l'étranger pour que les entreprises fonctionnent plus efficacement, Sentbiz

Sentbe (PDG : Sungwook Choi), une société mondiale de solutions de change complètes, gagne en popularité en fournissant des services adaptés aux entreprises, tels que des procédures de transfert de fonds simplifiées et des frais raisonnables aux entreprises qui nécessitent des paiements et des règlements à l'étranger, tels que les paiements commerciaux.

Un transfert de fonds rapide et sûr à l'étranger est possible en 1 jour, et après avoir enregistré les documents de l'entreprise une seule fois, le travail de transfert peut être effectué sans enregistrement supplémentaire, éliminant ainsi l'inconvénient de saisir des informations à chaque fois. Même les transferts de fonds en masse peuvent être effectués rapidement et facilement sans travail répétitif en enregistrant simplement les informations du destinataire dans Excel, réduisant ainsi le temps et le coût investis dans le travail et permettant une gestion efficace des ressources humaines.

Il prend également en charge des règlements multidevises simples et sécurisés dans 174 pays, dont les pays anglophones, l'Europe, l'Asie et l'Amérique centrale et du Sud. Il reçoit une grande réponse de la part des entreprises qui ont besoin de transferts de fonds et de paiements/règlements fréquents à l'étranger, ainsi que de celles chargées des travaux connexes, en fournissant des services avec des frais jusqu'à 70 % inférieurs aux coûts fixes élevés et aux frais de change encourus lors de l'envoi d'argent à l'étranger en utilisant les banques existantes.

Sentbee exploite une division juridique et de conformité composée principalement d'avocats spécialisés dans le domaine financier et gère minutieusement tous les risques pouvant survenir au cours du processus de transfert et de paiement. De plus, grâce à des services adaptés aux entreprises et à la sécurité essentielle des transactions transfrontalières, Sentbiz compte actuellement plus de 900 clients professionnels.

◆ Modèle de langage multimodal spécifique au coréen, « Kanana » de Kakao

Le service d'intelligence artificielle de Kakao, « Kanana-o », est un modèle d'intelligence artificielle (IA) capable de comprendre et de traiter simultanément diverses formes d'informations, telles que du texte, de la voix et des images.

Les utilisateurs peuvent saisir des questions dans n'importe quelle combinaison de texte, de voix et d'image et les traiter via Kanana-o, et il peut générer des réponses sous forme de texte adapté au contexte ou de saisie vocale naturelle.

Kakao a développé Kanana-o efficacement en peu de temps en intégrant le modèle Kanana-v, spécialisé dans le traitement d'images, et le modèle Kanana-a, spécialisé dans la compréhension et la génération audio, basé sur une technologie de fusion de modèles qui combine différents modèles.

En particulier, nous avons utilisé un ensemble de données coréen à grande échelle pour refléter avec précision la structure de parole, l’intonation et la conjugaison uniques des mots coréens. En conséquence, Kanana-o peut reconnaître les dialectes régionaux tels que ceux de l'île de Jeju et de la province de Gyeongsang et les convertir en langage standard pour produire un discours naturel.

Selon Kakao, Kanana-o a atteint des niveaux de performance similaires à ceux des meilleurs modèles d'IA du monde dans les benchmarks coréens et anglais (vérification des performances), et a montré une avance significative dans le benchmark coréen. En termes de capacités de reconnaissance des émotions, il a montré un grand avantage en coréen et en anglais, prouvant la possibilité d'un modèle d'IA capable de comprendre et de communiquer les émotions.


  • Voir plus d'articles connexes
%d bloggers like this: