人工知能(AI)の発展によって人間の言語を理解し生成するように訓練された「大規模言語モデル(LLM)」の登場は、自然言語処理技術(NLP)の急速な発展を導いている。チャットGPTのような生成型AIがコンテキストを把握し、より自然な会話を分けることができるようになったのもすべてLLMの進歩のおかげだ。 LLMはデータを扱う産業全体で活用され、AI技術の急進的な成長を支える重要な役割を果たしているからだ。
最近、LLMは通信、ゲーム、セキュリティ、法律など特定のドメインに特化した形で精巧に発展している。汎用LLMの場合、膨大なデータを学習したにもかかわらず、深い専門知識が必要な領域で限界を見せており、情報保護の脆弱性や「ハルシネーション(幻覚現象)」などの問題点も内在しているからだ。これに企業は、各産業別特殊性を反映した専門知識とデータを学習させ、より精密な独自言語モデルを構築している。産業とビジネスに最適化された「ドメイン特化LLM」を通じてAI技術を高度化している企業の事例を見てみる。

◆様々な産業群のエンタープライズAI開発経験でハルシネーション問題最小化した、クラウドワークス
AIテック企業クラウドワークスは、 AI学習に必要なデータを前処理する「データエンジン」、企業別にカスタマイズされた大規模言語モデル( LLM )構築サービスを提供する「 AIソリューション」などを提供している。データエンジンとしては、画像、映像など多様なデータをAIが認識できる形に変換するデータラベリングプラットフォームを運営している。一般人がラベリング作業に参加して収益を共有する方式であり、作業したデータは金融圏、検索ポータルなど顧客会社に販売する。登録されたラベラー数は国内最大規模の62万人だ。
AIソリューションとしては、2023年9月にファインチューニングソリューションLLM Platformを発売した。ネイバーハイパークローバXの公式パートナーとして選ばれ、今年上半期にはビジネス特化sLM 「ワークスワン」を発売した。 AIデータ構築に必要な人材を育成する「クラウドアカデミー」も運営している。クラウドアカデミーはラベラー育成のための教育コンテンツを提供する事業で、2021年「国民明日学習カード」の過程、2023年「プラットフォーム従事者特化訓練」事業に選ばれた。
特にクラウドワークスはこれまで様々な産業群のエンタープライズAI開発経験に基づいてLLMの高品質なハルシネーション問題を最小化し、結果データ、性能検証を通じて回答の完成度と精度を向上させ、顧客満足度を高めてきた。
◆ダークウェブ特化言語モデルで特殊データ処理能力を証明、 S2W
AIおよびセキュリティ専門データインテリジェンス企業S2W(以下S2W)は、薬物流通、ランサムウェア、ハッキングなど各種サイバー犯罪の温床として挙げられる「ダークウェブ(Dark Web)」上の難解な言語と違法なコンテンツを分析できるよう、世界初のダークウェブ専用のAI言語モデル「DarkTurt」。ダークウェブで収集された約3億ページの膨大なテキストデータで訓練されたこのモデルは、ダークウェブページのトピック分類やランサムウェア流出サイトの検出などの分析作業で優れた性能を示し、サイバー犯罪捜査の効率性を強化している。また、ダークバートを適用したダークウェブ専用チャットボット「ダークチャット(DarkCHAT)」をインドネシア政府機関に供給された自社のAIベースのビッグデータ分析プラットフォーム「ザビス(XARVIS GLOBAL)」に搭載し、ユーザーが必要とするサイバー犯罪関連情報を即座に確認できるよう支援している。
ダークバートに続いて公開したサイバーセキュリティ特化AI言語モデル「サイバーチューン(CyBERTuned)」は、非定型サイバーセキュリティデータ、特にURLやSHAハッシュ(Hash)などの非言語的要素を効果的に学習できるように設計され、サイバー脅威インテリジェンス(CTI)作業で差別化された機能を見せている。これにとどまらず、最近ではサイバー安全保障特化言語モデルを開発して蓄積してきたNLP技術ノウハウおよび特殊データ処理能力を製造、流通、金融、公共など多様な産業群に拡大適用しています。
◆法律特化LLM独自開発し、法律諮問から契約検討効率性向上、 BHSN
法律市場に特化したLLMで法務効率性を最大化するAIプラットフォームも存在する。リーガルAIソリューション企業BHSNが開発した「アリビー(Allibee)」は、法律特化生成型AIベースのサービス型ソフトウェア(SaaS)プラットフォームで、文脈を理解し、単語の意味を把握した上で適切な回答を提供することで、法律契約書関連業務に最適化された機能を提供する。
アリビーはBHSNが自ら開発した法律特化AI言語モデル「BHSN Legal-LLM」を基盤に構築された。契約、法令、判例、政策など弁護士とAIエンジニアが協業して選定して生成した大量の法律関連の高品質データを集中的に学習した。精度の高い情報をもとに法律領域に適した細部機能を実装し、企業、公共機関、ローファームなど多様な顧客企業のデータをもとに内部政策に合わせて契約書内容を修正するなどのサービスも提供している。現在、アリビーはこのような法律ドメイン特化機能をもとに業務生産性を向上させるオールインワンAIビジネスソリューションとして活用されている。
◆通信社のカスタム言語モデル「Telco LLM」による内部ビジネス革新、 SKT
SKテレコム(以下SKT)の「Telco LLM(Telco LLM)」は、5G料金制、Tメンバーシップ、公示支援金などの国内通信専門用語や内部AI倫理指針などを学習した通信特化LLMだ。膨大な韓国語通信データを収集して選別し、同社の「エイドットエックス(AX)」とオープンAIの「GPT」、アントロピックの「クロード」などに学習させ、マルチエンジンベースのLLMを構築した。通信会社向けに細かく微調整する過程を経て、通信サービス、メンバーシップ特典、顧客相談パターンなど、汎用LLMに比べ細分化された通信領域のデータ処理が可能になるよう設計されているため、レベルの高い作業を行うことができる。
SKTは、マルチエンジンベースのTelcoLLMを通じてサービス別に最適化されたLLMを選択および適用し、さまざまな通信業務状況に適した機能を実装し、内部運用効率を強化している。最近では国内メジャー顧客センターの中で初めてLLMを適用した「AI相談業務支援システム」をオープン、相談会社が自然言語で質問を入力して必要な情報を素早く検索・整理できるように支援している。また、テキストだけでなく、さまざまなイメージを理解できる大規模なマルチモーダルモデル(Large Multimodal Model、LMM)を活用し、顧客が文字や電子メールなどで送信した書類を自動処理する「AI書類自動処理システム」も構築した。 SKTは今後、Telco LLMを流通網管理やネットワークインフラ運用の他、様々な業務状況にも拡大適用していく予定だ。
◆ゲーム・エンタードメインを超えて創作AIの新しいパラダイム提示、 NCソフト「バルコLLM」
「バルコLLM(VARCO LLM)」は、NCソフトが国内ゲーム会社で初めて独自開発したAI言語モデルで、ゲーム開発に特化した高品質コンテンツ制作を支援し、ゲームやエンターテイメント分野の革新を先導している。バルコはテキストやシナリオなどゲーム内コンテンツ開発に重点を置いたデータを学習し、活気のある企画、運営、アートなどコンテンツ開発全般で高い効率性を提供する。特にバルコLLMベースの「バルコスタジオ(VARCO Studio)」はゲーム制作に特化したAIプラットフォームサービスで、NCソフトの知的財産権(IP)に特化したWebベースの画像生成ツール「バルコアート」、テキスト生成・管理ツール「バルコテキスト」、AI NPCおよびチャットボット制作のためのコースを支援し、高品質のコンテンツ制作に役立つ。
バルコLLMはゲームコンテンツ生成に特化した言語モデルだが、車両用プラットフォーム、教育などの分野ともドメイン特化モデル開発のための業務協約を締結するなど、様々な産業に適用されている。 NCソフトは、バルコが既存の汎用創作AIと差別化された創作性を提供すると予想し、次世代バージョンの「バルコLLM 2.0」、「ラマ・バルコLLM(Llama-VARCO LLM)」など向上した性能のチューニング言語モデルを継続的に開発して公開してきた。今後、バルコを開発したAI研究開発組織「NCリサーチ」を子会社に分社し、AI専門企業を新設し、関連技術を高度化するという計画だ。
- 関連記事をもっと見る
You must be logged in to post a comment.