
クラウドワークスが16日午前、COEXで開かれた韓国科学技術院(KAIST)キム・ジェチョルAI大学院「AI技術説明会」で最新AI技術トレンドを共有し、自社のデータ前処理技術を紹介したと16日明らかにした。
今回の技術説明会は、KAISTが研究中の核心源泉AI技術を産業界と一般大衆に紹介し、AI技術の拡散と産学協力の活性化を目指している。本行事は「2025国際人工知能大戦(AI EXPO KOREA)」の一環として開催され、クラウドワークスはKAISTの招待で講演に参加した。
講演者に出たヤン・スヨルクラウドワークス最高技術責任者(CTO)は「社長がよく読むキム・デリの報告書、AIはなぜ読めないのか」という興味深いテーマで講演を進行した。
両CTOは「AIが一般文書フォーマットを読むことは可能だが、文書に含まれた「意味」を理解し、これをメタデータに抽出することはまだ容易ではない」とし、「チャートやダイアグラムなどの視覚要素は単純な説明を超えて、周辺の文章と段落の文脈まで考慮して意味ベースのメタデータを構成しなければならない」と関連情報
続いて「我が国文書は固有のスタイルと構造を持っており、外産パーサー(Parser)をそのまま使用するとエラーが多く発生する」とし「こうした国内文書の特性を反映して表や視覚要素に対する精密な解析と処理を通じて高い精度を実現しなければならない」と強調した。
これとともに、様々な非定型文書をRAG(Retrieval-Augmented Generation)に適した形で前処理できる独自のソリューション「アルピーナレッジコンパイラ(Alpy Knowledge Compiler)」も紹介した。このソリューションは、文書内のテーブル、チャート、画像などに対してLMM(ラージマルチモーダルモデル)ベースの分析を実行し、セマンティクスベースのメタデータを追加して検索の精度とクエリ応答品質を向上させます。特に、業界初の文書の複雑さを定量化できる自己評価指標を適用して文書構造を体系的に分析することができ、これによりデータ前処理エラーの可能性を減らし、人材と予算を効率的に管理することができる。
- 関連記事をもっと見る
You must be logged in to post a comment.