
AIテック企業クラウドワークスが自社のAIデータ前処理ソリューション「Alpy Knowledge Compiler」に適用されたコア技術である「文書複雑度分析ベースの文書自動化処理技術」に対する特許を出願したと22日明らかにした。
当該技術は、RAG(Retrieval-Augmented Generation)ベースのAIエージェント開発に不可欠な非定型データ前処理過程で文書の構造的複雑性を定量的に分析して自動化適用可否を判断する方式である。前処理の品質の低下と資源の浪費を防ぎ、文書の種類に応じて専門家が投入するかどうかを事前に決定することで、作業効率とコストの最適化を図ることができる。
クラウドワークスによると、この技術は文書の複雑さに応じてClass 1からClass 4まで4段階に分類し、単純構造の文書は自動化前処理方式で、複雑な構造の文書は専門家解析を並行する基準を提示する。これにより、データの前処理エラーが発生する可能性を予測し、人員やスケジュール管理にも活用できるという説明である。
この技術は現在、クラウドワークスの自社開発ソリューションである「アルピナレッジコンパイラ」に適用され運営中である。このソリューションは、OCR(光学文字読み取り)、解析、チャンキング機能に基づいて、さまざまな形式の文書をAIが学習可能な形式に変換し、ハングル(HWP / HWPX)、PDF、ワード、Excelなどの多数の文書形式をサポートします。テーブル内の入れ子構造やチャート、イメージなどの視覚的要素まで認識してメタデータを生成し、LLM(超大型言語モデル)およびVLM(ビジョン言語モデル)を活用した高度化された処理機能も提供する予定だ。
近年、非定型データの資産化に対する企業需要が増加するにつれて、クラウドワークスは当該ソリューションを通じて国内外の多様な産業群の前処理需要に積極的に対応し、AIベースの業務自動化分野での競争力を強化していく方針だ。
キム・ウスンクラウドワークス代表は「今回の特許出願は文書複雑度分析基盤技術を通じてデータ前処理の精度と効率性を高めた最初の事例で、AIデータ前処理専門企業としての差別化を立証するきっかけ」とし「アルピナリッジコンパイラは現在多様な企業の問い合わせが続いており、企業向けAI市場で。
- 関連記事をもっと見る
You must be logged in to post a comment.