
知能型AI文書処理専門企業ジミッションが中小ベンチャー企業部主管「中小企業技術革新開発事業市場拡大型」研究課題に選定されたと22日明らかにした。
選ばれた研究課題は「VLMベースのマルチモーダルインテリジェントOCRソリューション研究開発」で、ジミッションは今回の研究を通じて既存のディープラーニングAI OCR技術の限界を克服し、AI転換(AX)時代に適したインテリジェントドキュメント処理ソリューションを開発するという計画だ。
VLM(Visual Language Model)は、テキスト認識だけでなく、画像、レイアウトなどの視覚情報を同時に学習・分析するマルチモーダルモデルです。既存のOCRが文字抽出に集中している場合、VLMベースのマルチモーダルOCRは、文書内の文字、表、グラフィック、書式構造などを総合的に把握し、文書の全体的な意味と文脈を理解することができる。
ジミッションは現在、AI OCRを活用して文書フォーム自動分類、個人情報自動マスキング、LLMベースの要約および検索技術を提供している。今回の研究開発では、ここにVLM技術を組み込んで文書全体の意味を理解して活用する水準で技術を高度化する予定だ。
これにより、ユーザーは単純なテキスト抽出を超えて文書内の各項目の意味と文脈まで反映したインテリジェント文書処理環境を体験することができる。例えば、同じ数値データでも書式によって口座番号か住民登録番号かを区別して抽出し、所望の項目だけを選択的に要約することができる。また、文脈ベースの検索機能により、膨大な文書の中で必要な情報を迅速かつ正確に見つけることができ、実務者の業務効率性が向上すると期待される。
ジミッションハン・ジュンソプ代表は「今回の研究開発を通じて高度化された文書処理技術を確保し、公共・金融・医療・企業など多様な産業分野で活用可能な革新的なAIソリューションを披露する」と明らかにした。
- 関連記事をもっと見る
You must be logged in to post a comment.