
지능형 AI 문서처리 전문기업 지미션이 중소벤처기업부 주관 ‘중소기업기술혁신개발사업 시장확대형’ 연구과제에 선정됐다고 22일 밝혔다.
선정된 연구과제는 ‘VLM 기반의 멀티모달 지능형 OCR 솔루션 연구개발’로, 지미션은 이번 연구를 통해 기존 딥러닝 AI OCR 기술의 한계를 극복하고 AI 전환(AX) 시대에 적합한 지능형 문서처리 솔루션을 개발한다는 계획이다.
VLM(Visual Language Model)은 텍스트 인식뿐만 아니라 이미지, 레이아웃 등 시각적 정보를 동시에 학습·분석하는 멀티모달 모델이다. 기존 OCR이 문자 추출에 집중했다면, VLM 기반 멀티모달 OCR은 문서 내 글자, 표, 그래픽, 서식 구조 등을 종합적으로 파악해 문서의 전체 의미와 맥락을 이해할 수 있다.
지미션은 현재 AI OCR을 활용해 문서 양식 자동 분류, 개인정보 자동 마스킹, LLM 기반 요약 및 검색 기술을 제공하고 있다. 이번 연구개발에서는 여기에 VLM 기술을 접목해 문서 전체의 의미를 이해하고 활용하는 수준으로 기술을 고도화할 예정이다.
이를 통해 사용자는 단순한 텍스트 추출을 넘어 문서 속 각 항목의 의미와 맥락까지 반영한 지능형 문서 처리 환경을 경험할 수 있다. 예를 들어, 동일한 숫자 데이터라도 서식에 따라 계좌번호인지 주민등록번호인지 구분해 추출하고, 원하는 항목만 선택적으로 요약할 수 있다. 또한 맥락 기반 검색 기능을 통해 방대한 문서 속에서 필요한 정보를 빠르고 정확하게 찾아낼 수 있어 실무자의 업무 효율성이 향상될 것으로 기대된다.
지미션 한준섭 대표는 “이번 연구개발을 통해 고도화된 문서처리 기술을 확보하고, 공공·금융·의료·기업 등 다양한 산업 분야에서 활용 가능한 혁신적인 AI 솔루션을 선보일 것”이라고 밝혔다.
- 관련 기사 더보기
Jimmy Mission selected for the Ministry of SMEs and Startups' "Market Expansion" research project for the Small and Medium Enterprise Technology Innovation Development Project.

Intelligent AI document processing specialist company Jimmy Mission announced on the 22nd that it was selected for the 'Small and Medium Business Technology Innovation Development Project Market Expansion' research project hosted by the Ministry of SMEs and Startups.
The selected research project is 'Research and Development of VLM-based Multimodal Intelligent OCR Solution', and through this research, G-Mission plans to overcome the limitations of existing deep learning AI OCR technology and develop an intelligent document processing solution suitable for the AI transition (AX) era.
A Visual Language Model (VLM) is a multimodal model that simultaneously learns and analyzes visual information, such as images and layouts, in addition to text recognition. While conventional OCR focuses on character extraction, VLM-based multimodal OCR comprehensively analyzes text, tables, graphics, and formatting within a document, enabling a comprehensive understanding of the document's overall meaning and context.
Gmission currently utilizes AI OCR to provide automatic document format classification, automatic personal information masking, and LLM-based summarization and search technology. This research and development will integrate VLM technology into this technology to enhance the understanding and utilization of the entire document's meaning.
This allows users to experience an intelligent document processing environment that goes beyond simple text extraction and reflects the meaning and context of each item within a document. For example, even numeric data can be extracted based on format, such as account numbers or resident registration numbers, and only the desired items can be selectively summarized. Furthermore, context-based search capabilities enable users to quickly and accurately locate necessary information within vast documents, which is expected to enhance work efficiency.
Jimision CEO Han Jun-seop stated, “Through this research and development, we will secure advanced document processing technology and present innovative AI solutions that can be utilized in various industries such as the public, financial, medical, and corporate sectors.”
- See more related articles
ジミッション、中期部「中小企業技術革新開発事業市場拡大型」研究課題選定

知能型AI文書処理専門企業ジミッションが中小ベンチャー企業部主管「中小企業技術革新開発事業市場拡大型」研究課題に選定されたと22日明らかにした。
選ばれた研究課題は「VLMベースのマルチモーダルインテリジェントOCRソリューション研究開発」で、ジミッションは今回の研究を通じて既存のディープラーニングAI OCR技術の限界を克服し、AI転換(AX)時代に適したインテリジェントドキュメント処理ソリューションを開発するという計画だ。
VLM(Visual Language Model)は、テキスト認識だけでなく、画像、レイアウトなどの視覚情報を同時に学習・分析するマルチモーダルモデルです。既存のOCRが文字抽出に集中している場合、VLMベースのマルチモーダルOCRは、文書内の文字、表、グラフィック、書式構造などを総合的に把握し、文書の全体的な意味と文脈を理解することができる。
ジミッションは現在、AI OCRを活用して文書フォーム自動分類、個人情報自動マスキング、LLMベースの要約および検索技術を提供している。今回の研究開発では、ここにVLM技術を組み込んで文書全体の意味を理解して活用する水準で技術を高度化する予定だ。
これにより、ユーザーは単純なテキスト抽出を超えて文書内の各項目の意味と文脈まで反映したインテリジェント文書処理環境を体験することができる。例えば、同じ数値データでも書式によって口座番号か住民登録番号かを区別して抽出し、所望の項目だけを選択的に要約することができる。また、文脈ベースの検索機能により、膨大な文書の中で必要な情報を迅速かつ正確に見つけることができ、実務者の業務効率性が向上すると期待される。
ジミッションハン・ジュンソプ代表は「今回の研究開発を通じて高度化された文書処理技術を確保し、公共・金融・医療・企業など多様な産業分野で活用可能な革新的なAIソリューションを披露する」と明らかにした。
- 関連記事をもっと見る
吉米使命被选为中小企业和创业部中小企业技术创新发展项目“市场拓展”研究项目。

智能AI文档处理专业公司吉米使命22日宣布,被选为中小企业风险投资部主办的“中小企业技术创新发展项目市场扩大”研究项目。
此次选定的研究项目为‘基于VLM的多模态智能OCR解决方案的研究与开发’,G-Mission计划通过这项研究,克服现有深度学习AI OCR技术的局限性,开发适合AI转型(AX)时代的智能文档处理解决方案。
视觉语言模型 (VLM) 是一种多模态模型,除了文本识别之外,还能同时学习和分析图像和布局等视觉信息。传统的 OCR 侧重于字符提取,而基于 VLM 的多模态 OCR 则能够全面分析文档中的文本、表格、图形和格式,从而全面理解文档的整体含义和上下文。
绿盟科技目前利用AI OCR技术提供文档格式自动分类、个人信息自动屏蔽以及基于LLM的摘要和搜索技术。本次研发将VLM技术融入到该技术中,以增强对整篇文档含义的理解和利用。
这使得用户能够体验到超越简单文本提取、能够反映文档中各项含义和上下文的智能文档处理环境。例如,甚至可以根据格式提取数字数据(例如账号或居民身份证号码),并选择性地汇总所需的项目。此外,基于上下文的搜索功能使用户能够在海量文档中快速准确地找到所需信息,从而有望提高工作效率。
Jimision 首席执行官韩俊燮表示:“通过此次研发,我们将确保先进的文档处理技术,并提供可用于公共、金融、医疗和企业等各个行业的创新型 AI 解决方案。”
- 查看更多相关文章
Jimmy Mission a été sélectionné pour le projet de recherche « Expansion du marché » du ministère des PME et des startups pour le projet de développement de l'innovation technologique des petites et moyennes entreprises.

Jimmy Mission, société spécialisée dans le traitement intelligent de documents par IA, a annoncé le 22 qu'elle avait été sélectionnée pour le projet de recherche « Small and Medium Business Technology Innovation Development Project Market Expansion » organisé par le ministère des PME et des startups.
Le projet de recherche sélectionné est « Recherche et développement d'une solution OCR intelligente multimodale basée sur VLM », et grâce à cette recherche, G-Mission prévoit de surmonter les limites de la technologie OCR d'IA d'apprentissage profond existante et de développer une solution de traitement de documents intelligente adaptée à l'ère de la transition de l'IA (AX).
Un modèle de langage visuel (MLV) est un modèle multimodal qui apprend et analyse simultanément les informations visuelles, telles que les images et les mises en page, en plus de la reconnaissance de texte. Alors que l'OCR classique se concentre sur l'extraction de caractères, l'OCR multimodal basé sur le MLV analyse en profondeur le texte, les tableaux, les graphiques et la mise en forme d'un document, permettant ainsi une compréhension globale du sens et du contexte du document.
Gmission utilise actuellement l'OCR par IA pour la classification automatique des formats de documents, le masquage automatique des informations personnelles et la synthèse et la recherche basées sur la LLM. Ce projet de recherche et développement intégrera la technologie VLM à cette technologie afin d'améliorer la compréhension et l'exploitation du sens du document dans son intégralité.
Cela permet aux utilisateurs de bénéficier d'un environnement de traitement de documents intelligent qui va au-delà de la simple extraction de texte et reflète le sens et le contexte de chaque élément d'un document. Par exemple, même des données numériques peuvent être extraites selon leur format, comme les numéros de compte ou les numéros d'enregistrement de résident, et seuls les éléments souhaités peuvent être synthétisés de manière sélective. De plus, les fonctionnalités de recherche contextuelle permettent aux utilisateurs de localiser rapidement et précisément les informations nécessaires dans des documents volumineux, ce qui devrait améliorer l'efficacité du travail.
Han Jun-seop, PDG de Jimision, a déclaré : « Grâce à cette recherche et développement, nous sécuriserons une technologie avancée de traitement de documents et présenterons des solutions d'IA innovantes qui peuvent être utilisées dans divers secteurs tels que les secteurs public, financier, médical et des entreprises. »
- Voir plus d'articles connexes
You must be logged in to post a comment.