
智能AI文档处理专业公司吉米使命22日宣布,被选为中小企业风险投资部主办的“中小企业技术创新发展项目市场扩大”研究项目。
此次选定的研究项目为‘基于VLM的多模态智能OCR解决方案的研究与开发’,G-Mission计划通过这项研究,克服现有深度学习AI OCR技术的局限性,开发适合AI转型(AX)时代的智能文档处理解决方案。
视觉语言模型 (VLM) 是一种多模态模型,除了文本识别之外,还能同时学习和分析图像和布局等视觉信息。传统的 OCR 侧重于字符提取,而基于 VLM 的多模态 OCR 则能够全面分析文档中的文本、表格、图形和格式,从而全面理解文档的整体含义和上下文。
绿盟科技目前利用AI OCR技术提供文档格式自动分类、个人信息自动屏蔽以及基于LLM的摘要和搜索技术。本次研发将VLM技术融入到该技术中,以增强对整篇文档含义的理解和利用。
这使得用户能够体验到超越简单文本提取、能够反映文档中各项含义和上下文的智能文档处理环境。例如,甚至可以根据格式提取数字数据(例如账号或居民身份证号码),并选择性地汇总所需的项目。此外,基于上下文的搜索功能使用户能够在海量文档中快速准确地找到所需信息,从而有望提高工作效率。
Jimision 首席执行官韩俊燮表示:“通过此次研发,我们将确保先进的文档处理技术,并提供可用于公共、金融、医疗和企业等各个行业的创新型 AI 解决方案。”
- 查看更多相关文章
You must be logged in to post a comment.