
다큐먼트 AI 전문기업 로민(대표 강지홍)은 행정안전부와 과학기술정보통신부가 추진하고 삼성SDS 컨소시엄이 수행한 ‘범정부 초거대 AI 공통기반 구현 사업’에 문서 데이터 처리 솔루션 ‘텍스트스코프 Doc 파서(Textscope Doc Parser)’를 공급하고 구축을 완료했다고 6일 밝혔다.
범정부 초거대 AI 공통기반 구현 사업은 중앙정부와 지방정부가 내부 행정망에서도 보안 우려 없이 다양한 생성형 AI 서비스를 공동 활용할 수 있도록 하는 정부 최초의 내부망 AI 공통기반 구축 사업이다. 정부 업무 전반에 AI를 내재화해 정책 기획 효율성과 대국민 서비스 품질을 제고하는 것을 목표로 추진됐다.
로민은 삼성SDS 컨소시엄의 기술 파트너로 참여해, 범정부 AI 공통기반 및 연계 서비스에서 활용되는 공공 행정 문서를 거대언어모델이 학습·이해할 수 있는 형태로 구조화하고 정제하는 전처리 영역에 Doc 파서를 적용했다.
Doc 파서는 공문서, 보고서, 각종 행정 양식 등 다양한 문서에서 텍스트, 표, 이미지 등 핵심 요소를 추출하고 문서의 레이아웃과 읽기 순서를 함께 인식하는 문서 레이아웃 분석 솔루션이다. 다단 구성, 박스형 서식, 표와 캡션 간 관계 등 공공 문서에서 빈번하게 나타나는 복합 구조까지 분석해 문서의 원래 구조와 맥락을 유지한 데이터 구조화를 지원한다.
이를 통해 범정부 AI 공통기반에서 제공되는 문서 작성 지원, 법령 및 지침 검색 등 다양한 AI 서비스에 활용할 행정 문서를 거대언어모델 적용에 적합한 형태로 정제·구조화하는 전처리 체계가 구축됐다.
강지홍 로민 대표는 정부 최초의 범정부 AI 공통기반 사업에서 로민의 문서 구조화 기술이 행정 업무 효율화를 위한 핵심 요소로 활용된 점에 의미가 있다며, 향후에도 디지털 플랫폼 정부 구현에 기여할 수 있도록 기술 고도화를 지속하겠다고 밝혔다.
- 관련 기사 더 보기
Romin has completed supplying its TextScope Doc Parser to the Ministry of the Interior and Safety's "Government-wide AI" project.

Document AI specialist Romin (CEO Ji-Hong Kang) announced on the 6th that it has supplied and completed the construction of its document data processing solution, 'Textscope Doc Parser', for the 'Government-wide Large-Scale AI Common Base Implementation Project' promoted by the Ministry of the Interior and Safety and the Ministry of Science and ICT and carried out by the Samsung SDS consortium.
The government-wide, large-scale AI common infrastructure implementation project is the first government-wide AI common infrastructure project to enable central and local governments to jointly utilize various generative AI services within their internal administrative networks without security concerns. The project aims to internalize AI across all government operations, thereby improving policy planning efficiency and the quality of public services.
As a technology partner of the Samsung SDS consortium, Romin applied Doc parser to the preprocessing area, which structures and refines public administrative documents used in the government-wide AI common base and linked services into a form that can be learned and understood by large-scale language models.
Doc Parser is a document layout analysis solution that extracts core elements such as text, tables, and images from various documents, including official documents, reports, and various administrative forms, and recognizes the document's layout and reading order. It analyzes even complex structures frequently found in public documents, such as multi-column structures, box-type formatting, and relationships between tables and captions, supporting data structuring that preserves the document's original structure and context.
Through this, a preprocessing system was established to refine and structure administrative documents for use in various AI services, such as document creation support provided by the government-wide AI common platform and search for laws and guidelines, into a form suitable for applying large-scale language models.
Kang Ji-hong, CEO of Romin, said that it is significant that Romin's document structuring technology was utilized as a key element for improving administrative work efficiency in the government's first pan-government AI common base project, and that he will continue to advance the technology so that it can contribute to the implementation of a digital platform government in the future.
- See more related articles
ロミン、行安部「汎政府超巨大AI」事業に「テキストスコープDocパーサー」供給完了

ドキュメントAI専門企業ロミン(代表カン・ジホン)は、行政安全部と科学技術情報通信部が推進し、サムスンSDSコンソーシアムが遂行した「汎政府超巨大AI共通基盤実装事業」に文書データ処理ソリューション「テキストスコープDocパーサー(Textscope Doc Parser)」を供給した。
汎政府超巨大AI共通基盤実装事業は、中央政府と地方政府が内部行政網でもセキュリティの懸念なしに多様な生成型AIサービスを共同活用できるようにする政府初の内部網AI共通基盤構築事業だ。政府業務全般にAIを内在化し、政策企画効率性と大国民サービス品質を向上させることを目標に推進された。
ロミンはサムスンSDSコンソーシアムの技術パートナーとして参加し、汎政府AI共通基盤および連携サービスで活用される公共行政文書を巨大言語モデルが学習・理解できる形で構造化し精製する前処理領域にDocパーサーを適用した。
Docパーサーは、公文書、報告書、各種行政様式など多様な文書からテキスト、表、画像などの核心要素を抽出し、文書のレイアウトと読み取り順序を一緒に認識する文書レイアウト分析ソリューションである。多段構成、ボックス型書式、表とキャプション間の関係など、公共文書から頻繁に現れる複合構造まで分析し、文書の元の構造とコンテキストを維持したデータ構造化を支援する。
これにより、汎政府AI共通基盤で提供される文書作成支援、法令及び指針検索など、多様なAIサービスに活用する行政文書を巨大言語モデル適用に適した形態に精製・構造化する前処理体系が構築された。
カン・ジホンのロミン代表は、政府初の汎政府AI共通基盤事業でロミンの文書構造化技術が行政業務効率化のための核心要素として活用された点に意味があるとし、今後もデジタルプラットフォーム政府の実装に寄与できるように技術高度化を継続すると明らかにした。
- 関連記事をもっと見る
Romin 已完成向内政安全部“政府级人工智能”项目提供 TextScope 文档解析器。

文档人工智能专家Romin(CEO 姜智洪)于 6 日宣布,已向由行政安全部和科学技术信息通信部推动、三星 SDS 联盟实施的“政府级大规模人工智能通用基础实施项目”提供并完成了其文档数据处理解决方案“Textscope Doc Parser”的建设。
这项政府层面的大规模人工智能通用基础设施部署项目,是首个使中央和地方政府能够在各自内部行政网络中联合使用各种生成式人工智能服务而无需担心安全问题的政府级人工智能通用基础设施项目。该项目旨在将人工智能融入政府各项运作,从而提高政策规划效率和公共服务质量。
作为三星 SDS 联盟的技术合作伙伴,Romin 将 Doc 解析器应用于预处理领域,该领域将政府范围内的 AI 通用基础和链接服务中使用的公共行政文档进行结构化和提炼,使其成为大规模语言模型可以学习和理解的形式。
Doc Parser 是一款文档布局分析解决方案,可从各类文档(包括官方文件、报告和各种行政表格)中提取文本、表格和图像等核心元素,并识别文档的布局和阅读顺序。它甚至可以分析公共文档中常见的复杂结构,例如多列结构、框式格式以及表格与标题之间的关系,从而支持能够保留文档原始结构和上下文的数据结构化。
通过这种方式,建立了一个预处理系统,用于将行政文档提炼和结构化,以便用于各种人工智能服务,例如政府范围内的人工智能通用平台提供的文档创建支持以及法律和指南的搜索,使其成为适合应用大规模语言模型的形式。
Romin 首席执行官康智洪表示,Romin 的文档结构化技术被用作政府首个全政府人工智能通用基础项目提高行政工作效率的关键要素,意义重大。他将继续推进这项技术,使其未来能够为数字化平台政府的实施做出贡献。
- 查看更多相关文章
Romin a achevé la fourniture de son analyseur de documents TextScope au projet « IA à l'échelle du gouvernement » du ministère de l'Intérieur et de la Sécurité.

Romin (PDG Ji-Hong Kang), spécialiste de l'IA documentaire, a annoncé le 6 avoir fourni et achevé la construction de sa solution de traitement de données documentaires, « Textscope Doc Parser », pour le « Projet de mise en œuvre d'une base commune d'IA à grande échelle à l'échelle du gouvernement », promu par le ministère de l'Intérieur et de la Sécurité et le ministère des Sciences et des TIC et réalisé par le consortium Samsung SDS.
Ce projet de déploiement d'une infrastructure commune d'IA à grande échelle, à l'échelle du gouvernement, est le premier du genre à permettre aux administrations centrales et locales d'utiliser conjointement divers services d'IA générative au sein de leurs réseaux administratifs internes, en toute sécurité. Il vise à intégrer l'IA dans l'ensemble des opérations gouvernementales, améliorant ainsi l'efficacité de la planification des politiques et la qualité des services publics.
En tant que partenaire technologique du consortium Samsung SDS, Romin a appliqué Doc parser à la zone de prétraitement, qui structure et affine les documents administratifs publics utilisés dans la base commune d'IA à l'échelle du gouvernement et les services liés sous une forme pouvant être apprise et comprise par des modèles de langage à grande échelle.
Doc Parser est une solution d'analyse de mise en page qui extrait les éléments essentiels (texte, tableaux et images) de divers documents, notamment les documents officiels, les rapports et les formulaires administratifs, et reconnaît leur mise en page et leur ordre de lecture. Elle analyse même les structures complexes fréquemment rencontrées dans les documents publics, telles que les structures à plusieurs colonnes, la mise en forme par encadrés et les relations entre les tableaux et leurs légendes, permettant ainsi une structuration des données qui préserve la structure et le contexte originaux du document.
Grâce à cela, un système de prétraitement a été mis en place pour affiner et structurer les documents administratifs destinés à être utilisés dans divers services d'IA, tels que l'aide à la création de documents fournie par la plateforme commune d'IA à l'échelle gouvernementale et la recherche de lois et de directives, sous une forme adaptée à l'application de modèles linguistiques à grande échelle.
Kang Ji-hong, PDG de Romin, a déclaré qu'il était significatif que la technologie de structuration de documents de Romin ait été utilisée comme élément clé pour améliorer l'efficacité du travail administratif dans le cadre du premier projet de base commune d'IA pangouvernemental du gouvernement, et qu'il continuerait à faire progresser cette technologie afin qu'elle puisse contribuer à la mise en œuvre d'un gouvernement de plateforme numérique à l'avenir.
- Voir plus d'articles connexes
You must be logged in to post a comment.