이든티앤에스, ‘웍트로닉스’에 딥러닝 정형데이터 추출 신기능 지원

이든티앤에스(대표 김연기)가 AI 자동화 솔루션 ‘웍트로닉스’ 잠재력을 극대화하는 ‘Doc Transformer’ 기능과 AI OCR Center의 ‘Jobs’ 기능을 새롭게 출시했다고 오늘 밝혔다.

새롭게 공개된 ‘Doc Transformer’는 딥러닝 기반 자연어 처리 기술을 통해 비정형 데이터인 문서에서 데이터를 추출해 XML 형태로 쉽게 정형 데이터를 제공하는 기능을 갖춘 기관 맞춤형 자동화 툴로 문서에 최적화된 학습 모델을 제공할 뿐만 아니라 각 기관의 시스템 업무 프로세스에 맞는 설정 및 학습, 추출, 예외 처리 기능을 제공한다.

해당기능은 한글 hwp, hwpx 파일과 MS Word doc, docx 파일의 비정형 데이터에서 문서 구조, 유사 문장, 유사도 등을 학습할 수 있으며, 문장 및 테이블에 대한 문서처리 과정을 거쳐, 문단 순서 재처리와 오입력 수정 재처리 등 문서 보정 처리를 자동으로 진행해 문장 및 테이블 항목에 라벨링도 가능하다.

Doc Transformer는 국정원 보안 규정을 준수해 개발됐으며, S-BOM을 통해 보안 취약성을 사전에 제거해 공공기관 업무에서 사용되는 여러 데이터가 유실 혹은 외부 유출 우려를 차단 할 수 있다.

동기 공개된 신기능 ‘Jobs’는 OCR 추출 리뷰 페이지를 통한 인식 결과 확인 후 검증 및 수정, 재학습 기능을 지원하며, 사용자는 Jobs 기능을 통해 OCR을 통해 추출한 모든 문서에 대해 추가 비용 없이 검증 기능을 적용할 수 있다. 특히 필드별로 추출 결과와 원본 문서를 비교해 추출 결과가 정확한지 확인하고 수정 및 저장할 수 있다.

이든티앤에스는 Doc Transformer 기능 정식 출시 전, 세종 소재 공공기관의 데이터 개방 사업용 데이터베이스 구축에 이 기능을 성공적으로 적용한바 있으며, AI Center OCR Jobs 역시 고객사에 선제적으로 기능을 공개해 안정성과 실용성을 검증했다.

이든티앤에스 김연기 대표는 “이든티앤에스는 앞으로 업무 자동화 영역에서 AI 기술을 기반으로 지속적인 기술 및 제품 혁신을 추구하며 고객의 성공적인 디지털 전환을 지원할 것”이라고 말했다.

한편 이든티앤에스는 최근 씨케이넷과 업무 협약을 통해 AI 기술 기반 업무 자동화 영역에서 비즈니스 협력을 강화하고 있으며, NIA와 업스테이지가 운영 중인 ‘Open-Ko LLM 리더보드’에서 ‘파인튜닝(Finetuning) 모델’ 분야를 차지하며 성장을 이어가고 있다.

 


  • 관련 기사 더 보기
%d bloggers like this: