
크라우드웍스가 16일 오전 코엑스에서 열린 한국과학기술원(KAIST) 김재철 AI 대학원 ‘AI 기술설명회’에서 최신 AI 기술 트렌드를 공유하고 자사의 데이터 전처리 기술을 소개했다고 16일 밝혔다.
이번 기술설명회는 KAIST가 연구 중인 핵심 원천 AI 기술을 산업계와 일반 대중에 소개하고, AI 기술 확산과 산학협력 활성화를 목표로 마련된 자리다. 본 행사는 ‘2025 국제인공지능대전(AI EXPO KOREA)’ 일환으로 개최됐으며, 크라우드웍스는 KAIST의 초청으로 강연에 참여했다.
강연자로 나선 양수열 크라우드웍스 최고기술책임자(CTO)는 ‘사장님이 잘 읽는 김대리의 보고서, AI는 왜 못 읽을까?’라는 흥미로운 주제로 강연을 진행했다.
양 CTO는 “AI가 일반 문서 포맷을 읽는 것은 가능하지만, 문서에 담긴 ‘의미’를 이해하고 이를 메타데이터로 추출하는 일은 여전히 쉽지 않다”며 “차트나 다이어그램과 같은 시각 요소들은 단순한 설명을 넘어, 주변 문장과 단락의 문맥까지 고려해 의미 기반 메타데이터를 구성해야 AI가 관련 정보를 정확히 검색하고 응답 품질을 높일 수 있다”고 설명했다.
이어 “우리나라 문서는 고유한 스타일과 구조를 가지고 있어, 외산 파서(Parser)를 그대로 사용할 경우 오류가 많이 발생한다”며 “이러한 국내 문서의 특성을 반영해 표나 시각 요소에 대한 정밀한 파싱과 처리를 통해 높은 정확도를 구현해야 한다”고 강조했다.
이와 함께 다양한 비정형 문서를 RAG(Retrieval-Augmented Generation)에 적합한 형태로 전처리할 수 있는 자체 솔루션 ‘알피 날리지 컴파일러(Alpy Knowledge Compiler)’도 소개했다. 해당 솔루션은 문서 내 테이블, 차트, 이미지 등에 대해 LMM(대형 멀티모달 모델) 기반 분석을 수행하고, 의미 기반 메타데이터를 추가해 검색의 정밀도와 질의응답 품질을 개선한다. 특히, 업계 최초로 문서의 복잡도를 정량화할 수 있는 자체 평가 지표를 적용해 문서 구조를 체계적으로 분석할 수 있고 이를 통해 데이터 전처리 오류 가능성을 줄이고 인력과 예산을 효율적으로 관리할 수 있다.
- 관련 기사 더 보기
Crowdworks introduces the latest AI technology trends at the 'AI Technology Briefing Session'

Crowdworks announced on the 16th that it shared the latest AI technology trends and introduced its data preprocessing technology at the 'AI Technology Briefing Session' hosted by Jae-Cheol Kim, AI Graduate School of the Korea Advanced Institute of Science and Technology (KAIST) held at COEX on the morning of the 16th.
This technology briefing session was designed to introduce the core source AI technology that KAIST is researching to the industry and the general public, and to promote AI technology diffusion and industry-academic cooperation. This event was held as part of the '2025 International Artificial Intelligence Expo (AI EXPO KOREA),' and Crowdworks participated in the lecture at the invitation of KAIST.
Yang Su-yeol, CTO of Crowdworks, gave a lecture on the interesting topic, “Why can’t AI read Manager Kim’s report that the CEO reads well?”
CTO Yang explained, “Although AI can read general document formats, it is still not easy to understand the ‘meaning’ contained in the document and extract it as metadata.” He continued, “Visual elements such as charts and diagrams must go beyond simple explanations and consider the context of surrounding sentences and paragraphs to configure meaning-based metadata so that AI can accurately retrieve related information and improve response quality.”
He continued, “Since our country’s documents have their own unique style and structure, using foreign parsers as they are will result in many errors,” and emphasized, “We need to reflect these characteristics of domestic documents and implement high accuracy through precise parsing and processing of tables and visual elements.”
Along with this, the company also introduced its own solution, 'Alpy Knowledge Compiler', which can preprocess various unstructured documents into a form suitable for RAG (Retrieval-Augmented Generation). The solution performs LMM (Large Multimodal Model)-based analysis on tables, charts, images, etc. in documents, and adds semantic metadata to improve search precision and query response quality. In particular, it can systematically analyze document structures by applying its own evaluation index that can quantify the complexity of documents for the first time in the industry, thereby reducing the possibility of data preprocessing errors and efficiently managing manpower and budget.
- See more related articles
クラウドワークス、「AI技術説明会」で最新AI技術動向紹介

クラウドワークスが16日午前、COEXで開かれた韓国科学技術院(KAIST)キム・ジェチョルAI大学院「AI技術説明会」で最新AI技術トレンドを共有し、自社のデータ前処理技術を紹介したと16日明らかにした。
今回の技術説明会は、KAISTが研究中の核心源泉AI技術を産業界と一般大衆に紹介し、AI技術の拡散と産学協力の活性化を目指している。本行事は「2025国際人工知能大戦(AI EXPO KOREA)」の一環として開催され、クラウドワークスはKAISTの招待で講演に参加した。
講演者に出たヤン・スヨルクラウドワークス最高技術責任者(CTO)は「社長がよく読むキム・デリの報告書、AIはなぜ読めないのか」という興味深いテーマで講演を進行した。
両CTOは「AIが一般文書フォーマットを読むことは可能だが、文書に含まれた「意味」を理解し、これをメタデータに抽出することはまだ容易ではない」とし、「チャートやダイアグラムなどの視覚要素は単純な説明を超えて、周辺の文章と段落の文脈まで考慮して意味ベースのメタデータを構成しなければならない」と関連情報
続いて「我が国文書は固有のスタイルと構造を持っており、外産パーサー(Parser)をそのまま使用するとエラーが多く発生する」とし「こうした国内文書の特性を反映して表や視覚要素に対する精密な解析と処理を通じて高い精度を実現しなければならない」と強調した。
これとともに、様々な非定型文書をRAG(Retrieval-Augmented Generation)に適した形で前処理できる独自のソリューション「アルピーナレッジコンパイラ(Alpy Knowledge Compiler)」も紹介した。このソリューションは、文書内のテーブル、チャート、画像などに対してLMM(ラージマルチモーダルモデル)ベースの分析を実行し、セマンティクスベースのメタデータを追加して検索の精度とクエリ応答品質を向上させます。特に、業界初の文書の複雑さを定量化できる自己評価指標を適用して文書構造を体系的に分析することができ、これによりデータ前処理エラーの可能性を減らし、人材と予算を効率的に管理することができる。
- 関連記事をもっと見る
Crowdworks在“AI技术说明会”上介绍最新AI技术趋势

Crowdworks 16日宣布,在16日上午于COEX举行的由韩国科学技术院(KAIST)人工智能研究生院金在哲教授主持的“人工智能技术说明会”上,分享了最新的人工智能技术趋势,并介绍了其数据预处理技术。
本次技术说明会旨在向业界和公众介绍韩国科学技术院正在研究的人工智能核心技术,促进人工智能技术的普及和产学研合作的活跃。本次活动是‘2025年国际人工智能博览会(AI EXPO KOREA)’的一部分,Crowdworks应KAIST的邀请参加了此次演讲。
Crowdworks CTO杨秀烈就“CEO很会读的金经理的报告,为什么AI读不懂?”这一有趣的话题进行了演讲。
CTO杨先生解释道,“虽然AI可以读取通用的文档格式,但要理解文档中所蕴含的‘含义’并将其提取为元数据,仍然并不容易。”他继续说道:“图表等视觉元素必须超越简单的解释,考虑周围句子和段落的上下文来配置基于含义的元数据,以便人工智能能够准确检索相关信息并提高响应质量。”
他继续说道,“由于我国文献有其独特的风格和结构,直接使用国外的解析器会导致很多错误”,并强调,“我们需要体现国内文献的这些特点,通过对表格和视觉元素进行精准的解析和处理,实现高精度”。
与此同时,该公司还推出了自己的解决方案“Alpy Knowledge Compiler”,它可以将各种非结构化文档预处理成适合 RAG(检索增强生成)的形式。该解决方案对文档中的表格、图表、图像等进行基于LMM(大型多模态模型)的分析,并添加语义元数据,以提高搜索准确性和查询响应质量。特别是,在业界首次应用能够量化文档复杂度的自我评估指标,系统地分析文档结构,从而减少数据预处理错误的可能性,并有效地管理人力和预算。
- 查看更多相关文章
Crowdworks présente les dernières tendances en matière de technologie de l'IA lors de la « Session d'information sur la technologie de l'IA »

Crowdworks a annoncé le 16 qu'il avait partagé les dernières tendances en matière de technologie de l'IA et présenté sa technologie de prétraitement des données lors de la « AI Technology Briefing Session » organisée par Jae-Cheol Kim, AI Graduate School de l'Institut coréen avancé des sciences et technologies (KAIST) qui s'est tenue au COEX le matin du 16.
Cette séance d'information technologique est conçue pour présenter les principales technologies d'IA étudiées au KAIST à l'industrie et au grand public, et pour promouvoir la diffusion des technologies d'IA et l'activation de la coopération entre l'industrie et le monde universitaire. Cet événement a eu lieu dans le cadre de l'« Exposition internationale sur l'intelligence artificielle 2025 (AI EXPO KOREA) », et Crowdworks a participé à la conférence à l'invitation du KAIST.
Yang Su-yeol, directeur technique de Crowdworks, a donné une conférence sur un sujet intéressant : « Pourquoi l'IA ne peut-elle pas lire le rapport du directeur Kim que le PDG lit bien ? »
Le directeur technique Yang a expliqué : « Bien que l'IA puisse lire des formats de documents généraux, il n'est toujours pas facile de comprendre la « signification » contenue dans le document et de l'extraire sous forme de métadonnées. » Il a poursuivi : « Les éléments visuels tels que les graphiques et les diagrammes doivent aller au-delà de simples explications et prendre en compte le contexte des phrases et des paragraphes environnants pour configurer des métadonnées basées sur le sens afin que l'IA puisse récupérer avec précision les informations connexes et améliorer la qualité des réponses. »
Il a poursuivi : « Étant donné que les documents de notre pays ont leur propre style et structure uniques, l’utilisation d’analyseurs étrangers tels qu’ils sont entraînera de nombreuses erreurs », et a souligné : « Nous devons refléter ces caractéristiques des documents nationaux et mettre en œuvre une grande précision grâce à une analyse et un traitement précis des tableaux et des éléments visuels. »
Parallèlement à cela, la société a également introduit sa propre solution, « Alpy Knowledge Compiler », qui peut prétraiter divers documents non structurés dans un format adapté au RAG (Retrieval-Augmented Generation). La solution effectue une analyse basée sur le LMM (Large Multimodal Model) sur des tableaux, des graphiques, des images, etc. dans des documents et ajoute des métadonnées sémantiques pour améliorer la précision de la recherche et la qualité des réponses aux requêtes. En particulier, il est possible d'analyser systématiquement la structure du document en appliquant un indice d'auto-évaluation qui peut quantifier la complexité des documents pour la première fois dans l'industrie, réduisant ainsi la possibilité d'erreurs de prétraitement des données et gérant efficacement la main-d'œuvre et le budget.
- Voir plus d'articles connexes
You must be logged in to post a comment.