플리토가 국립국어원이 주관하는 ‘한국어-외국어 병렬 말뭉치 구축 사업’에 5년 연속 참여했다고 19일 밝혔다. 이 사업은 인공지능(AI) 기술 개발을 위한 고품질 언어 데이터 구축을 목표로 하며, 한국 언어문화의 데이터 주권을 지키고 한국형 인공지능 기술의 발전을 지원하는 데 중점을 두고 있다. 플리토는 2021년부터 현재까지 5년 연속 이 사업을 수행하며, 총 115억 원의 수주액과 5천5백만 개의 어절을 구축한 실적을 기록했다. 올해 사업은 경희대학교 산학협력단과 협력하여 진행되며, 총 42억 원 규모의 사업 중 플리토는 20억 9천만 원 규모의 병렬 말뭉치 구축을 맡았다. 이번 사업에서는 베트남어, 인도네시아어, 태국어, 힌디어, 크메르어, 타갈로그어, 러시아어, 우즈베크어, 영어 등 9개 언어에 대해 총 900만 어절의 병렬 말뭉치를 구축할 예정이다. 플리토는 5년간의 사업 참여를 통해 AI 기반 번역 소프트웨어 및 자연어처리(NLP) 기술 개발에 필수적인 언어 데이터를 구축해왔다. 구축된 데이터는 정부 주도 언어문화 산업 발전을 위한 기술 개발에 활용될 예정이며, 특히 아세안-인도와 유라시아 지역의 저자원 언어를 데이터화함으로써 기존 데이터 불균형을 해소하고, 국가 간 언어문화 교류를 촉진할 것으로 기대된다. 이정수 플리토 대표는 "플리토의 언어 데이터 구축 경험과 전문성을 인정받아 5년 연속 사업을 수행하게 되어 뜻깊다"며, "앞으로도 고품질의 언어 데이터를 지속적으로 공급해 한국형 인공지능 기술의 글로벌 경쟁력 강화에 기여하겠다"고 말했다. 이번 사업을 통해 구축된 언어 데이터는 국립국어원이 운영하는 언어정보나눔터 통합시스템 '모두의 말뭉치'에서 확인할 수 있으며, 연구 및 기술 개발을 위한 중요한 자원으로 활용될 예정이다. 또한, 저자원 언어를 사용하는 국가로 진출을 계획 중인 국내 기업들에게도 중요한 지원 자료가 될 것으로 예상된다. 관련 기사 더보기 https://www.venturesquare.net/960297