AI 데이터 전문 기업 셀렉트스타(대표 김세엽)가 유럽연합(EU)의 개인정보 보호 규제에 대응하는 벤치마크 데이터셋 구축에 착수했다. 본 사업은 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 추진하는 ‘2025년도 초거대 AI 확산 생태계 조성사업’의 일환으로 진행된다. 셀렉트스타는 국내 최초로 EU의 일반개인정보보호법(GDPR) 및 인공지능법(AI Act)에 기반한 오픈소스 데이터셋을 구축한다. 이를 통해 초거대 언어모델(LLM)의 개인정보 보호 규제 준수 여부를 평가할 수 있는 표준 데이터를 마련하는 것이 목표다. 최근 글로벌 개인정보 보호 기준으로 자리잡고 있는 EU 규제에 대응하기 위한 기반 확보라는 점에서 이번 프로젝트는 의미를 갖는다. 프로젝트는 EU의 주요 법령과 공공 보고서를 기반으로 대규모 데이터를 수집·정제하고, 개인정보 보호 관련 핵심 항목을 분류해 평가 기준을 수립하는 방식으로 진행된다. 이어 실제 서비스 환경에 적용 가능한 질의응답(QA) 데이터와 다국어 평가 자료도 제작될 예정이다. 이를 통해 AI가 규제를 이해하고 준수하는 정도를 정량적으로 검증할 수 있는 평가 체계를 구축한다. 이번 과제는 셀렉트스타가 주관기관으로 참여하며, 프로젝트 기획 및 데이터 구축, 품질 검증을 총괄한다. 참여기관으로는 플리토와 BHSN이 컨소시엄에 합류했다. 플리토는 다국어 데이터 정제 및 번역 품질 관리, 용어사전 구축 등을 맡고, BHSN은 법률 해석 및 규제 적용 자문을 통해 데이터셋의 법적 적합성을 확보하는 역할을 수행한다. 이번 사업을 통해 국내 최초로 EU 규제 준수 여부를 판단할 수 있는 LLM 평가용 벤치마크 데이터셋이 마련될 예정이다. 해당 데이터셋은 오픈소스로 공개되어 국내외 연구기관 및 산업계에서 자유롭게 활용 가능하며, 글로벌 개인정보 규제 대응 역량 강화에 기여할 것으로 전망된다. 김세엽 셀렉트스타 대표는 “이번 프로젝트는 국내 기업의 글로벌 시장 진출을 위한 기반이 될 것”이라며 “셀렉트스타의 AI 신뢰성 검증 기술을 활용해, LLM이 EU 규제를 얼마나 충실히 준수하는지를 객관적으로 평가할 수 있는 체계를 구축하겠다”고 밝혔다. 관련 기사 더보기 https://www.venturesquare.net/999364