인공지능 시대, ‘환각’ 잡아내는 RAG 기술 주목

챗GPT와 같은 생성형 AI 기술이 광범위하게 활용되면서 할루네이션을 줄이는 것이 AI 업계의 새로운 과제로 부상하고 있다. 할루시네이션은 환각이나 환영·환청을 뜻하는 영어 단어로, 생성형 AI의 거짓 정보를 마치 사실인 것처럼 생성·전달하는 현상을 뜻한다. 즉 AI가 주어진 데이터에 근거하지 않은 잘못된 정보나 아예 존재하지 않는 허위 정보를 전달하거나 처리하는 정보의 맥락이나 의미를 오해해 잘못 표현하는 것이 이에 해당한다.

할루시네이션은 생성형 AI의 특성상 필연적인 오류로 여겨지는데 이는 생성형 AI가 광범위한 데이터를 학습할 때 각 데이터의 진위를 정확히 확인하지 못하기 때문이다. 하지만 할루시네이션은 가짜뉴스를 생성하고 유포하는 데 악용될 수 있으며 AI 시스템에 대한 사용자의 신뢰를 약화시키는 원인이 되기도 한다는 점에서 매우 주의가 요구된다.

이에 국내의 다양한 산업군에서 RAG(검색증강생성)를 통해 할루시네이션 현상을 줄이고 있다. 특히 정확한 정보 제공이 중요한 금융업계와 법조계는 물론 공공기관에서도 RAG를 적극 활용하며 이용자 편의와 신뢰도를 높이고 있다.

◆ 단순 업무는 줄이고 업무 집중도는 높인 RAG 활용 인공지능 도입 한 ‘로앤굿’

리걸테크 기업 로앤굿은 지난해 10월 열린 리걸 테크 AI 포럼에서 자연어 검색이 가능한 변호사용 인공지능 챗봇 시제품인 ‘로앤봇’을 공개한 바 있다. 해당 프로토타입은 문장에서 의미와 문맥을 알아서 이해해 키워드 없이도 유사내용을 검색할 수 있다. 또한 지난 5년간 개인정보가 법률적으로 연결된 부분을 학습하는 식으로 구동 가능하다.

로앤굿에 따르면 로앤봇은 개인정보 포털에 공개된 최근 5년간 총 4360페이지에 달하는 결정문·심결례·가이드라인·판례집 등을 학습했으며, RAG를 활용해 국내법에 특화된 챗봇으로 구현했다.

로톡 운영사인 로앤컴퍼니도 빅케이스GPT를 공개했다. GPT 기반의 빅케이스GPT는 국내 판례 약 329만건 분량의 자체적인 빅케이스 데이터를 활용한 RAG 모델을 적용했다. 로앤컴퍼니는 ‘로톡’ 서비스에 변호사 상담 전 작성하는 상담글을 요약 정리하고 변호사에게 예상되는 법률분야를 제안하고 분류해주는 기능을 추가했다. 빅케이스GPT에도 판결문 내 ‘AI 요점 보기’ ‘AI 유사판례’ ‘쟁점별 판례 보기’ 등 AI를 이용한 서비스로 활용도를 높였다.

◆ 저작권 이슈부터 할루시네이션 문제까지 해결한, 비플라이소프트

비플라이소프트는 AI 기반의 데이터 통합 플랫폼 & SaaS 기업으로, 생성형 AI 고도화를 위한 ‘AI 라벨링 & 실시간 데이터 파이프 라인’을 보유하고 다양한 글로벌 생성형 AI 서비스 플랫폼에 이식을 지원하고 있다.

비플라이소프트는 지난 10월 생성형 AI 학습에 필수적으로 요구되는 뉴스 데이터 및 실시간 데이터 공급 플랫폼 RDPLINE을 출시했다. RDPLINE은 국내 미디어 얼라이언스를 통해 확보한 약 7억건의 원천 데이터와 이를 라벨링, 정제 가공한 빅데이터, 매일 생성되는 20만건의 기사를 통합 제공한다.

최근 전 세계적으로 생성형 AI 시장이 급성장하면서 학습 데이터의 저작권 보호 문제가 업계 화두로 떠오르고 있다. RDPLINE은 저작권 이슈 회피가 가능할 뿐 아니라, 초거대 AI에서 흔히 발생하는 환각 문제인 ‘할루시네이션’ 문제도 해결해주고 있다.

◆ 할루시네이션 줄이기 위한 RAG 활용으로 신뢰성 강화, KB국민카드

KB국민카드는 수백가지의 이벤트 정보를 고객에게 보다 정확하게 전달하기 위해, 국내 대표 인공지능(AI) 기업 스켈터랩스가 개발한 GPT 기반의 질의응답 챗봇 솔루션 ‘벨라 큐나’를 활용하여 ‘이벤트 Q&AI’ 서비스를 출시했다.

스켈터랩스의 ‘벨라 큐나’는 LLM 기반 기업 맞춤형 챗봇 솔루션으로, 객관성과 시의성에 한계가 있었던 LLM을 RAG로 보강해 보다 정확하고 최신 데이터를 기반으로 답변을 생성한다.

KB국민카드의 이벤트 Q&AI 서비스는 벨라 큐나와 KB국민카드의 기업 이벤트 정보를 API로 연동하는 방식으로 진행됐다. 해당 서비스는 RAG를 활용해 매일 변화하는 최신 이벤트 정보를 간편하게 업데이트 하고, 이를 기반으로 답변을 생성한다. 정보의 최신성을 강화하고 할루시네이션 현상을 최소화한 고객 친화적인 맞춤형 서비스인 셈이다.

◆ 통계청도 편익 도모 위한 공공데이터 디지털화 속도 높인다

공공기관 역시 인공지능을 도입해 디지털 전환에 박차를 가하고 있다. 최근 통계청은 RAG가 적용된 인공지능 기반 통계 챗봇 서비스를 선보일 예정이라고 밝혔다.

올해 하반기 대국민 서비스를 목표로 주요 통계에 대해 통계 추천과 전문적 질의응답이 가능한 초거대 AI 기반 통계 챗봇 서비스를 구축한다. 그동안 국가통계포털(KOSIS)에 챗봇 서비스가 제공되고 있으나, 정확한 통계용어를 사용하지 않는 경우 제대로 된 답변을 받기 어려웠다. 초거대 AI 기반 통계 챗봇 서비스는 일상언어로 질문하는 통계도 맥락과 의도를 파악해 이용자가 궁금한 사항을 대답할 수 있게 된다.

환각 현상을 예방하기 위해 RAG 방식이 적용된 팩트체크 로직을 구현할 계획이다. 언어를 이해하고 표현하는 능력은 민간의 검증된 초거대 AI 언어모델을 활용하되 실제로 정보를 검색하고 답변을 생성하는 부분은 전문적인 통계문서를 고차원적인 벡터로 저장한 통계학습 데이터베이스에서만 찾아오도록 설계할 계획이다.

 


  • 관련 기사 더 보기
%d bloggers like this: