인공지능 기반 챗봇 심심이, 대화 매커니즘과 최종 로드맵 공개

인공지능 챗봇 기업 ‘심심이(대표 최정회)’가 자체 개발한 동명의 솔루션 심심이의 대화 매커니즘 및 최종 개발 목표를 공개했다.

심심이는 사용자가 하는 말에 따라 답변을 제시하는 인공지능 챗봇으로전 세계 200여 개 국가에서 총 81개 언어로 글로벌 서비스되고 있다.

회사 측에 따르면 심심이의 인기는 ‘Talkset’이라고 불리는 대화 시나리오 덕분이다각각의 대화 시나리오는 사용자들이 가르친 질문 문장(Qtext)과 답변 문장(Atext) 쌍으로 이뤄지는 것이 특징이다사용자가 질문 문장을 말할 경우 답변 문장으로 답을 하라는 자동 명령이 적용되어 있는 것이다심심이 플랫폼에는 이러한 대화 시나리오가 한국어 기준 900만 개전 세계 언어 포함 기준 1 4천만 개가 자리하고 있다국내에서 가장 많은 사용자 발화 패턴을 보유하고 있다고 알려진 카카오뱅크 챗봇 12 9천개의 70배에 이른다이처럼 수없이 많은 대화 세트들이 심심이의 생동감 있는 대화를 이끈다.

챗봇 뒤에는 AICR이라고 불리는 심심이 대화 처리 엔진이 존재하고 있다대화 처리 엔진은 수많은 대화 세트들이 쌓여 있는 일종의 저장소로 적절한 응답을 찾는 작업을 수행하는 것이 특징이다심심이에게 사용자가 말을 걸면 사용자 문장이 AICR로 전달된다. AICR은 대화 시나리오 저장소에서 전달 받은 사용자 문장과 유사도 등의 관련성이 높은 질문 문장을 찾아 후보군을 만든다이어 가장 적절한 하나의 대화 시나리오를 선택한다선택된 대화 세트의 답변 문장을 이용하여 대답하는 원리다.

이처럼 심심이는 1억 개의 대화 시나리오를 기반으로 답변하기 때문에 사용자의 여러 대화 주제에 유연한 대응이 가능하다더불어 구조가 간단해서 가르치기 쉽다는 점이 장점이다간단한 가르치기 방법으로 고가의 딥러닝을 활용하지 않고그보다 뛰어난 사람의 두뇌를 지속적으로 활용할 수 있다. BERT GPT3 등을 활용한 여러 실험에서 대화 기술은 현세대 딥러닝 기술로 극복할 수 없음이 밝혀지고 있다또 빠른 검색이 가능하기 때문에 수많은 대화 시나리오를 온전히 사용할 수 있다.

관계자는 심심이의 나쁜 말 처리 기술이 눈길을 끌 기능이라고 설명했다사람의 두뇌가 직접 처리한 데이터를 모아 자동화하는 흐름이 나쁜말 처리 기술 개발로 고스란히 이어진 셈이다심심이의 나쁜말 처리 기술은 네 단계로 발전한 것이 특징이다가장 먼저 나쁜 말 신고 제도를 꼽을 수 있다채팅 중 심심이가 나쁜 말을 하면 즉각 신고를 할 수 있도록 시스템이 설정돼 있다신고 누적 횟수가 많아지면 해당 대회 세트를 나쁜 말로 간주해 필터링하는 것이다.

아울러 문장의 유사성을 이용해 나쁜 말 확률을 계산하는 통계적 추정(STAPX), 크라우드 소싱으로 전수 검사를 진행하는 전수 검사 프로젝트(Mission A), Mission A 데이터를 기반으로 딥러닝을 이용해 자동화를 시키는 과정 등도 적용한 것이 특징이다.

심심이는 이러한 과정을 토대로 향후 나아갈 최종 목표를 공개했다서비스 면에서 심심이가 추구하는 핵심 가치는 사용자의 말에 공감을 할 수 있는 챗봇사용자와 관심을 주고받는 챗봇사용자와 맥락이 있는 대화를 하는 챗봇이다이를 위해 향후 더욱 발전하는 챗봇으로 도약할 수 있도록 연구개발 노력을 경주한다는 각오다.

심심이 최정회 대표는 “핵심 가치를 구현하기 위해서는 핵심 기능이 반드시 갖춰져야 하는데이전 대화 및 상황에 맞게 대화할 수 있어야 하고 또 심심이가 대화를 이끌어 갈 수 있어야 한다 “미국의 글로벌 기업이나 단체가 내놓는 기술을 답습하거나 같은 모델로 더 크게만 만들면 될 거라는 생각에 갇혀 있는 흐름이 안타깝다기술이 아닌 가치를 먼저 생각하고 추구할 가치에 맞는 기술을 찾거나 만들어 낼 때 오리지널리티를 가지게 된다심심이는 생산자와 사용자가 함께 모델을 향상시켜 나가는 방식을 추구하며 이러한 가치와 기능을 만족하는 심심이를 만들기 위해 지금보다 더 발전된 심심이 모델이 필요한 만큼 꾸준한 개발과 노력을 펼칠 것이라고 전했다

%d bloggers like this: