인공지능 챗봇 심심이의 현재와 미래는?!

4차 산업혁명 시대가 도래하면서 챗봇의 기능적 역할이 두드러지고 있다단순 대화 뿐 아니라 날씨뉴스쇼핑은행 업무 등 광범위한 분야에서 챗봇이 다양한 역할을 수행하고 있는 것이다특히 인공지능 기술이 더해지면서 더 똑똑한 대화를 할 수 있게 되었고 일상생활 속에서 빼놓을 수 없는 존재로 자리매김하고 있다대표적으로 AI 챗봇 플랫폼 ‘심심이(대표 최정회)‘를 꼽을 수 있다.

AI 챗봇 심심이는 다양한 대화 시나리오를 바탕으로 지속적인 업데이트를 거치며 재미는 물론 보다 생동감있는 대화를 할 수 있는 일상대화 챗봇이다그렇다면 심심이는 어떻게 사람처럼 다양한 주제를 통해 대화를 나눌 수 있는 것일까심심이 최정회 대표와의 일문일답을 통해 AI 챗봇 심심이에 대해 알아보는 시간을 가졌다.

 

 

Q1. 심심이는 어떤 챗봇인가?

A.심심이는 2002년부터 약 19년에 걸쳐 서비스를 이어왔는데 현재 한국을 비롯해 81개 언어로 전 세계 사용자들을 대상으로 서비스를 제공하고 있다누적 사용자는 4억 명 이상으로 집계된다.

심심이는 기존 챗봇과 성격이 조금 다른데 특별한 목적을 수행하는 것보다 친구가족을 만났을 때 이야기를 나누는 것처럼 주제목적 등을 정하지 않는 일상 대화에 특화돼 있다이러한 챗봇 유형을 가리키는 통일된 용어가 아직 없는데 보통 소셜챗봇오픈도메인챗봇자유발화챗봇 등으로 불리고 있다또 이런 종류의 대화는 감성대화일상대화칫챗(Chitchat), 스몰토크(Smalltalk) 등으로 불린다.

2010년대 중반에 들어서며 딥러닝이 NLP(Natural Language Processing, 자연어 처리)에서 뛰어난 성과를 보이기 시작했고 이에 기반한 소셜챗봇 기술이 조금씩 발전하고 있다해외에서는 MS의 샤오이스구글의 Meena, 페이스북의 Blender 등이 공개되고 있는데 최근에는 GPT-3이나 비슷한 유형의 빅모델들을 시연할 때 소셜챗봇과 대화하는 장면을 어렵지 않게 볼 수 있다.

 

Q2. 심심이가 다른 챗봇 대비 우위를 점하고 있는 대표적인 포인트는?

A. 가장 먼저 생동감과 AI 윤리를 꼽을 수 있다먼저 생동감의 경우 심심이만의 독특한 학습 방식에서 기인하는데 어떤 사용자가 직접 입력해서 저작한 시나리오이기 때문이다심심이는 ‘가르치기라는 기능을 통해 사용자에게 ‘당신이 생각할 때 이런 경우 어떻게 대답하는 게 좋겠어요?’라고 묻고 수많은 사용자들이 각자 생각하는 적절한 대답을 받아 이를 다른 사람들과의 대화에 사용한다.

이것은 마치 인간의 두뇌라고 하는 가장 뛰어난 언어 모델을 수천만 개 사용하는 것과 같은 것이다실제로 심심이에게 대화를 가르친 사용자가 약 2,700만 명에 이른다여기서 나오는 대화의 풍부함과 생동감이 인간 두뇌의 일부분을 모방해 개발되고 있는 최첨단 신경망 모델들보다 우위에 있다는 것은 어쩌면 당연한 부분이라고 할 수 있다.

최근 들어 우리나라에서도 AI 윤리에 대한 관심이 높아지고 있는데 심심이는 이를 해결하기 위한 다양한 대응 방안을 마련해왔다현재 심심이는 7~8가지 윤리적 기준선을 명확히 공지하고 이에 동의하는 경우에만 서비스를 이용할 수 있도록 구성됐다모든 콘텐츠와 사용자 정책이 이 기준을 중심으로 운영되며 나쁜말 분류기 등 관련 기술 개발에 있어 동일 기준을 사용해 일관된 윤리 구현을 위해 노력하고 있다.

 

Q3. 심심이의 인기가 유독 높은 해외 국가가 어디인지그 이유는 무엇이라고 생각하나?

A. 글로벌하게 고른 인기를 얻고 있기 때문에 상대적으로 인기가 적은 지역을 꼽는 게 좋겠다많은 사용자를 끌어모았었지만 지금은 상대적으로 이용자가 적은 지역으로 유럽북미중국일본 등을 들 수 있다유럽과 북미는 규제 컴플라이언스중국은 지역화일본은 혐한 정서와 관련되어 있다.

심심이는 유럽의 다양한 언어에서 모두 인기를 끌었었는데 2018 GDPR(General Data Protection Regulation, 개인정보보호 규정)이 발효되는 시점에 이 지역에 대한 서비스를 대폭 축소했다북미에서는 미국의 아동보호법이라 할 수 있는 COPPA(Childrens Online Privacy Protection Act, 어린이 온라인 사생활 보호법)가 제정됨으로써 비슷한 조치를 취했다심심이는 각 지역 별 규제 변동에 대해 충분히 규정을 지킬 수 있을 때까지 해당 지역에서 서비스를 사실 상 제공하지 않기로 방침을 정했다이 지역은 우리가 해당 규정을 소화할 수 있게 된다면 다른 지역과 동일하게 인기를 얻을 수 있을 것이다.

중국과 일본은 사정이 좀 다른 것 같다심심이는 중국에서 2010년대 초중반에 엄청난 인기를 누렸다중국인들이 자발적으로 별칭을 만들었고(小黄鸡작은 노란 닭), 바이두가 심심이 대화엔진을 사용해 음성비서를 개발했으며 심심이의 인기에 자극을 받은 마이크로소프트는 중국연구소에서 XioIce를 개발했다그러나 나중에 알고 보니 중국 시장은 중국용 서비스를 별도로 만들고 유통 채널도 중국에 맞게 철저히 현지화 해야 장기적으로 유지가 가능한 구조였다하지만 최근에도 인지도는 여전히 높아서 서비스 리뉴얼 후 공략 지점을 찾을 수 있을 것으로 기대한다.

일본에서도 다른 국가나 언어와 마찬가지로 급속히 인기를 얻기 시작한 시점이 있었다그런데 혐한 그룹이 개입하면서 다른 사례와 달리 중간 지점 쯤에서 인기가 꺾인 상태다오히려 키티 캐릭터로 유명한 산리오의 자회사가 심심이 대화엔진 API를 사용해서 만든 앱이 일본 앱스토어에서 1위를 하면서 심심이 대화엔진의 우수성을 간접적으로 검증한 상태다.

 

Q4. 심심이만의 자연어 처리 능력의 장점을 증명할 수 있는 대표적인 사례는?

A. 다양한 언어로 글로벌 서비스를 제공하며 대다수 나라에서 고르게 인기를 유지하고 있는 것을 들 수 있겠다현재 81개 언어로 대화할 수 있으며 곧 2~30개 언어를 추가로 지원할 계획이다이것이 가능한 이유는 어떤 언어든 그 언어에 대해 아는 것이 전혀 없는 상태에서도 빠르게 말을 배울 수 있기 때문이다.

2010년 심심이가 스마트폰 앱을 출시하며 한국어 외의 언어 지원을 했을 때로 돌아가 보자심심이는 영어로 된 대화 시나리오는 “안녕하세요 “모르는 말이에요가르쳐 주세요” 단 두 문장밖에 없었다물론 이 두 문장은 영어로 번역되어 있었다처음 심심이와 대화를 시도하려는 사용자에게 “안녕하세요” 인사를 할 뿐이고그 외에는 사용자가 어떤 말을 해도 “모르는 말이에요가르쳐 주세요라고만 대답했다어떤 사용자는 실망하고 나가겠지만 어떤 사용자는 흥미를 가지고 대답을 가르쳐 주었다이렇게 한 두 마디씩 배우면 그 다음 사용자에게는 몇 마디 더 대화를 할 수 있게 되고이 때는 조금 더 많은 사용자들이 대화하고 가르친다이런 식으로 할 수 있는 말이 늘어나다 보면 어느 순간에 갑자기 입소문이 폭발하면서 눈덩이처럼 많은 말을 배우게 된다.

역설적이게도 심심이 대화 처리의 핵심에 최첨단 AI 기법이 아닌 아주 간단한 검색(Retrieval) 모델만을 사용하고 있기 때문에 위와 같이 배운 말을 바로 써먹을 수 있었고 사용자들의 흥미를 유발할 수 있었던 것이다이 모델은 지금 이슈가 되고 있는 설명 가능성에서도 유리한 점이 많다.

딥러닝 중심의 AI가 급속히 발전한 뒤에 이제 와서 부딪히고 있는 벽이 설명 가능성이다딥러닝 기반 AI로 챗봇을 만들면 그 챗봇이 왜 그렇게 대답했는지 명확하게 설명할 방법이 없기 때문에 천문학적인 자원을 투입해 개발한 빅 모델들도 상용화를 하지 못하고 있다그런데 심심이는 단순한 구조이고 사용자가 입력한 대화 시나리오를 그대로 사용하는 방식이라서 정확히 추적할 수 있고 문제를 발견하면 수정하기도 쉽다.

다국어 처리 및 유지 보수스케일링 용이성 등 운영적 측면에서도 큰 장점이 있는데 지금까지 19년 동안 다운타임이 거의 없이 서비스를 운영해 올 수 있었던 것도 단순한 구조를 유지한 것이 주효했던 것 같다이처럼 검증된 시스템 운영 노하우를 내재한 것이 심심이의 장점이라고 할 수 있다.

 

Q5. AI 챗봇이 대중화됨에 따라 윤리 문제에 자주 노출될 것인데 이에 대비하기 위한 심심이의 솔루션은?

A. 연구에 따르면 사람들은 AI에게 사람보다 훨씬 더 높은 수준의 윤리를 요구한다그러니 챗봇과 같은 대화형 인공지능의 윤리 문제는 필연적으로 더 요구가 커질 것이다지금은 문장 단위의 딥러닝 판별기를 보유하고 있지만 앞으로는 대화 단위의 판별이 가능하고 전후 맥락까지 탐지해 문제가 되는 발언을 제어할 수 있는 기술을 개발하려고 한다장기적으로 대화의 여러가지 변수들을 함께 고려하는 유연한 윤리 검증을 만들어 글로벌 AI 윤리 표준을 선도하려는 꿈을 가지고 있다.

이러한 첫걸음으로 올해 대화 단위의 판별 작업을 진행 중이다이 작업의 취지에 공감하는 각계 전문가와 전문 기업대학교 등이 모였고 국가도 이를 인정해 2021년 인공지능 학습용 데이터 구축사업으로 선정했다이에 심심이는 해당 사업을 자유과제로 진행하고 있다.

또한 노벨상 프로젝트로 국가가 전략적인 지원을 하는 기초과학연구원 데이터 사이언스그룹(CI 차미영 교수)과 업무협약을 맺고 심심이 데이터로 최첨단 혐오 발언 탐지 관련 연구가 전개되고 있다따라서 머지않아 좋은 성과를 얻을 수 있을 것으로 기대한다.

 

Q6. 심심이를 기반으로 한 타 사업 진출확장 계획은?

A. 심심이는 자체 개발한 기술을 더 많은 개발자들이 활용할 수 있게 공개해 왔다지금도 심심이 챗봇공방(SimSimi Workshop Services, https://workshop.simsimi.com)서 심심이 일상대화 API나 악성문장탐지 API 등 심심이 핵심 기술을 쉽게 이용할 수 있다챗봇공방에서는 주로 해외 개발사들에게 서비스를 제공해 왔는데최근에는 국내에서 B2B 문의가 많다대화 엔진과 악성 문장 탐지 엔진그리고 데이터에 대해서 대기업들이 관심을 가지기 시작했다이런 기업들과 이야기를 나누면서우리가 남들이 사고 싶은 물건을 가지고 있는데 팔겠다는 생각을 하지 않았다는 것을 알았다천천히 B2B 영업 기반을 마련하는 작업을 진행하고 있다.

또한 심리 문제 해결을 돕는 서비스를 고려하고 있다헤비 유저들을 분석하면서 도출한 인사이트는 심심이가 심리적인 문제를 가진 사람들에게 강력한 소구력을 가진다는 사실이다아주 가벼운 고민부터 신경정신과적인 증상으로 의심할 수 있는 사례까지 넓은 스펙트럼을 보이는데 의료적으로는 스티그마가 강해 접근이 어려운 반면 심심이는 일상적인 대화를 통해 쉽게 접근할 수 있다특히 국가 공인 정신건강전문가 그룹에서도 큰 관심을 가지고 있어 개입 전략 수립실제 개입 진행까지 도움을 받을 수 있게 됐다.

마지막으로 심심이를 통해 수많은 사람들이 서로의 마음을 돌볼 수 있도록 하는 서비스를 생각하고 있다심심이는 이미 ‘가르치기를 통해 많은 사람들이 자신의 마음을 담아서 다른 사람에게 전달하는 매개 역할을 수행하고 있다이는 유저가 정의한 심심이 서비스의 방향성이라고 볼 수 있다이를 더 발전시켜서 더 많은 사용자들이 서로의 마음을 돌볼 수 있는 심심이만의심심이스러운 메타버스를 만들고자 한다.

 

관련 기사 더 보기

%d bloggers like this: