대화형 데이터 구축 서비스 TEXTNET, 그리고 고경민 대표

MJAY 2022년 6월 7일

지난 몇 달 사이 스피링크는 눈에 띄는 행보를 보였다. 2년 연속 한국데이터산업진흥원 데이터 바우처 지원사업 공급기업 선정, 카카오 계열사인 넵튠으로부터의 20억 원 투자 유치, 그리고 가장 최근에는 2022 SK트루이노베이션 액셀러레이터 1기 선정까지. 스피링크는 대화형 데이터 구축 서비스인 ‘텍스트넷 (TEXTNET; 이하 TEXTNET)’을 제공하고 있는 기업이다.

◆ TEXTNET인공지능 데이터 구축 가공 서비스 – 언어학, 심리학, 데이터 과학을 총망라한 데이터 설계 구축 가공 과정

고경민 대표의 설명에 따르면, TEXTNET은 챗봇의 기본 대화 데이터에 각 고객사 니즈별 AI 페르소나를 설계, 디자인된 페르소나에 언어학, 심리학 및 데이터 과학 분야를 접목해 더욱 풍부하고 세밀한 대화 데이터를 구축한다. 그리고 해당 데이터를 기반으로 향후 AI 서비스가 실제로 고객과 나눌 대화를 가공하는 서비스까지 제공하고 있다.

이처럼 완성된 TEXTNET의 챗봇 서비스는 브랜드 이미지, 서비스 형태에 따라 다양한 어투와 문장 구조, 심지어 유머 수준까지 조절하며 특유의 페르소나에 따라 소비자와 소통하고 있다.

설명을 듣다 보니 TEXTNET의 서비스가 다른 챗봇 서비스와 어떤 점이 다른지, 그가 생각하는 고경민 대표가 말하는 AI다운 AI서비스가 무엇인지 궁금해졌다. AI에 페르소나 개념을 접목한 다소 생소한 개념부터 알아보기로 했다.

◆ AI의 페르소나는 개성까지 데이터화 한 것,일종의 분위기를 입혀주는 설계 과정

고경민 대표는 “수많은 챗봇 중 같은 챗봇은 없다”며 인터뷰를 시작했다. 페르소나 구축 과정은 데이터 설계 과정 중 하나라며, 고경민 대표는 대뜸 소개팅 이야기를 꺼냈다. “소개팅한다고 하면 기자님도, 상대방을 서로를 알아가는 과정이 필요하잖아요. 서로를 알려면 지금까지 어떻게 살아왔고 좋아하는 음식은 뭐냐… 또 자주 쓰는 말투, 이런 정보가 필요해요. 그 정보를 기반으로 그 사람의 성향과 분위기를 파악하게 되는 거죠. 저희가 하는 일도 비슷해요. 대화형 AI의 분위기를 만드는 거죠. 그걸 스타일링 한다고 표현하고 있어요”라고 그는 말했다.

예를 들어 남자, 30대, 디자이너, 싱글, 고양이를 키우는, 등등. 그러면 어느 정도 예측이 가는 취향과 개성이 있다. TEXTNET은 AI에 같은 과정을 녹이며 페르소나를 구축하는 것이라 했다. 페르소나를 만든 뒤에는 그에 따른 행동 양식을 설계하게 된다. 고경민 대표는 MBTI 개념을 생각하면 쉬울 거라고 말했다.

“MBTI 개념을 생각하시면 쉬울 것 같아요. MBTI는 행동 패턴이나 성향을 나타내는 지표잖아요? 예를 들어 INTP가 ESFP랑 이야기를 하면 어떤 단어들을 사용할까, 이런 문장 하나하나가 다 TEXTNET의 데이터가 되는 거죠. 이런 데이터들이 다 저희의 스타일링 과정에 사용되어요”

이렇게 페르소나를 갖게 된 AI 서비스는 소위 영혼이 없다고 불리는 챗봇 서비스랑은 다른, 진짜 사람과 대화하는 느낌을 사용자에게 주게 된다고 그는 덧붙였다.

◆ 페르소나가 필요한 이유, 결국 사람은 타인과 편히 소통하고 싶기 때문

TEXTNET이 챗봇 서비스 설계에 있어 페르소나 분야에만 자체 항목 구성을 두는 등 많은 투자를 하는 이유를 물었다. 고경민 대표는 우리가 결국은 사람이기 때문이라고 답했다. “사람이 누군가와 대화를 계속하게 되는 이유 중 하나는 안정감이에요. 안정감을 갖는데 아주 중요한 요소가 바로 일관성이고, 페르소나가 없으면 일관성은 유지되기 어렵죠”라고 그는 덧붙여 설명했다.

고경민 대표는 페르소나가 중요한 이유로 디지털 휴먼 분야를 예시로 들었다. 인간은 인간과의 대화에서 안정감을 찾듯, AI와 소통할 때도 최대한 인간과 비슷한 수준의 안정감을 바란다는 것. “우리는 인간과 이야기할 때 안정감을 느끼죠. 그 사람이 어떤 사람인지 파악할 수 있는 지표가 있으니까요. 왜냐면, 우리는 사람이고, 사람은 사람 같지 않은 사물이나 물건과는 대화하고 싶지 않으니까요.”

이와 같은 소비자의 안정감을 위해 노력하는 TEXTNET의 노력 일환은 앱이나 웹 서비스를 기획할 때 사용자가 가장 편하게 서비스를 이용할 수 있게 하는 노력과 다르지 않다. 고경민 대표는 평생 사람과 대화해온 인간에게 대화형 소비자 경험 (CUX; Conversational User Experience) 기준 페르소나를 가진 챗봇과 그렇지 않은 챗봇 중 어떤 것이 더 편한 것인지는 당연하다고 말했다. 당연히 전자일 것이다.

◆ 기획 영역과 기술 영역의 교집합 역할로 데이터 설계자 역할 수행

그래서 이러한 서비스를 가능케 한 TEXTNET의 기술적 요소를 물었다.
고경민 대표는 기술 요소를 설명하기 전, 자사의 독특한 마켓 포지션을 꼽았다. AI 서비스 시장은 기획과 기술 분야로 나뉘어 있다. 기획은 도메인의 영역으로 서비스 기획자들이 설계하는 분야지만 기술 측은 AI 모델링 부분을 담당하고 있다. 고경민 대표는 이분화 된 시장 구조에서 발생하는 문제점을 파악할 수 있었다고 했다. “시장이 이분화 되어 있다 보니 기획자는 모델링에 대해 모르는 부분이 많고, 모델링 담당자들은 기획에 대해 모르다 보니 시간과 비용이 너무 많이 허비되고 있었다”고 그는 설명했다.

고경민 대표는 은행 챗봇 서비스의 예를 들었다. “은행 도메인이 원하는 서비스 기획들이 있을 것이고, 도메인 지식이 있을 거예요. 그리고 은행 챗봇 기획자는 증권이나 예금 상품 등을 잘 알고 있겠죠. 하지만 AI 모델링을 하는 설계 쪽은 은행 상품의 전문가가 아니에요. 정확히 상품에 대해 파악하지 못한 상태에서 우선 모델을 구축하다 보니, 상품과 AI 모델이 딱 맞아떨어지지 않는 겁니다. 개발자가 기획 부분을 배워서 할 실정도 안 되고, 계속 수정만 거치다 보니 기회비용이 너무 많이 드는 거죠”.

이러한 간극을 메우기 위해 TEXTNET은 중간에서 도메인의 지식을 AI 모델이 잘 이해할 수 있도록 언어학적 관점에서 재설계를 하는 설계자 역할을 하고 있다고 한다. 이 두 영역 사이에서 조율하며 데이터셋을 개발하기 때문에 비용 및 효율 측면에서 최선의 결과물을 도출하는 것이 TEXTNET 기술의 강점이다.

◆ AI챗봇 구축 서비스에 필요한 수많은 결정을 내리는 것은 결국 인간의 몫

“정확한 데이터가 나오려면 수많은 시뮬레이션이 필요해요. 그리고 그렇게 하는 게 사실은 매우 어려운 상황인 것도 사실”이라고 고경민 대표가 말했다. 하지만 TEXTNET 내에는 데이터 AI모델링을 위한 기술팀과 언어나 심리적인 관점에서의 데이터 설계를 위한 설계팀이 구축되어 있어 시뮬레이션이 가능하다.

고경민 대표는 특히 많은 데이터를 처리하게 되는 데이터 과정에는 두 가지 단계가 있다고 했다. 첫 번째 단계인 프리-트레이닝 단계는 여러 변수의 방대한 데이터를 학습하는 단계로, 해요체, 합쇼체 등의 문체부터 도치 구문 사용 비율까지 설정할 수 있으며, 페르소나가 투영된 말투, 톤앤매너까지 데이터하는 과정이라고.

고경민 대표는 두 번째 단계인 스타일링에서 단계에서 인간의 개입이 필요하다고 했다. “이 지점이 고객사와의 협의가 필요한 시점이죠. 프리-트레이닝 단계의 데이터의 양은 너무 방대한 수준이니 어떤 요소를 뺄지, 더 섞을지 등을 결정하는 논의를 하는 겁니다. 프리-트레이닝에서 기본 골자를 만들어갔다면, 아까 설명해 드린 스타일링이 두 번째 데이터 학습 과정이에요. 챗봇의 미세 신경들을 만들어가는 과정이죠. 예를 들어, 챗봇을 콜린 퍼스의 페르소나처럼 만들고 싶다고 한다면 콜린퍼스와 연관된 모든 데이터를 모은 뒤, 콜린 퍼스의 여러 모습 중에서도 달콤한 콜린 퍼스의 모습을 30% 더 가미하거나, 액션을 즐기는 콜린 퍼스의 모습을 10% 줄이는 등의 과정을 스타링일이라고 합니다”라고 그는 설명했다.

이와 같은 작업을 하기 위해서 TEXTNET 팀에는 임상심리학, 국어국문학, 문예창작학, 상담심리학, 전산언어학 등 여러 분야 출신의 석박사 직원들이 많다고 한다. 그리고 그들은 끊임없는 연구를 통해 AI가 주어진 페르소나에 가장 적합한 형태의 대화를 할 수 있도록 데이터를 구축하고 있다고 고경민 대표는 말했다.

◆ 사람다운 AI가 아닌, AI 다운 AI를 만드는 것이 목표

AI 기술에 있어 빼놓을 수 없는 윤리적 문제에 관해 물었다. 그리고 그가 말하는 AI다운 AI가 무슨 뜻인지도. “처음에는 사람다운 AI를 만들려고 했는데, 생각해보니까 사람 중에서는 살인자도 있잖아요. 비윤리적인 사람들도 많다는 생각이 드니 AI가 인간의 그런 모습까지 답습해서는 안 되겠더라고요”라고 고경민 대표는 말했다. 그래서 우리 사회에서 필요한 AI는 사람다운 AI가 아닌, 사람들에게 필요한 AI다운 AI라고 생각했다고.

고경민 대표가 생각하는AI는 “사람을 위해 존재하고 사람과 소통하므로 사람과 유사한 형상을 갖게 되는 것”이다. 사람들마다 윤리 기준이 다른 것처럼, AI도 도메인 상에서 서비스 기획의 타깃과 목적과 목표에 따라 윤리 기준 레벨링이 조금씩 다를 수 있다. 기준이 다르기 때문에, TEXTNET은 더욱 명확한 윤리 프레임웍을 갖추게 되었다고 고경민 대표는 설명했다. 고경민 대표는 TEXTNET는 사회의 공익이나 정서에 유해를 끼칠 만한 콘텐츠는 작업하지 않는다는 기조를 갖고 있다고 말하며, 이러한 기조들이 모여 AI다운 AI를 만들어 가길 희망한다고 덧붙였다.

◆ 이번 SKT 트루 이노베이션 협업도 AI다운 AI 시도의 일환

AI다운 AI를 만들어 가기 위한 노력 중 가장 최근의 사례로는 SKT 협업 건이 있다고 고경민 대표가 이어 말했다. 이에 함께 배석한 백난희 마케팅팀장은 자사 명함에 그려진 로고를 보여주었다. “로고를 보시면, (T자에 있는 빛 부분이) 이게 등대거든요. 우리만 알아보지만 (웃음). TEXTNET에는 그런 철학이 있어요. AI 기술이 물질 만능주의로 빠지지 않도록 가이드하는 역할을 하자. SKT도 저희와 같은 철학을 갖고 계신 것 같아요. SKT가 ESG 산업에 주력하고 있는 만큼, 우리가 파트너 역할을 할 수도 있고요”

<고경민 대표와 백난희 팀장>

◆ 향후 계획

현재 TEXTNET의 수익 모델은 AI 학습 데이터 공급 업무이다. 하지만 앞으로는 2차 생산물을 만들어내고 싶다고 고경민 대표는 말했다. 자동차의 연료가 석유에서 전기로 변하는 현재, 석유가 1차 생산물이라면 전기는 2차 생산물인 것처럼 TEXTNET도 1차 생산물이었던 AI 학습 데이터 공급을 넘어 새로운 서비스나 솔루션을 출시할 계획을 세우고 있다고.

자세히 물었다. “유튜브의 시대가 시작되면서 방송사만이 방송 송출권을 갖고 있었던 시대는 끝이 났던 것처럼, 데이터를 통해 모두가 쉽고 편리하게 디지털 휴먼을 만들 수 있는 플랫폼을 만들어보고 싶습니다”라고 고경민 대표는 설명했다. 요약하면, TEXTNET은 기획과 기술 중간 지점에서 서비스 기획 특징을 국어학적, 심리학적 측면으로 분석한 다음, 필요한 지식을 설계해 사전에 넣어주는 중계자 역할뿐만 아니라 데이터의 실사용 현황을 보며 대화 설계의 고도화 방안까지 제공하는 서비스다. 앞으로는 어떻게 될까. 고경민 대표의 말에 따르면, 그의 서비스는 꼭 인간의 형태가 아니어도 캐릭터가 될 수도 있고 목소리가 될 수도 있고 대화가 될 수도 있다.

한 가지 분명한 것은 AI 기술이 인간에게 가장 이로운 방식으로 사용될 수 있도록 누구나 누릴 수 있는 AI 다운 AI 서비스를 만들고 싶다는 것이 TEXTNET이 꿈꾸는 AI 기술의 미래다.

Related

Related

%d bloggers like this: