유튜브 번역자막 24시간 안에 완성하는 방법

“이제 그만하자” 홍콩에서 데모데이를 마쳤을 때였다. 일정을 무사히 끝내고 모인 리셉션 자리. 이상헌 보이스루 대표가 말했다. 당시 보이스루는 실시간 음성인식 자동 대필 서비스를 선보이고 있었다. 청각장애인이 수업에 원활히 참여할 수 있도록 돕는 프로그램이었다.
보이스루가 개발하고 있던 자메이크는 연세대학교 창업열정대회에서 우승을 거머쥐고 사업화 단계로 나가고 있었다. 잘하고 있다는 격려도 받았다. 이 대표 생각은 조금 달랐다. 수익화까지는 아직 거쳐야 할 단계가 있다고 내다봤다. 개발자 출신으로 개발을 하다보니 어느 순간 느낌이 왔다 “아직은 때가 오지 않았다” 2017년 11월의 일이다.
“그래도 해야하지 않겠나” 보이스루에는 연고대 창업동아리 인사이더스에서 뭉친 네 명의 팀원은 아이템을 찾기 시작했다. 그러던 중 강의 동영상에 자막을 달고 싶다는 의뢰가 들어왔다. 청각장애인이 인터넷 강의를 볼 때 느끼는 불편함을 해소하기 위한 작업이었다. 일반적으로 번역 비용을 빼고 자막 제작에 드는 비용은 1시간(러닝타임 기준)에 55만원. 조금 더 저렴한 가격으로 빨리 제작할 수 있지 않을까.
이 대표는 “만들다보니 할만했다고 생각했다”며 당시를 되돌아봤다. 딥러닝과 신호처리 등 팀원의 강점을 극대화할 수도 있었다. 구체적인 시장도 보였다. 유튜브와 교육 영상에 수요가 있었다. 영어권 영상은 자막 제작이 보편적인 것과는 달리 도메인별 차이는 있지만 국내 영상의 8% 정도만 자막이 달려있다.  보이스루는 자막서비스 자메이크로 빠르게 피봇을 결정했다.
“자막의 핵심은 타임코딩을 맞추는 일, 자연어처리와 신호처리, 딥러닝이 결합된 기술력의 총아” 기존 자막 방식은 녹취록을 작성하고 타임라인에 따라 일일이 자막을 넣어야했다. 자메이크는 자막을 넣으면 자연어처리와 신호처리 알고리즘에 따라 타임라인에 자막이 얹어지고 오탈자는 검수만 하면 되는 시스템이다. 이 대표가 밝힌 정확도는 90%대다. 서비스 개시 후 딩고, 다이아TV 협업을 통해 서비스를 선보였다.
보이스루의 자막 서비스 자메이크는 국내 유튜버를 중심으로 입소문이 나는 중이다. 빠른 시간 안에 번역까지 제공되기 때문. 이 대표는 “국내 유튜버 영상을 외국인도 많이 본다. 자막에 대한 수요는 있지만 일일이 외국어 자막을 제작할 수 있는 환경은 아니”라며  “팬들이 달아준다고 해도 정확도나 신뢰도 면에서 한계가 있다”고 설명했다. 보이스루는 기술로 시간과 비용을 줄일 수 있었다. 현재 보이스루를 사용하면 한글 자막은 3시간 내, 번역자막은 최소 24시간 내 완성된다. 번역은 크라우드소싱으로 진행되고 있다. 전문검수까지 받아도 해도 기존 한국 자막 제작비용의 3분의 2 수준이다.
“프로젝트가 아니라 프로덕트를 만들고 싶었다” 머신러닝과 빅데이터에 관심을 두고 있었던 이 대표, 학부 시절 참여한 프로젝트만 열 손가락을 넘는다. 프로젝트를 무사히 완수했어도 아쉬움이 남았다. 말 그대로 프로젝트는 끝나면 끝. 일을 얼마나 하더라도 돌아오는 비용은 산학 연계규정에 따라 100만원이었다. 능력에 상관없이 외부에서 비춰지는 시선은 ‘100만원짜리 학부생’이었다. 스타트업에 대한 관심이 결심으로 변한 건 이 즈음. “프로젝트성으로 끝내지도 말고 능력치를 100만원으로 한정하지도 말고 더 크고 마침표를 찍을 수 있는 걸 하자”
이 대표가 이야기하는 마침표란 뭘까. 그는” 보이스루를 통해 언어라는 유리천장을 해소하는 것”이라고 말한다. 이 대표는 “한국에서 (사업을) 시작한다는 건 인구통계학적으로 많은 마이너스를 안고 가는 것과 같다”며 “언어의 장벽이 없어지려면 하나의 통로가 필요한데 우리가 찾은 방법은 바로 자막”이라고 강조했다. 국내 유튜버 혹은 영상 콘텐츠를 제작하는 누군가 언어의 장벽을 뚫고 세계적인 셀럽이 되는 그 날까지 보이스루가 함께 하겠다는 포부다. 보이쓰루는 자막 정확도를 99%까지 끌어올리고 올해 안에 본격적으로 사용자와 만날 계획이다.
%d bloggers like this: