'연상'에 해당되는 글 1건

  1. 2012.12.07 한국의 스타트업-(104)트윈워드 김건오 대표

 트윈워드(Twinword)는 얼핏 보면 영어단어 학습용 앱이나 관련 콘텐츠를 만드는 회사처럼 보인다. 실제 서비스는 그런 종류다. 하지만 그건 겉으로 드러나는 모습일 뿐이고 이 회사가 지향하는 바는 따로 있다. 

 수많은 단어의 연결을 통해 빅데이터를 구축하는 것이 트윈워드가 지향하는 것. 빅데이터를 구축, 언어가 활용되는 많은 서비스-검색엔진, 문맥광고, 음성인식 등-에 활용하려는 게 목표다. 창업자인 김건오 대표는 오래전부터 이런 생각을 해 왔고 이를 위해 고집스러울 정도로 일관되게 준비해왔다. 단어와 단어의 연결성이 어떤 조합을 만들고 이것이 인류의 삶을 개선시킬 기술의 발전에 얼마나 다양하게 쓰일지 ‘너무나 궁금하고 너무나 하고 싶어’ 계속 하고 있다고 한다. 자신이 좋아하는 것과 잘 할 수 있는 것의 접점은 찾은 셈이다. 이제 그에겐 이것이 ‘시장에 얼마나 필요하고 잘 쓰일 수 있는가’의 문제만 남아 있다.

◆언어처리에 특화된 엔지니어

김건오 대표는 성균관대 국문학과를 졸업하고 삼성SDS에 ‘기술영업직’으로 입사했다. 그런데 들어가서 엔지니어로 전환하게 된다. 원래 컴퓨터를 좋아했던 그는 대학교 4학년때 따로 컴퓨터 언어 수업을 들을 정도로 관심이 많았다. 때마침 삼성SDS에서는 부족한 사내 엔지니어를 보충하는 한편 전 사원에게 기술 마인드를 심어주기 위해 신입사원들을 대상으로 9개월 동안 유닉스, C언어 등 컴퓨터 언어 교육 프로그램을 운영했다고 한다. 컴퓨터를 좋아한 김 대표였으니 ‘물 만난 고기’였을 게 틀림없다.

 회사에서 컴퓨터를 배운 그는 1999년 퇴사해 서강대 컴퓨터공학과 박사 과정에 들어갔다. 한 친구를 만나 대화를 나누던 중 그가 국문학과를 나와 컴퓨터를 공부하고 있다고 했더니, “자연어 처리 관련 연구를 하는데 최적의 조합이네!”라는 말을 들었다. 그 말을 듣고 깨달은 바가 있어 서강대 컴공과 입학 후 자연어처리연구실에서 자연어처리를 기반으로 한 대용량 이메일 분류 시스템 등을 만들었다. 하지만 그는 거기서 기술의 한계를 느꼈다. “원하는 품질이 나오질 않더라구요. 왜 그럴까 생각해보니 언어 지식을 컴퓨터에 전달하기 위해선 언어 지식 정보체계를 구축해야 하는데, 그래야 대화가 되는데 그 정보체계가 구축이 되 있지 않았죠. 이걸 어떻게 하면 해결할까 고민했어요.”

 그가 생각한 것은 연상어. 어떤 단어를 들었을 때 연상되는 단어의 조합이 모이고 모이면, 어휘 정보로 축적되고 그 단어의 조합 DB가 일정 수준 이상 쌓이면 인간의 언어를 컴퓨터에게 이해시킬 수 있는 Human Computation이 가능하다고 본 것이다. 

 “구글이 이미지 라벨러라는 서비스를 만든 적이 있어요. 이미지를 봤을때 연상되는 단어를 작성하도록 해 이것을 데이터로 축적하면 이미지를 갖고 검색 등 다양한 곳에 활용할 수 있게 하는 거죠. 이미지에 태깅을 할 수 있기 때문인데 문제는 악용하는 이들이 많고 사람들로 하여금 이런 작업에 참여하게할 유인이 없어서 실패로 끝났죠.”

◆연상되는 언어가 만드는 새로운 빅데이터

구글도 해내지 못한 것을 어떻게 할까. 2003년부터 쓰리소프트라는 회사에 있다가 2006년에는 솔트룩스에 있던 김건오 대표는 2010년 회사를 나와 자신의 생각을 구체화하기로 마음먹었다. 그가 생각할 때 사람들의 자발적인 참여를 유도하는 게 가장 힘든 일이었다. 그래서 그가 찾은 방식은 공부를 하게 하면서 그 공부하는 과정이 DB가 되도록 하는 것.

 2010년 회사를 창업하면서 회사명을 트윈워드라고 한 것도 연상되는 단어가 핵심 사업이었기 때문이다. 공부를 하게끔 하는 방법으로 그가 생각한 게 영어단어 학습 서비스. 그래서 그는 일종의 깜박이 영단어 학습기 스타일의 ‘거미줄 영단어’라는 것을 만들었는데, 잘 되질 않았다. 비슷한 앱이 너무 많이 쏟아져 나온 탓도 있고 학습 앱을 처음 만들다보니 시행착오를 겪은 탓도 있었다.

 방법을 찾던 그는 우연히 2011년 정부의 실리콘밸리 진출 지원 사업에 참여하게 됐다. 정부가 주관해 20여개 벤처기업을 뽑아 실리콘밸리에 보내주고 여기서 VC(벤처캐피털), 엔젤투자자 등을 만나는 프로그램이었다. 여기서 투자자들로부터 그는 아이디어를 얻었다. 레벨테스트 프로그램을 만드는 것이 좀 더 효과적일 것 같았다. 2012년 3월 청년창업사관학교로 지정되면서 정부의 각종 지원 사업 대상자가 될 수 있었고 그러면서 개발은 더욱 탄력을 받았다. 사람들의 동기 부여가 얼마나 되는지 확인하기 위해 연상되는 단어의 조합으로 학습을 할 수 있는 내용을 담은 ‘두루마리 영단어’라는 책을 올 9월 출간하기도 했다.

 트윈워드가 내년 1월 출시를 목표로 하고 있는 ‘Level Pump’는 일종의 연상 어휘 사전이다. 앱으로도 나오고 웹 서비스로도 나온다. 무료로 레벨테스트를 할 수 있고 레벨에 맞는 영어단어를 이메일로 받아보며 학습을 할 수 있다. 물론 앱에서 레벨테스트와 학습을 할 수 있는 것은 물론이다. 유명 영영한 사전에 이 서비스가 적용되는 것도 내년 1월이다. 국내외에서 출시되는 각종 단말기에 제작시점부터 기본 탑재되는 그런 세일즈 작업도 하고 있다. 목표가 영어 학습 앱을 팔아서 돈 버는 게 아니라 이를 통해 DB를 구축하고 여기서 알고리즘을 만들어 디지털 세계의 단어 빅데이터를 만드는 것이기 때문에 일단 많은 사람들이 써야 하고 여기서 활동을 많이 해야 한다. 그래서 내년 3월에는 모바일 교육용 게임(앱)인 잉글리쉬 알케미(English Alchemy)도 출시할 계획이다. 연상어를 선택하는 게임인데, 국내보다는 글로벌 시장을 노리고 개발하고 있다. 내년 4월에는 학원 프랜차이즈에 영어 어휘레벨테스트를 공급하는 사업도 시작할 예정이다. 

◆아무도 안 가본 길, 끝까지 가고 싶다

Level Pump는 10단계로 나뉘어져 있다. 난이도가 점점 어려워진다. 간단하게 설명을 해 보자면 Dog라는 단어를 보여주고 animal, tail, lion 등 세 단어가 주어진다. dog라는 단어를 봤을 때 연상되는 가장 밀접한 연관단어를 선택하면 된다. 

 수많은 사용자들의 이런 선택이 모아지면 ‘연상어 맵’이라는 게 만들어진다. 이런 연상어 맵은 사람들이 어떤 생각을 하고 있는지, 언어가 어떻게 구조화되 표현되는지, 이를 통해 기계가 어떻게 사람들의 생각을 이해할 수 있을지를 파악하는 기본 데이터가 된다. 현재 홈페이지(http://www.twinword.com) 에서 시범 서비스를 체험해 볼 수 있다. 

 김건오 대표는 레벨펌퍼를 각종 교재, IT단말기(전자책, 전자사전, 태블릿PC 등), 학원 솔루션, 모바일게임, 이러닝, 마케팅 솔루션 등 다양한 영역에 활용한다는 계획이다. 장기적으로는 구글이나 야후, 네이버 등의 검색엔진이나 애드몹, 아이애드, 애드포스트 등 광고플랫폼, 시리나 보이스와 같은 질의 응답 엔진 또는 음성인식 엔진에 B2B로 활용되는 것을 목표로 한다. 일종의 문맥 정보이기 때문에 다양한 IT서비스의 지식베이스로 활용될 수 있다는 게 김 대표의 판단이다.

 “오래전부터 이거 하나만 생각하고 살았어요. 연상어의 조합을 통해서 단어의 빅데이터를 구축한다는 것. 이를 통해 사람과 기계가 대화를 나누는 베이스를 만들겠다는 것. 일부 회사들이 시도하긴 했지만 완성한 적은 없는 것 같아요. 아무도 안 가본 길이라 끝까지 가보고 싶어요. 제가 생각했던 가정들이 실현되는 것을 보고 싶습니다.” 

by wonkis

,
BLOG main image
임원기의 人터넷 人사이드
인터넷과 그 세상을 움직이는 사람에 대한 블로그.
by wonkis

카테고리

분류 전체보기 (766)
뉴미디어 세상 (119)
게임이야기 (66)
임원기가 만난 사람들 (55)
(책)네이버 성공 신화의 비밀-그 이후 (61)
夢幻泡影-삶과 꿈,살아가는 이야기 (55)
책 다시보기 (25)
한국의 스타트업 (293)
San Francisco&Berkeley (29)
스타트업 소식 (17)
한국의 스타트업 시즌2 (26)
스타트업 액셀러레이터&VC (14)

달력

«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
TNM Media textcube get rss DNS Powered by DNSEver.com
wonkis's Blog is powered by Tistory. Designed by Qwer999. Supported by TNM Media.