티스토리 뷰

32x32이미지


네앱연구소 네이버I

https://m.naver.com/lab/feature/NAVERI



구글의 알파고 충격이후 뒤늦게 시장에 띄어든 네이버가 글로벌 인공 지능 (AI) 시장에 출사표를 던졌습니다. 네이버는 '오감(五感)'즉 시각과 청각 · 촉각 · 후각 ·  미각과 같은 사람들이 느끼는 다섯 가지 감각을 AI '클로바'에 넣고 AI시장에 도전한다고합니다. 


네이버는 이미 '스노우'와 같은 얼굴 인식 카메라 앱을 통해 방대한 양의 영상 데이터를 축적 해 왔기 때문에 최소한 청각 및 시각 관련에 있어서는 상다한양의 데이터와 기술을 보유하고 있는 것으로 알려져 있습니다. 


이번 MWC에서 공개된 Clover는 음성 인식 및 시각 인식, 대화식 엔진 등 다양한 기술을 통합 한 통합 AI 플랫폼인 Amica의 업그레이드 버전입니다. 


클로버는 인간의 감각에 맞는 '클로버 인터페이스'와 뇌의 역할을하는 '클로버 브레인'으로 구성되어 있습니다. 그 중에서도 클로버 인터페이스에는 음성을 인식하는 '클로버 보이스'와 얼굴과 이미지를 인식하는 '클로버 비전'이 포함됩니다. 그것은 귀와 눈의 역할을하는 청력과 시력을 가지고 있습니다.


클로버 인터페이스가 청각 및 시력 감각을 수용하여 클로버 브레인 (Clover Brain)에게 전달할 때 '브레인'은 자연 언어 처리 기술, 대화 기술, 인공 신경망 기계 번역을 사용하여 작업을 수행합니다. 


Clover의 시청각 기술은 음성 인식 스피커 'Wave'(올 여름 출시 예정)와 스마트 디스플레이 'Face'(이번 겨울에 출시되 예정)로 제공 될 예정이라고합니다. 웨이브는 아마존의 '에코 (Echo)'나 SK 텔레콤의 '누구 (Who)'와 비슷한 형식을 취할 것으로 예상된됩니다. FACE의 경우 프로토타입이 공개되지는 않았지만 얼굴 인식과 같은 이미지 인식 기능과 디스플레이를 갖춘 차세대 인공 지능 장치가 될 가능성이 높은 기술입니다.


네이버 클로버에 포함된 음성 인식 엔진은 미국의 홉킨스대 (University of Missouri-Hopkins)의 오픈 소스 '칼디 (Kaldi)'를 기반으로합니다. 칼디는 2011년에 발표된이후 세계적으로 가장 많이 사용되고 있는 음성인식기술 이라고합니다. 


"네이버 (Naver)는 오래 전부터 음성 인식 기술을 발전시켜 왔고 포털을 통한 자연어 분석에 대한 노하우를 축적 해 왔기 때문에 구글과 같은 글로벌 기업보다 한국어 에서는 구글보다 더 발전된 기술을 보유하고 있을지 모른다"고 알려져있습니다. 


실제로 테스트 결과 네이버의 음성 인식 정확도는 구글의 음성 검색 기능에 비해 정확도가 더 높은 것으로 나옵니다. 



안면인식 기술 부분에서 네이버는 현재 'Snow', 'B612', 'Lux'카메라 앱이 있습니다. 이 앱들을 통해 매달 45억장의 데이터를 학습하고 있습니다. 

현재는 시각과 청각부분의 서비스만 계획중이지만 네이버는 궁극적으로 이외에도 촉각, 냄새, 맛 등 오감을 모두 가진 클로버를 '올인원 AI'로 끌어 올릴 계획이라고 합니다. 


구글이나 페이스북 같은 글로벌 IT업체에 비해 한참이나 뒤쳐져있어 보이지만 그래도 국내 1등 업체인데 국내에서 한글화된 서비스에서는 독보적인 위치를 차지 하기를 바랍니다. 


참고로 구글은 사용자의 사진을 무제한으로 업로드할수 있는 클라우드 서비스를 통해  전세계적인 데이터를 학습하고 있습니다.(무료가 무료가 아닌경우가 올지도 모릅니다) 

최근에 이미지를 인식하고 인식한 이미지를 텍스트로 설명하는 기술 시연회를 열었다고 합니다. 

페이스북도 영상의 내용을 시각적으로 설명하는 루모스(Lumos)기반 AI기술을 발표했다고합니다.  


댓글