인공지능 미래=강화학습×딥러닝

|

osaro_160204_1

컴퓨터가 프로 바둑 기사에 승리한 게 화제가 되는 등 최근 인공지능 기술이 눈부신 발전을 거듭하고 있다. 이런 인공지능을 한 걸음 더 발전시키려면 필요한 건 뭘까.

지난 몇 년 동안 인공지능 개발 연구에 종사한 과학자들은 컴퓨터가 스스로 음성과 이미지를 인식할 수 있도록 하기 위해 딥러닝을 이용해 컴퓨터에 다양한 정보를 학습시켜왔다. 이미 컴퓨터의 이미지와 음성 인식 기능은 상당 수준까지 진화했고 이런 기능은 앞으로도 더 개선될 게 분명하다. 또 지금까지 알고리즘이나 기초 연구 중 겪은 난제 대부분은 거의 해명이 된 상태라고 한다.

지난해 인공지능 기술 분야에서 주목할 만한 건 구글과 페이스북이 2가지 돌파구가 될 만한 새로운 제품을 각각 선보였다는 것이다. 페이스북이 선보인 혁신적인 기술은 가을 발표한 인공지능 알고리즘인 메모리 네트웍스(Memory Networks)로 아기처럼 컴퓨터가 학습하는 걸 도와준다. 구글이 공개한 건 페이스북과는 다른 방법으로 컴퓨터를 학습시키는 기술로 상황이나 문제에 따라 시간과 기억을 추가할 수 있다.

Smart_Reply_151105_2

구글은 인공지능 기술을 자사 번역 도구에도 적용하고 있다. 또 G메일 인박스에도 스마트 답장(Smart Reply) 기능을 적용한 바 있다. 스마트 응답은 G메일에서 사용할 수 있는 기능으로 수신 메일 텍스트를 분석해 이에 따라 3가지 회신을 제시한다.

산업용 로봇을 위한 기계 학습 소프트웨어를 개발하는 오사로(Osaro)도 지난해 말 실리콘밸리의 유명 투자자와 야후 설립자 제리양 등으로부터 330만 달러에 달하는 자금을 조달하는 데 성공해 화제를 모으기도 했다. 오사로는 강화학습(reinforcement learning)과 이와 비슷한 큐러닝(Q-learning)을 결합한 새로운 방식을 이용해 연구에서 제품 수준까지 발전시키기 위한 개발을 진행 중이다. 컴퓨터에는 명확한 정책이 필요하지만 과거에는 확장성이 없는 정책이었다. 이에 비해 오사로는 강화학습을 이용해 컴퓨터가 완벽하게 작동하기 위한 학습을 시킨다. 구글이 인수한 딥마인드 역시 이런 강화학습을 사용한 가장 유명한 사례 가운데 하나인 DQN(Deep Q-network)을 개발하고 있다. DQN은 인간이 손을 대지 않아도 자동으로 학습을 반복해 간단한 게임 등에서 높은 점수를 스스로 터득하게 되는 것이다. 컴퓨터가 스스로 게임을 익히는 것이다.

tesla_150903_1

이런 연구는 지금까지 연구 개발 수준을 벗어날 수 없는 수준이었다. 물론 여전히 그렇다. 하지만 오사로는 연구 개발을 뛰어넘어 로봇이 상황을 인식하고 이 정보를 바탕으로 동작하는 데 필요한 학습 제공 시스템 구축 계획을 세우고 있다. 오사로가 제품화를 위해 개발하는 소프트웨어는 이론적으론 로봇이 작업을 배울 수 있다. 학습한 지식을 환경에 매개변수로 적용해 사용할 수 있게 해주는 것. 이 기술의 관건은 매개변수가 미리 프로그래밍된 게 아니라 학습시킬 수 있다는 것이다. 이를 통해 로봇이 자동으로 최적화를 하는 것이다.

딥마인드의 DQN은 무작위로 게임을 진행, 학습을 시킨다. 하지만 현실에서 이렇게 하면 막대한 시간과 비용이 필요하다. 오사로는 이런 이유로 컴퓨터의 학습 과정을 지원하기 위해 알고리즘을 인간을 모방하는 걸 통해 만든다. 오사로 뿐 아니라 미국 워싱턴대학 역시 비슷하게 어린아이처럼 학습하는 로봇을 발표하기도 했다. 전문가들은 강화학습은 인공지능 분야의 최전선에 위치하고 있다면서 강화학습이 바로 빈약한 인공지능을 강력하게 만들어줄 것이라고 말한다. 강화학습과 딥러닝을 곱하는 게 차세대 인공지능 탄생의 열쇠라는 얘기다. 관련 내용은 이곳에서 확인할 수 있다.

태그 : , , , , , ,

카테고리 : TREND

glasspad

About the Author:

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷, 컨슈머저널 이버즈 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

웹사이트 | 페이지

Filed in: TREND
×