딥러닝(deep learning)이라는 말을 들어본 적 있는가? 최근 인공지능에 대한 관심이 높아지면서, 그 핵심기술로 자주 언급되는 딥러닝은 다량의 데이터 속에서 핵심적인 내용 또 는 기능을 요약하는 기계학습(machine learning)의 일종이다. 인간의 사고방식이나 뇌가 동작하는 방식과 유사하게 컴퓨터의 심화신경망(Deep Neural Network)을 활용한 기계학습을 말하는 것으로, 과거에는 속도가 느리고 과적합(overfitting) 문제 때문에 크게 활용이 되지 못했다. 그런데 최근 들어 데이터의 양이 많아지고, 심화신경망을 처리할 수 있는 GPU 하드웨어의 발전, 과거 문제가 되었던 기술적인 난제가 상당 부분 해결되면서 전 세계 내로라하는 기업들이 총력을 기울이고 있는 기술 분야가 되고 있다.
다양한 종류의 데이터를 컴퓨터가 이해할 수 있는 형태로 바꾸고, 이를 학습하는 다양한 연구가 진행 중에 있는데, 특히 컴퓨터 비전, 음성인식, 자연어처리, 음성/신호처리 등의 분야에서 좋은 성과가 나오고 있다. 잘 알려진 프로젝트로는 스탠포드 대학의 앤드류 응(Andrew Ng)과 구글이 유튜브에 업로드 되어 있는 천만 개가 넘는 비디오 중 고양이 얼굴 인식에 성공한 소프트웨어 프레임워크가 있다. 이후 영상 인식 분야에서는 이미 컴퓨터가 인간의 능력을 넘어서는 결과를 보여주는 사례들도 종종 발표되고 있다.
딥러닝이 가장 보편적으로 활용되고 있는 분야는 데이터의 양이 많고, 높은 정확성을 요구하는 분야다. 음성 인식과 영상 인식 분야가 각광받는 것도 그런 이유다. 구글과 페이스북, 마이크로소프트, 중국의 바이두 등 글로벌 IT기업들이 총력을 기울여서 기술 개발을 하고 있는데, 페이스북은 딥러닝을 적용해 딥페이스라는 얼굴 인식 알고리즘을 개발하기도 했다. 인식 정확도는 97.25%로 인간의 평균치(97.53%)와 거의 차이가 없다. 또한, 현재 모든 주요 상업 음성인식 시스템(마이크로소프트의 코타나, 스카이프 번역기, 구글 나우, 애플 시리 등)도 딥러닝 기법에 기반해서 학습을 하고 있다.
국내에서도 그 활용도가 점점 높아지고 있다. 네이버에서 음성 인식을 비롯해 뉴스요약, 이미지 분석 등에 딥러닝을 적용하고 있는데, 음성 인식의 오류 확률도 25%나 개선했으며, 그 적용 분야도 넓히고 있다. 또한, 야후의 썸리와 같은 뉴스 요약 서비스에도 딥러닝을 적 용해 실험하고 있다. 기사에 제목이 있을 경우와 없을 경우를 분리해 기사를 정확히 요약해낼 수 있는 알고리즘도 개발되고 있다. 이미지 분석 또한 구글 포토와 유사하게 자동으로 이미지를 분류하고 연결시켜 주는 서비스가 네이버에서도 가능해지고 있다. 필자가 관여하고 있는 러닛 (Lunit Inc.)의 경우에는 의학 영상의 판독 분야에 딥러닝을 적용하고 있는데, 아직 초기의 성과지만 이미 영상의학과 의사들의 판독수준에 육박할 정도로 빠르게 성능이 개선되고 있어서, 향후 새로운 의학영상 기술로 자리를 잡을 수 있을 것으로 기대된다.
그 밖에도 제약산업 분야에서는 신약의 효능을 예측하거나 부작용을 미리 탐지하는 기법 등의 다양한 약물발견 딥러닝 기술이 최근 시도되고 있다. 또한 마케팅 기획이나 고객관리 자동화에 접목하여 상업적 성공도 꾀할 수 있는데, 아마존 등의 커머스 업계에서는 딥러닝을 이용한 추천과 고객관리 등에도 많은 투자를 하고 있다.
최근 각광받고 있는 사물인터넷(Internet of Things, 이하 IoT)의 시대가 열리는 것도 딥러닝의 중요성을 점점 부각시킬 것이다. IoT는 필연적으로 많은 양의 데이터를 생산하게 되어 있고, 이런 데이터에서 의미 있는 정보를 뽑아내고 이를 바탕으로 더 나은 비즈니스의 기회를 확보하거나, 고객경험을 증진 시키거나, 가치를 창출하기 위해서 딥러닝이 할 수 있는 일이 많을 것이다. 딥러닝은 이제 굉장히 어려운 기술이 아니라 미래의 IT세상의 필수기술이 되어가고 있다.
경희사이버대학교 모바일융합학과 교수
정지훈 '미래기술 이야기' ▶ 시리즈 모아보기
기사 URL이 복사되었습니다.
댓글0