프로기사 기보 3000만건 입력
‘몬테카를로 트리’ 탐색 기법 이용
3월에 이세돌9단과 100만불 대국
컴퓨터가 인간 한계 넘을지 관심
3월 중순 예정인 구글의 인공지능 컴퓨터 알파고와 세계 챔피언인 우리나라의 프로 바둑기사 이세돌 9단의 시합은 과연 누가 이길 것인가. 알파고를 개발한 구글 딥마인드는 알파고와 이세돌의 승률을 50 대 50으로 봤다.
알파고는 구글이 내놓은 100만달러의 상금을 걸고 이 9단과 5번의 대국을 갖는다. 이 9단에게 최적의 환경을 만들어 주기 위해 서울로 온다.
처음으로 인간과 컴퓨터의 바둑 대결에서 승리한 인공지능 컴퓨터 알파고를 개발한 구글의 자회사 구글 딥마인드의 공동 창업자이자 최고경영자(CEO)인 데미스 하사비스는 28일 영국 런던에서 영상회의 시스템을 이용해 서울 역삼동 구글코리아에 모인 국내 기자들과 영상 간담회를 가졌다. 하사비스는 “이 9단에게 승리할 가능성이 50 대 50”이라며 “만약 알파고가 질 경우 재도전도 생각해 볼 것”이라고 말했다.
알파고는 영국의 과학학술지 네이처에서 지난 27일 게재한 논문을 통해 유럽 바둑 챔피언인 중국의 프로 바둑기사 판 후이 2단을 5 대 0으로 이긴 사실이 알려져 파란을 일으켰다. 바둑은 우주 전체의 원자 수보다 많은 10의 170제곱이나 되는 경우의 수가 있기 때문에 도저히 컴퓨터가 이기기 힘든 인간의 영역으로 꼽혔다. 그러나 알파고가 한 수를 두는데 걸린 시간은 불과 3분이었다.
알파고의 승리 비결은 무엇일까. 알파고는 바둑의 확률을 수학적으로 계산하는 것이 불가능하기 때문에 무작위로 말을 대입해보며 예상 확률을 알아낸 뒤 가장 가능성이 높은 수를 선택하는 컴퓨터 기법인 ‘몬테카를로 트리탐색’을 바탕으로 했다.
여기에 구글은 두 개의 신경망을 결합했다. ‘정책망’은 상대방의 다음 움직임을 미리 예측해 이길 가능성이 높은 수만 고려하도록 해주고, ‘가치망’은 바둑돌의 위치 별로 승자가 누가 될지 예측한다.
특히 하사비스는 알파고를 개발하면서 프로 바둑기사들의 대국 기보 3,000만건을 입력시켰다. 이후 알파고가 입력된 기보를 바탕으로 쉬지 않고 바둑을 두며 배우도록 했다. 딥마인으드의 연구총괄 데이비드 실버는 “알파고가 1,000년에 해당하는 시간 만큼 바둑을 학습했다”고 말했다.
이를 통해 구글은 정책망의 예측 성공률을 57%까지 높였다. 알파고는 두 신경망을 동시에 활용해 경기를 진행하면서 경험을 쌓아 스스로 학습하고 전략을 짠다.
구글은 알파고를 계속 발전시켜 실생활에 적용하는 것이 목표다. 가장 활용 가능성이 높은 분야는 여행과 의료다. 예를 들어 스마트폰으로 여행 숙박을 예약할 경우 인공지능이 이용자가 기존에 묵었던 숙소 정보와 동선, 선호하는 관광지 등을 스스로 학습해 자동으로 추천하고 여행 일정까지 구체적으로 짜준다.
의료 분야에서는 인공지능 스스로 환자 몸에서 이상한 점을 발견한 뒤 다른 환자들의 진단 경험을 바탕으로 적절한 진단과 치료 계획을 수립할 수 있다. 하사비스는 “알파고는 스스로 학습하며 발전하기 때문에 바둑이라는 게임뿐 아니라 실생활 어디든 적용될 수 있다”며 “알파고가 사회의 난제들을 해결하는 데 쓰이기를 기대한다”고 말했다.
이서희기자 shlee@hankookilbo.com
기사 URL이 복사되었습니다.
댓글0