추론 능력 갖춘 'o1' 챗GPT에 추가
사람처럼 단계적으로 논리적 사고
국제수학올림피아드 정답률 83%
"줭뫌 쉬끄뤕꼬 더뤄웧욯."(정말 시끄럽고 더러워요.)
해외 숙소 후기를 찾다 보면 가끔 이런 식으로 남긴 글들이 있다. 다른 한국인들이 참고할 수 있도록 악평을 남기고 싶은데, 행여 숙소 운영진이 번역기를 이용해 읽고 삭제할 수도 있으니 번역이 불가능하게끔 일부러 틀린 맞춤법으로 작성한 것이다. 실제로 이 문장을 구글 번역기 등에 넣어보면 전혀 엉뚱한 의미의 결과값이 나온다.
그러나 앞으로는 이 같은 기지가 통하지 않을 것 같다. 생성형 인공지능(AI) 챗GPT 개발사 오픈AI가 '외계 한국어'마저 제대로 해석해내는 AI 모델 '오픈AI o1'(오원·이하 o1)을 내놨기 때문이다. 12일(현지시간)부터 챗GPT 유료 버전에 추가된 o1은 "응답 전에 더 많은 시간을 들여 생각하도록 설계돼 과학과 코딩, 수학 등 분야에서 이전 모델보다 더 어려운 문제를 해결할 수 있다"고 오픈AI는 설명했다.
o1이 적용된 챗GPT에 '줭뫌 쉬끄뤕꼬 더뤄웧욯'을 영어로 해석해 달라고 주문해 봤다. 챗GPT는 이렇게 답했다. "영어로 다음과 같이 번역됩니다: It's really noisy and dirty."
사람처럼... '아차, 실수!' 스스로 인식
오픈AI가 이날 전격 공개한 o1은 '추론' 능력 향상에 초점을 맞춰 개발해 온 제품이다. 기존 AI 모델들은 방대한 양의 데이터를 학습하고, 학습해서 알고 있는 내용 가운데 최적의 답을 골라 제시한다. 학습하지 않은 것에 대해 질문하면 모른다고 답하거나, 사실이 아닌 내용을 지어내는 결함(환각)을 보였다. 반면 추론 특화 모델은 학습하지 않은 문제가 주어지더라도 이미 알고 있는 것을 바탕으로 스스로 답을 찾아 나간다. "o1은 사람처럼 스스로의 사고 과정을 개선하고, 다양한 전략을 시도하고, 실수를 인식한다"고 오픈AI는 설명했다.
추론 능력을 얻은 AI는 수학이나 코딩, 물리학처럼 단계별 논리적 사고가 필요한 영역에서 특히 다른 모델 대비 월등한 성능을 낸다고 한다. 오픈AI에 따르면 지난 5월 공개된 최신 AI 모델 GPT-4o가 국제수학올림피아드(IMO) 예선에서 13%의 정답률을 보인 반면, 추론 모델인 o1은 무려 83%를 기록했다고 한다.
이날 오픈AI가 공개한 외계 한국어 번역 시연을 보면 o1은 주어진 이상한 문장을 일단 제대로 된 말로 고쳐 읽은 다음, 뜻을 해석하고, 번역을 더 자연스럽게 바꾸는 과정을 거친다. 사람의 사고 방식과 거의 비슷한 순서로 작동하는 셈이다.
답변까지 시간 오래 걸려... 한계도 뚜렷
최근 AI 업계에선 추론 능력 고도화 경쟁이 치열하게 벌어지고 있다. 오픈AI의 최대 경쟁사인 구글의 AI 조직 딥마인드도 지난 7월 수학 추론을 전문으로 하는 모델(알파프루프)과 기하학 문제 해결에 초점을 맞춘 모델(알파지오메트리 2)을 공개했다. 이 두 모델은 올해 IMO에서 2등에 해당하는 우수한 성적을 냈다고 구글은 밝혔다.
AI의 추론 능력이 강화되고 있다는 것은 진짜 사람이 사고하는 방식에 가까워지고 있다는 것을 뜻한다.
다만 아직은 한계도 뚜렷하다. o1의 경우 답변을 내놓기까지 시간이 오래 걸리고, 지금은 '글'만 인식할 수 있다. 또 온라인상 실시간 정보를 익히지 못하기 때문에 최신 정보와 관련된 질문에는 정확한 답을 내놓을 수 없다.
관련 이슈태그
기사 URL이 복사되었습니다.
댓글0