국내 신생기업(스타트업)들과 KT가 공동 개발한 수학에 특화된 인공지능(AI)이 세계 최고의 대화형 AI로 꼽히는 오픈AI의 'GPT'와 마이크로소프트(MS)의 AI를 눌렀다.
AI 개발업체 업스테이지와 온라인 수학 문제풀이 서비스 '콴다'를 운영하는 매스프레소, KT 등 3사는 8일 자체 개발한 '매스GPT'가 세계 AI 성능 평가에서 오픈AI와 MS의 AI를 제치고 1위에 올랐다고 밝혔다. 3사에 따르면 매스GPT는 1만2,500개의 고난도 수학 경시 문제를 푸는 '매스', 8,500개의 초등학교 수학 문제로 실력을 겨루는 'GSM8K' 등에서 MS의 'ToRA 13B', 오픈AI의 'GPT-4.0'을 뛰어 넘어 1위를 차지했다.
그동안 오픈AI의 챗GPT 등은 언어 영역에서 뛰어난 능력을 발휘했으나 수학 분야에서는 환각 오류 때문에 제 기능을 발휘하지 못했다. 환각 오류는 잘못된 자료로 학습해 거짓 정보를 사실처럼 제시하는 것을 말한다. 정확한 답을 요구하는 수학에서 환각 오류는 치명적이다.
매스프레소는 매스GPT의 환각 오류를 없애기 위해 매일 1,000만 건의 수학 문제 풀이를 학습용으로 제공했다. 업스테이지는 이를 자연어 기반의 언어 모델이 논리적 추론을 통해 수학 문제를 풀 수 있도록 학습시켰다. KT는 여기 필요한 비용과 시설을 투자했다.
매스프레소는 매스GPT의 성능을 계속 향상시켜 AI 보조 교사로 활용할 계획이다. 이용재 매스프레소 대표는 "3사의 기술력과 경험이 합쳐져 세계적인 기술 기업들을 뛰어넘는 결과를 냈다"며 "매스GPT를 서비스에 접목해 전 세계 학생들의 교육을 혁신할 것"이라고 강조했다. 김성훈 업스테이지 대표도 "챗GPT를 뛰어넘는 수학 AI를 개발해 뜻 깊다"며 "다양한 분야에서 생성형 AI로 혁신을 주도할 것"이라고 덧붙였다.
2015년 설립된 매스프레소는 모르는 수학 문제를 앱으로 사진찍어 올리면 광학문자판독(OCR) 기술을 이용해 5초 안에 문제 풀이를 제공하는 콴다 서비스를 제공한다. 콴다는 전세계 누적 가입자가 9,000만 명에 이르며 월 1,000만 명이 이용한다.
2020년 설립된 업스테이지는 AI 성능 평가를 위한 허깅페이스 리더보드에서 1위를 차지하며 두각을 나타낸 AI 개발업체다. 이들이 개발한 대화형 AI '애스크업'은 140만 명이 이용하고 있다.
관련 이슈태그
기사 URL이 복사되었습니다.
댓글0