네이버가 자사의 인공지능(AI) 거대언어모델(LLM)인 '하이퍼클로바X'에 대한 기술 보고서를 4일 공개했다.
보고서에 따르면 하이퍼클로바X는 한국어, 일반 상식, 수학, 코딩 등 14개 모델을 비교·평가한 결과 종합 1위를 기록했다. 특히 한국어 능력에서는 세계 최고 수준 모델들을 제치고 1위에 올랐다.
하이퍼클로바X는 한국어, 영어, 코드 데이터 위주로 사전 학습을 진행했으며, 짧거나 반복적인 저품질 문서와 개인정보가 포함된 데이터는 제외했다.
보고서는 하이퍼클로바X의 '다국어 능력'을 주요 특징으로 강조했다. 모델이 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖추고 있다는 것이다.
실제로 한국어-일본어, 영어-한국어 간 기계번역 정확도 평가에서 하이퍼클로바X가 최고 수준을 보였다.
네이버클라우드 측은 "하이퍼클로바X가 특정 문화권 지식과 다국어 능력을 두루 갖춰 활용도 높은 '소버린 AI'의 가능성을 열었다"며 "프로그래밍, 수학 추론, 안전성 등도 확보한 모범 사례"라고 설명했다.
