카카오, 국내 최고 성능 AI 모델 오픈소스 공개로 기술 우위 과시

카나나-v와 국내외 AI 모델의 성능을 비교한 표 / 사진 카카오

(콕스뉴스 김영수 기자) 카카오는 24일 국내 공개 모델 중 최고 성능을 자랑하는 경량 멀티모달 언어모델과 MoE(전문가 혼합) 모델을 오픈소스로 공개하며, 구글과 오픈AI가 주도하는 글로벌 AI 시장에 정면 도전장을 내밀었다.

이번 발표는 미국 빅테크 기업들의 AI 독점에 맞서는 한국 기업의 기술 자립 의지를 보여주는 상징적 사건으로 평가된다. 정신아 카카오 대표가 이끄는 카카오는 허깅페이스를 통해 '카나나(Kanana)-1.5-v-3b' 멀티모달 모델과 'Kanana-1.5-15.7b-a3b' MoE 모델을 동시 공개했다.

카나나-v와 국내외 AI 모델의 성능을 비교한 표 / 사진 카카오

특히 주목할 점은 카카오가 이들 모델을 '프롬 스크래치(처음부터)' 방식으로 자체 개발했다는 사실이다. 이는 해외 기술에 의존하지 않는 순수 국산 기술의 결실로, 정부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'의 핵심 성과로 볼 수 있다.

글로벌 거대 모델에 도전하는 경량화 혁신

'Kanana-1.5-v-3b'는 이미지와 텍스트를 동시에 처리하는 멀티모달 AI로, 경량 모델임에도 불구하고 오픈AI의 GPT-4o와 견줄 만한 한국어·영어 문서 이해 능력을 보인다고 카카오 측은 주장했다. 한국어 벤치마크에서는 유사 규모의 국내외 공개 모델을 압도하는 최고 점수를 기록했으며, 지시 이행 능력에서는 국내 경쟁 모델 대비 128% 수준의 성능을 달성했다.

카나나가 제시된 이미지를 본 후 이를 정확히 '청계천'이라고 판독해 응대하는 모습 / 사진 카카오

이 모델은 청계천 사진을 보고 '서울 청계천'이라고 정확히 인식하는 등 국내 문화유산과 관광지에 대한 뛰어난 이해력을 보여준다. 이는 한국 시장에 특화된 AI 서비스 개발에 있어 외국 모델 대비 확실한 경쟁우위를 의미한다.

비용 효율성으로 무장한 MoE 기술 도입

카카오의 또 다른 무기는 MoE 아키텍처를 적용한 'Kanana-1.5-15.7b-a3b' 모델이다. 전체 15.7B 파라미터 중 추론 시 단 3B만 활성화되어 동작하는 이 모델은, 8B 모델과 동등하거나 더 나은 성능을 보이면서도 컴퓨팅 비용은 크게 절약한다.

이는 막대한 인프라 비용으로 중소기업과 스타트업의 AI 도입을 가로막는 현실에 대한 카카오의 해답으로 해석된다. MoE 기술은 구글, 메타 등 글로벌 빅테크들이 주목하는 차세대 AI 개발 트렌드로, 카카오가 이 분야에서 선제적 성과를 거둔 것은 의미가 크다.

아파치 2.0 라이센스로 상업적 활용까지 허용

카카오는 이번 모델들에 아파치 2.0 라이센스를 적용해 연구자와 스타트업들이 상업적으로도 자유롭게 활용할 수 있도록 했다. 이는 오픈AI가 상업적 이용에 제한을 두는 것과 대조적인 전략이다.

김병학 카카오 카나나 성과리더는 "이번 성과는 비용 효율성과 성능이라는 두 마리 토끼를 잡은 것으로, 서비스 적용과 기술 자립이라는 목표에 부합하는 결과"라고 강조했다.

카카오는 하반기 중 에이전트형 AI 구현에 필수적인 추론 모델도 공개할 예정이라고 밝혔다. 지난 5월 첫 오픈소스 공개 이후 두 달 만에 추가 모델을 선보인 카카오의 행보는 국내 AI 생태계의 기술 자립과 글로벌 경쟁력 강화에 새로운 전환점이 될 것으로 전망된다.