경제산업 / Economy
2025년 이전 게시판 보기

네이버클라우드, 현실형 AI 에이전트 시대 겨냥 ‘옴니모달 하이퍼클로바X’ 공개

텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 HyperCLOVA X SEED 8B Omni 작동 장면을 표현하는 이미지 / 사진 네이버클라우드
텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 HyperCLOVA X SEED 8B Omni 작동 장면을 표현하는 이미지 / 사진 네이버클라우드
텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 HyperCLOVA X SEED 8B Omni 작동 장면을 표현하는 이미지 / 사진 네이버클라우드 텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 HyperCLOVA X SEED 8B Omni 작동 장면을 표현하는 이미지 / 사진 네이버클라우드

네이버클라우드가 텍스트·이미지·음성·추론을 하나의 구조로 통합한 ‘옴니모달 파운데이션 모델’을 공개하며, 현실 세계를 이해하고 행동하는 차세대 AI 에이전트 구현 경쟁에 본격 합류했다. 단순 성능 경쟁이 아닌 데이터 차별화와 단계적 확장, 산업 특화 모델 전략을 통해 ‘실제로 쓰이는 AI’ 생태계를 구축하겠다는 구상이다.

네이버클라우드는 과학기술정보통신부의 ‘독자 AI 파운데이션 모델’ 프로젝트의 일환으로 개발 중인 ‘옴니 파운데이션 모델’의 첫 성과로 ‘HyperCLOVA X SEED 8B Omni’와 ‘HyperCLOVA X SEED 32B Think’를 오픈소스로 공개했다고 29일 밝혔다.

‘8B Omni’는 텍스트·이미지·오디오를 하나의 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조를 적용한 국내 최초 모델이다. 서로 다른 정보 형식을 하나의 의미 공간에서 통합 이해함으로써 현실 환경에서의 맥락 인식 능력을 강화한 것이 특징이다. 텍스트 지시를 기반으로 이미지를 생성·편집하는 기능도 갖춰 글로벌 선두 모델들과 유사한 멀티모달 생성 역량을 확보했다는 평가다.

네이버클라우드는 옴니모달 AI 경쟁력의 핵심을 ‘데이터’로 보고 있다. 기존 디지털 문서 중심이 아닌 생활 맥락, 지역 공간 정보 등 현실 세계 데이터를 확보·정제해 차별화된 학습 자산을 구축하겠다는 전략이다. 이를 바탕으로 단계적으로 모델 규모를 확장하고, 산업과 서비스에 맞춘 특화 모델을 효율적으로 생산한다는 구상이다.

함께 공개된 ‘32B Think’는 추론형 AI에 시각 이해, 음성 대화, 도구 활용 능력을 결합한 옴니모달 에이전트형 모델이다. 글로벌 벤치마크 평가에서 주요 해외 모델들과 유사한 성능 범위에 위치했으며, 한국어 지식, 시각 이해, 에이전트 수행 능력 부문에서 강점을 보였다. 수능 문제 풀이에서도 주요 과목 1등급 수준의 성과를 기록했다.

성낙호 네이버클라우드 기술 총괄은 “AI의 감각과 사고를 동시에 확장할 때 현실 문제 해결력이 커진다”며 “기본기를 갖춘 구조 위에서 점진적 스케일업을 통해 실제로 쓰이는 AI를 만들어가겠다”고 말했다.

네이버클라우드는 이번 공개를 계기로 검색, 커머스, 콘텐츠, 공공, 산업 현장 전반으로 옴니모달 AI 에이전트를 확산시키며 ‘모두의 AI’ 생태계 구축에 속도를 낼 계획이다.

0 Comments

차량용 메탈 주차번호판 휴대폰번호판 블랙
칠성상회
차량용스티커 스티커 초보운전 이쁘게봐주세용 초보
칠성상회
스마토 압축분무기 투명 SM-BBS2.0 세차용 폼노즐 포함
칠성상회
이케아 MALA 몰라 휴대용 화판 드로잉케이스
바이플러스