카카오는 자체 기술력을 기반으로 개발한 차세대 인공지능(AI) 언어모델 '카나나-2'를 업데이트하고 4종의 모델을 오픈소스로 추가 공개했다고 20일 밝혔다.
카나나-2는 지난해 12월 허깅페이스를 통해 오픈소스로 공개한 언어모델이다. 에이전틱 AI 구현에 최적화됐다.
이번에 공개한 4종의 모델은 고효율과 저비용이라는 장점에 더해 실질적인 에이전틱 AI의 구현을 위한 도구 호출(tool calling) 능력을 강화한 것이 특징이다. 최신 초고가 인프라가 아닌 엔비디아 A100 수준의 범용 그래픽처리장치(GPU) 에서도 원활하게 구동되도록 최적화해 중소기업과 학계 연구자들도 비용 부담없이 고성능 AI를 활용할 수 있도록 실용성을 높였다.
효율성의 핵심은 '전문가 혼합'(MoE) 구조다. 전체 파라미터는 32B(320억개) 규모로 거대 모델의 높은 지능을 유지하면서도, 실제 추론 시에는 상황에 맞는 3B(30억개)의 파라미터만 활성화해 연산 효율을 획기적으로 높였다.
또한 MoE 모델의 학습에 필수적인 여러 커널을 직접 개발해 성능 손실 없이 학습 속도는 높이고, 메모리 사용량은 획기적으로 낮추는 성과를 냈다.
이러한 아키텍처 및 데이터의 고도화 뿐 아니라 데이터 학습 단계도 고도화했다. 사전 학습과 사후 학습 사이에 미드 트레이닝 단계를 신설하고, AI 모델이 새로운 정보를 배울 때 기존 지식을 잊는 치명적 망각 현상을 방지하기 위해 리플레이 기법을 도입했다. 이를 통해 새로운 추론 능력을 추가하면서도 기존 한국어 구사와 일반 상식 능력을 안정적으로 유지할 수 있었다.
카카오는 이러한 기술을 바탕으로 △기본(Base) 모델부터 △지시 이행(Instruct) 모델 △추론 특화(Thinking) 모델 △미드 트레이닝(Mid-training) 모델까지 총 4종의 모델을 허깅페이스에 추가로 공개했다. 연구 목적으로 활용도가 높은 미드 트레이닝 탐색용 기본 모델을 함께 제공해 오픈소스 생태계 기여도를 높였다.
새로운 카나나-2 모델의 또 다른 차별점은 단순 대화형 AI를 넘어 실질적인 업무 수행이 가능한 에이전트 AI 구현에 특화됐다는 점이다.
고품질 멀티턴(multi-turn) 도구 호출 데이터를 집중 학습시켜 지시 이행과 도구 호출 능력을 대폭 강화함으로써 복잡한 사용자 지시를 정확히 이해하고 적절한 도구를 스스로 선택 및 호출할 수 있도록 했다.
이미선 기자 already@dt.co.kr
실시간 주요뉴스
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0