AI 코딩 및 에이전트 관련 성능 향상
오픈AI 라이벌로 꼽히는 앤스로픽은 자사 인공지능(AI) '클로드'의 중형 주력모델인 '소네트'의 새로운 4.6버전을 출시했다고 17일(이하 현지시간) 밝혔다.
지난 5일 클로드 최상위 모델인 '오퍼스'의 4.6버전을 내놓은 지 약 2주 만이자, 소네트 모델의 4개월 주기 업데이트 행보를 이어갔다.
클로드 웹서비스와 협업모드 '클로드 코워크' 등에선 이제 무료 이용자 및 프로 구독자 대상으로 클로드 소네트 4.6이 기본모델로 제공된다.
클로드 소네트 4.6은 100만 토큰의 컨텍스트창을 제공하며 코딩, 컴퓨터 사용, 장문 텍스트 추론, 에이전트 플래닝, 지식 업무, 디자인 등 전 영역에 걸쳐 기능이 전면 업그레이드됐다. 역대 가장 강력한 소네트 모델로서 오퍼스 수준의 지능에 근접하는 성능을 합리적인 가격에 제공한다고 회사는 소개했다.
응용프로그램인터페이스(API) 가격정책을 이전과 동일하게 100만 토큰 입력당 3달러, 출력당 15달러로 유지했다.
앤스로픽에 따르면 기존에는 오퍼스급 모델이 필요했던 실제 업무환경에서의 성능을 이제 소네트 4.6으로 구현할 수 있다. 특히 AI 에이전트가 사람의 방식으로 컴퓨터로 작업을 수행하는 능력을 측정하는 'OS월드 베리파이드' 벤치마크에서 72.5%을 기록, 오퍼스 4.6(72.7%) 수준에 이르며 경쟁모델들을 앞섰다. 재무 분석 능력을 재는 '파이낸셜 에이전트 v1.1' 지표와 사무업무 능력 지표인 'GDPval-AA Elo'에선 오퍼스 4.6마저 능가했다. 또한 코딩 능력을 보여주는 'SWE-벤치 베리파이드' 벤치마크에서도 오퍼스 4.6(80.8%)에 근접한 79.6%를 기록했다.
얼리액세스 개발자들이 전작인 소네트 4.5는 물론이고 오퍼스 4.5보다도 소네트 4.6을 선호하는 경우도 많았다는 게 회사의 설명이다. 코딩 어시스턴트인 '클로드 코드'를 통해서도 전작 대비 과도한 엔지니어링과 게으른 응답이 크게 줄었고 지시이행 능력도 향상된 것으로 평가됐다.
팽동현 기자 dhp@dt.co.kr
실시간 주요뉴스
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0