디지털타임스

 


"전문가 언어능력 능가한다"...구글, GPT_4 대항마 `제미나이` 공개

프린트 페이스북 트위터 카카오스토리
텍스트·이미지·음성·영상 동시에 이해하고 생성하는 '멀티모달 AI'
"대규모 다중작업 언어 이해 점수 90% 얻어…사람 넘은 첫 모델"
"전문가 언어능력 능가한다"...구글, GPT_4 대항마 `제미나이` 공개
"인간 전문가를 뛰어넘은 최초의 AI(인공지능) 모델이자 구글이 개발한 가장 포괄적이고 뛰어난 AI다."

구글이 6일(현지시간) 현존 최고의 성능을 보유하고 언어능력에서 사람까지 뛰어넘는 생성형AI '제미나이(Gemini)'를 공개했다.

제미나이는 오픈AI 챗GPT의 LLM(대규모언어모델)인 'GPT'와 비교되는 모델로, 오픈AI의 최신 'GPT-4'보다 성능이 우수하다는 평가를 받는다. 또 이미지와 음성, 코딩, 영상 등을 함께 이해하고 생성할 수 있는 '멀티모달' 능력을 갖췄다. 다양한 모드 즉 시각, 청각 등을 활용해 텍스트뿐 아니라 이미지, 음성, 영상 등으로 상호작용할 수 있음을 의미한다.

제미나이는 수학 문제를 풀거나 데이터를 분석하는 추론 능력도 구현했다. 구글은 제미나이를 머신러닝(기계학습) 규모에 따라 울트라, 프로, 나노 3개 모델로 내놨다.

가장 범용으로 쓰이는 '제미나이 프로'는 이날부터 구글의 AI 챗봇 서비스인 '바드'에 탑재돼 서비스가 시작됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공된다. 앞으로 지역과 언어를 확장해 나갈 예정이다.

가장 크고 고성능인 '제미나이 울트라'는 내년 초 '바드 어드밴스트'라는 이름으로 바드에 탑재된다. '제미나이 나노'는 클라우드 연결 없이 디바이스에 탑재되는 온디바이스 형태다. 구글이 지난 10월 공개한 스마트폰 '픽셀8 프로'에 탑재된다.


구글은 제미나이 울트라의 경우 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다고 밝혔다. MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다. 이는 인간 전문가 점수인 89.8%를 넘은 최초의 기록으로, 오픈AI의 GPT-4가 기록한 86.4%보다 앞선다는 설명이다.
구글은 "현재 가장 우수한 모델과 비교해 32개 지표 중 30개에서 앞섰다. 현재까지 성능이 가장 우수하다고 평가되는 GPT-4보다 뛰어나다"고 강조했다.

제미나이는 구글이 자체 개발한 AI 칩(TPU v4·v5e)으로 학습했다. 구글은 최첨단 AI 모델을 학습시키기 위해 설계한 최신 칩인 '클라우드 TPU v5p'도 공개했다.

순다르 피차이 구글 CEO는 "제미나이 1.0은 구글 딥마인드의 비전을 처음으로 실현했다. 구글이 개발한 가장 포괄적이고 뛰어난 AI 모델"이라고 밝혔다.

구글은 지난 4월 AI 조직인 구글브레인과 딥마인드를 구글 딥마인드로 통합하고 챗GPT를 뛰어넘는 제미나이 개발에 사활을 걸어왔다. '알파고' 프로젝트를 이끈 데미스 허사비스가 개발을 주도한다. 안경애기자 naturean@dt.co.kr


[ 저작권자 ⓒ디지털타임스, 무단 전재 및 재배포 금지 ]