디지털타임스

 


[스타트업·혁신기업] LG AI연구원, AWS 이미지 캡셔닝 선봬… 텍스트서 이미지로 변환된다

프린트 페이스북 트위터 카카오스토리
생성형AI 혁신·확장 지원 기대
[스타트업·혁신기업] LG AI연구원, AWS 이미지 캡셔닝 선봬… 텍스트서 이미지로 변환된다
아마존 세이지메이커 점프스타트에 LG AI연구원의 이미지 텍스트 변환 솔루션이 업로드된 화면. AWS 제공



AWS(아마존웹서비스)와 LG AI연구원이 생성형 AI(인공지능) 협력을 강화한다. AWS 클라우드에서 지원하는 FM(기반모델) 중 하나로 LG AI연구원의 초거대AI '엑사원 2.0'을 추가하는 방안도 협의 중이다.

AWS는 미국 라스베이거스에서 진행 중인 자사 연례 기술 콘퍼런스 'AWS 리인벤트 2023'에서 LG AI연구원이 AWS 클라우드에 '엑사원' 기반 이미지-투-텍스트 캡셔닝 솔루션 출시를 발표했다고 29일(현지시간) 밝혔다. AWS 마켓플레이스와 '아마존 세이지메이커 점프스타트'를 통해 제공된다.

이화영 LG AI연구원 상무는 "다른 멀티모달 모델처럼 장황하게 설명하기보다는 용도와 목적에 맞게끔 정확하게 답을 할 수 있도록 최적화함으로써 효율성도 높이는 데 초점을 맞췄다"고 강점을 소개했다. 앞서 LG AI연구원은 지난 6월 캐나다 밴쿠버에서 열린 세계 최대 컴퓨터비전 학회 'CVPR(컴퓨터비전·패턴인식) 2023'에서 이 솔루션에 쓰인 '제로샷 이미지 캡셔닝' 기술을 발표한 바 있다. 제로샷 러닝 기술을 적용해 AI모델이 처음 인식하는 객체나 장면에 대해서도 이전에 학습한 대량의 데이터를 기반으로 이해하고 설명할 수 있도록 했다.

LG AI 연구원은 완전관리형 ML(머신러닝) 서비스 '아마존 세이지메이커'를 통해 3억5000만개의 고해상도 이미지와 텍스트 세트를 '엑사원' 모델에 학습시켰다. 이 상무는 "세이지메이커는 대용량 이미지를 학습시키기 편리하게 돼있다. 때문에 멀티모달 관련 연구원들의 경우 이미 이를 활용해본 상태였다"고 밝혔다. LG AI연구원은 자사 생성형AI 역량과 AWS 클라우드 기반으로 LG생활건강이 지난 8월 미니즉석 타투 프린터 '임프린투'를 출시할 수 있도록 지원한 데 이어, LG 계열사 가전 및 홈 엔터테인먼트 제품 개발 엔지니어들의 생산성을 높이기 위한 코드 생성AI도 선보인다. "라이선스 이슈를 해결하면서 각 사업 영역에 따라 필요로 하는 코드 생성을 훨씬 잘하게 했다"는 게 이 상무의 설명이다. C, C++, 자바스크립트, 파이썬을 지원하며 자바도 내년 추가된다.


나아가 LG AI연구원과 AWS는 완전관리형 생성형AI 서비스 '아마존 베드록'을 통해 AWS의 기업고객들이 LG AI연구원 '엑사원 2.0' 모델을 직접 이용할 수 있도록 하는 방안도 함께 검토하고 있다. '아마존 베드록'은 고객 선택권 보장을 기치로 삼아 아마존 타이탄뿐 아니라 메타 라마2, 앤트로픽 클로드2 등 파트너사들의 LLM(대규모언어모델)도 지원한다.
이 상무는 "이제 논의를 시작한 단계"라면서도 "AWS는 AI분야에서 모든 것을 장악하려 하지 않고 생태계 친화적이라 전략적 협업을 추진하게 됐다. AWS의 글로벌 네트워크를 활용해 B2B 고객이 보다 쉽게 접근할 수 있게 될 것으로 기대한다"고 말했다.

바시 필로민 AWS 생성형AI부문 부사장은 "콘텐츠 생성 산업이 급성장하는 가운데 LG AI연구원은 엑사원 플랫폼과 같은 기술이 AWS에 구축된 신속한 이미지-투-텍스트 캡션 솔루션을 활용해 어떻게 AI, 디자이너, 아티스트 간 협업을 촉진할 수 있는지 보여주고 있다"며 "전 세계에 새로운 차원의 창의성이 발휘될 수 있도록, 앞으로도 LG AI연구원의 생성형AI 혁신과 확장을 지원할 수 있기를 기대한다"고 했다.

라스베이거스(미국)=팽동현기자 dhp@dt.co.kr


[ 저작권자 ⓒ디지털타임스, 무단 전재 및 재배포 금지 ]