오픈AI와 구글의 인공지능(AI) 기술 선두 경쟁이 이미지 생성 영역에서도 재점화됐다. 최근 GPT-5.2 출시에 이어 새로운 이미지 생성 모델도 내놓으며 오픈AI가 추격의 고삐를 죄는 모습이다.
오픈AI는 새로운 이미지 생성 모델인 ‘GPT 이미지 1.5’와 이를 기반으로 한 챗GPT 이미지 서비스를 선보인다고 16일(현지시간) 밝혔다. 지난 11일 출시한 플래그십 모델인 GPT-5.2는 이전 버전(GPT-5.1)으로부터 한 달 만에 나왔지만, 이미지 생성 모델은 이전 버전(GPT 이미지 1)으로부터 8개월만에 업그레이드했다.
오픈AI에 따르면 GPT 이미지 1.5는 이미지 생성 속도가 최대 4배 더 빨라졌고, 사용자 지시사항을 이전보다 훨씬 더 안정적으로 따른다. 텍스트 렌더링도 발전해 더 촘촘하고 작은 텍스트도 처리할 수 있고, 다수의 작은 얼굴을 렌더링하는 능력과 결과물을 자연스럽게 만드는 측면에서도 개선됐다.
특히, 새로운 이미지를 만들거나 기존 사진을 편집할 때 원하는 결과에 더 가까운 결과물을 얻을 수 있게 해준다고 회사는 강조했다. 구글의 이미지 생성 AI ‘나노 바나나’의 성공에 자극받음 셈이다. 지난 8월 구글이 이를 처음 냈을 때 가장 호평받은 부분이 인물·피사체 등 일관성을 유지하며 정교한 수정을 이어갈 수 있는 점이었다.
오픈AI는 조명, 구도, 인물 외형 같은 핵심요소를 그대로 유지하면서 사용자가 요청한 부분만 정확히 변경할 수 있고, 이에 따라 실용적인 사진 편집, 현실감 있는 의상 및 헤어스타일 시뮬레이션, 원본의 이미지는 유지하는 스타일 필터 적용이 가능해졌다고 설명했다. 텍스트와 레이아웃 등 요소를 변경하거나 추가해 아이디어를 생동감 있게 구현하는 변환 기능에도 이를반영했다.
이런 개선을 통해 챗GPT가 실용적인 편집과 표현력 있는 재해석을 모두 수행할 수 있는 ‘주머니 속 크리에이티브 스튜디오’로 작동하게 될 것으로 회사는 기대한다. 챗GPT 메뉴에 전용 공간을 마련해 사용자들이 보다 간편하게 이미지 생성을 할 수 있게 했다. 또 업무 현장에서도 빠른 이미지 생성, 정밀한 편집, 반복작업 전반에 걸친 일관된 시각적 디테일 유지를 통해 보다 효율적인 작업을 지원한다고 부연했다.
오픈AI의 새 이미지 생성 AI 출시는 구글이 ‘나노바나나 프로’로 업그레이드한지 불과 26일 만이다. 당초 내년 1월 초 출시 예정이었으나, 구글 ‘제미나이 3 프로’의 선전으로 오픈AI 사내에 코드레드(중대경보)가 발령하면서 GPT-5.2와 함께 출시가 앞당겨진 것이다. 앞서 출시된 GPT-5.2는 제미나이 3 프로에 비해 뚜렷한 우위를 보이진 못하는 것으로 평가된다. 오픈AI는 이번 이미지 생성 AI 출시에도 코드레드를 여전히 유지 중인 것으로 전해졌다.
팽동현 기자(dhp@dt.co.kr)실시간 주요뉴스
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0