챗GPT가 ‘GPT 이미지 1.5’ 기반 이미지 생성을 지원한다. 오픈AI 제공
챗GPT가 ‘GPT 이미지 1.5’ 기반 이미지 생성을 지원한다. 오픈AI 제공

오픈AI와 구글의 인공지능(AI) 기술 선두 경쟁이 이미지 생성 영역에서도 재점화됐다. 최근 GPT-5.2 출시에 이어 새로운 이미지 생성 모델도 내놓으며 오픈AI가 추격의 고삐를 죄는 모습이다.

오픈AI는 새로운 이미지 생성 모델인 ‘GPT 이미지 1.5’와 이를 기반으로 한 챗GPT 이미지 서비스를 선보인다고 16일(현지시간) 밝혔다. 지난 11일 출시한 플래그십 모델인 GPT-5.2는 이전 버전(GPT-5.1)으로부터 한 달 만에 나왔지만, 이미지 생성 모델은 이전 버전(GPT 이미지 1)으로부터 8개월만에 업그레이드했다.

오픈AI에 따르면 GPT 이미지 1.5는 이미지 생성 속도가 최대 4배 더 빨라졌고, 사용자 지시사항을 이전보다 훨씬 더 안정적으로 따른다. 텍스트 렌더링도 발전해 더 촘촘하고 작은 텍스트도 처리할 수 있고, 다수의 작은 얼굴을 렌더링하는 능력과 결과물을 자연스럽게 만드는 측면에서도 개선됐다.

특히, 새로운 이미지를 만들거나 기존 사진을 편집할 때 원하는 결과에 더 가까운 결과물을 얻을 수 있게 해준다고 회사는 강조했다. 구글의 이미지 생성 AI ‘나노 바나나’의 성공에 자극받음 셈이다. 지난 8월 구글이 이를 처음 냈을 때 가장 호평받은 부분이 인물·피사체 등 일관성을 유지하며 정교한 수정을 이어갈 수 있는 점이었다.

오픈AI는 조명, 구도, 인물 외형 같은 핵심요소를 그대로 유지하면서 사용자가 요청한 부분만 정확히 변경할 수 있고, 이에 따라 실용적인 사진 편집, 현실감 있는 의상 및 헤어스타일 시뮬레이션, 원본의 이미지는 유지하는 스타일 필터 적용이 가능해졌다고 설명했다. 텍스트와 레이아웃 등 요소를 변경하거나 추가해 아이디어를 생동감 있게 구현하는 변환 기능에도 이를반영했다.

이런 개선을 통해 챗GPT가 실용적인 편집과 표현력 있는 재해석을 모두 수행할 수 있는 ‘주머니 속 크리에이티브 스튜디오’로 작동하게 될 것으로 회사는 기대한다. 챗GPT 메뉴에 전용 공간을 마련해 사용자들이 보다 간편하게 이미지 생성을 할 수 있게 했다. 또 업무 현장에서도 빠른 이미지 생성, 정밀한 편집, 반복작업 전반에 걸친 일관된 시각적 디테일 유지를 통해 보다 효율적인 작업을 지원한다고 부연했다.

오픈AI의 새 이미지 생성 AI 출시는 구글이 ‘나노바나나 프로’로 업그레이드한지 불과 26일 만이다. 당초 내년 1월 초 출시 예정이었으나, 구글 ‘제미나이 3 프로’의 선전으로 오픈AI 사내에 코드레드(중대경보)가 발령하면서 GPT-5.2와 함께 출시가 앞당겨진 것이다. 앞서 출시된 GPT-5.2는 제미나이 3 프로에 비해 뚜렷한 우위를 보이진 못하는 것으로 평가된다. 오픈AI는 이번 이미지 생성 AI 출시에도 코드레드를 여전히 유지 중인 것으로 전해졌다.

팽동현 기자(dhp@dt.co.kr)

[저작권자 ⓒ디지털타임스, 무단 전재-재배포, AI 학습 및 활용 금지]
팽동현

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0