사진= 엠티콤 제공
사진= 엠티콤 제공
인공지능(AI) 데이터 전문 기업 엠티콤이 과학기술정보통신부 및 한국정보화진흥원의 '인공지능(AI) 학습용 데이터 구축(2차)' 사업 중 '패션상품 및 착용 영상 AI데이터 구축' 과제에 선정됐다.

이는 한국전자통신연구원(ETRI)이 주관하는 컨소시엄 사업으로, 엠티콤은 트랜쇼와 함께 참여기업으로서 각각의 역할분담을 통한 최적의 컨소시엄을 구성한다.

본 사업의 목표는 의류 쇼핑몰 운영에 필수적인 의상 모델컷을 스튜디오 임대비나, 모델비를 들이지 않고 생성할 수 있도록 하는 개발을 위한 인공지능 학습용 데이터셋을 구축하는 것이다. 지금까지 쇼핑몰, 인스타그램 등 온라인에서 의류를 판매하는 사업자는 스튜디오에서 모델을 불러 착용컷을 촬영한 뒤, 판매용 사진을 게재해야 했다. 하지만 패션상품 착용 영상 자동생성 기술이 개발되면 스튜디오 임대나 모델을 부르지 않고, 필요 정보를 입력하는 것만으로도 영상을 자동으로 생성할 수 있게 된다.

이 외에도 본 사업에서 구축되는 데이터를 활용하면 다양한 패션 상품에 대한 특징점과 영역, 패션 모델에 대한 특징점과 영역을 추출하기 때문에 패션 영상에 특화된 자세 분석, 영역 검출 인공지능 기술, 패션상품 신규 디자인 자동 생성 기술, 패션 상품 검색 기술 등 다양한 인공지능 학습용 데이터로 활용될 수 있다.

하지만 400만여 장의 원천 데이터 작업을 100% 크라우드 소싱 작업자들 만으로 진행할 경우, 대규모 작업을 운용해도 짧은 기간 안에 모두 소화하기 어렵다는 문제가 있다. 또한 작업자의 실력과 데이터 품질이 비례하는 어노테이션 작업 특성상, 어노테이션 난이도가 높은 이번 작업은 크라우드 소싱 작업자 이상의 처리 능력을 요구한다.

이에 엠티콤은 일정 단축 및 품질 확보를 위해 인공지능 알고리즘을 활용한 전처리 기능 적용이 반드시 필요하다고 말한다. 엠티콤은 인공지능 알고리즘을 활용한 전처리 기능 적용으로 작업 난이도를 낮추고, 작업시간 단축까지 일거양득을 취했다.

엠티콤의 고블린을 활용하면 모델의 관절에 점을 찍는 Keypoint Annotation, 옷과 인체의 영역을 의미대로 나누는 Semantic Segmentation 등 난이도 높은 가공 작업이 가능하다. 또한 데이터 고블린은 패션에 특화된 인공지능 어노테이션 템플릿과 GOBLIN-AI 오토 라벨링 기술이 반영돼 있으므로, 고난이도 패션 데이터 구축 일정 단축이 가능하다. 뿐만 아니라 어노테이터, 크라우드 검수자, 전문 검수 인력이 함께하는 3단계 검수 시스템으로 99% 품질 기준 완수를 실현한다.

한국전자통신연구원 관계자는 "'패션상품 및 착용 영상 AI데이터 구축' 과제는 단순 box 형태의 쉬운 데이터 가공 작업이 아닌, 총 400만 장의 고난이도 데이터 가공 작업을 3개월 내 99% 품질로 완료해야 하는 어려운 과제이므로 자동 레이블링 작업이 필수"라고 평했다.

이어 "엠티콤은 데이터 가공 시장에서 비교적 후발 주자지만, 자사의 데이터 고블린이라는 크라우드 소싱 데이터 가공 플랫폼에 pre-built 된 AI 모델을 적용해 크라우드 작업자들에게 AI 전처리된 결과를 제공하고 있어 짧은 기간 내 데이터 편향이 없는 대규모 신뢰도 높은 데이터세트를 구축하는 데 적합한 기술력을 가졌다"며 엠티콤 선정이유를 밝혔다.

본 과제를 통해 개발될 자동 영상생성 기술은 상품화 과정에서 필요한 패션상품 스튜디오 촬영을 자동화할 수 있어 중소기업과 소상공인, 1인 미디어 등 최근 활발해진 패션 커머스 플랫폼을 활용하는 사용자들이 손쉽게 활용할 수 있다.

엠티콤 관계자는 "단지 '쓸 만한' 학습 데이터 수준을 넘어 보다 효율적인 데이터 가공에 대한 끊임없는 고민을 통해 고품질의 학습데이터 구축에 힘쓸 것"이라고 전했다.

이미정기자 lmj0919@dt.co.kr

[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0