인공지능(AI) 학습에 뉴스 콘텐츠를 사용한 것을 두고 뉴욕타임스가 AI 기업에 강경한 대응을 이어가고 있다. 오픈AI에 소송을 제기한 데 이어 AI 검색 스타트업 퍼플렉시티에도 자사 콘텐츠 사용 중단을 요구했다. 이와 달리 최근 오픈AI가 미국 미디어 기업 허스트와 콘텐츠 계약을 맺는 등 AI 기업과 미디어 기업이 싸우는 대신 손을 잡는 사례도 이어지고 있다. 이 가운데 AI 서비스 개발 단계부터 창작자 권리를 존중하는 정책적 표준이 시급하다는 목소리가 커지고 있다.
AI기업과 뉴스콘텐츠기업간 관계는 국내도 다르지 않기 때문에 미국의 움직임에 특히 관심이 쏠린다. 국내서도 AI 학습에 따른 뉴스 콘텐츠 이용 대가 논의가 수면 위로 올라 있기 때문이다.
15일(현지시간) 월스트리트저널(WSJ)은 뉴욕타임스(NYT)가 퍼플렉시티에 자사 콘텐츠 사용을 중단하라고 요구했다고 보도했다. NYT는 최근 퍼플렉시티에 보낸 통지서에서 "퍼플렉시티와 사업 파트너들은 표현력 있고 신중하게 쓰였으며 편집을 거친 우리의 저널리즘 저작물을 승인 없이 사용해 부당한 이득을 얻었다"며 저작물 사용 중단을 요구했다.
앞서 NYT는 지난해 12월 챗GPT 개발사 오픈AI를 상대로 저작권 침해 소송을 제기했다. 그러면서 오픈AI와 마이크로소프트(MS)에 대해 "저널리즘의 대규모 투자에 무임승차 하는 것"이라면서 "독자들을 훔쳐 가고 있다"고 강하게 비난했다. NYT에 이어 시카고트리뷴, 덴버포스트, 뉴욕데일리뉴스 등 8개 언론사도 지난 4월 "오픈AI와 MS가 AI 서비스 모델을 개발하면서 기사 수백만 건을 무단 사용했다"며 뉴욕 남부 연방법원에 소장을 제출했다.
거대언어모델(LLM)은 수백억 개 이상의 매개변수(파라미터)를 갖춰야 하고 학습 과정에서 매우 방대한 데이터가 필요하다. 특히 뉴스 콘텐츠는 품질이 검증된 양질의 데이터인 만큼 AI 기업들이 필수적으로 확보할 가치가 있다. 양측의 이해관계가 맞아떨어지는 만큼 AI 기업과 미디어 기업간의 대가 협상과 제휴도 본격화되고 있다.
최근 오픈AI는 샌프란시스코 크로니클·휴스턴 크로니클 등 미국 지역 언론과 에스콰이어·코스모폴리탄·엘르 등 잡지사를 거느린 미국 미디어 기업 허스트와 콘텐츠 계약을 맺었다. 구체적 계약 조건은 공개되지 않았으나 허스트는 오픈AI 기술 활용과 함께 수백만 달러의 보상을 받을 것으로 알려졌다.
브래드 라이트캡 오픈AI 최고운영책임자(COO)는 "허스트의 신뢰할 수 있는 콘텐츠를 우리 제품에 도입함으로써 사용자들에게 더 신뢰할 수 있는 정보를 제공할 수 있는 능력이 향상됐다"고 말했다.
오픈AI는 이번 계약을 통해 오픈AI는 20개 이상의 잡지 브랜드와 40개 이상의 신문 콘텐츠를 자사의 생성 AI 서비스 챗GPT에 활용할 수 있게 됐다. 앞서 오픈AI는 영국 일간지 파이낸셜타임스(FT)와도 콘텐츠 이용 및 AI 개발 파트너십을 맺었다. 구글도 월스트리트저널(WSJ), 더타임스 등을 소유한 세계 최대 미디어 그룹인 뉴스코퍼레이션의 콘텐츠를 AI 모델 훈련에 사용하는 대가로 연간 500만~600만달러(약 83억원)를 지급하기로 했다.
한편 국내 상황은 네이버의 생성형 AI '하이퍼클로바X'가 국내 언론사 기사를 무단으로 학습한다는 의혹이 제기된 바 있다. 같은 의혹은 한글 서비스를 하는 오픈AI 등 다국적 AI기업에게도 똑같이 적용될 수 있다.
네이버는 콘텐츠 제휴 계약을 맺었다는 입장이지만 한국신문협회는 생성형 AI 학습에 뉴스 기사를 활용하는 것은 제휴 범위를 넘어서는 것이라는 의견서를 공정거래위원회에 제출했다. 소형 콘텐츠 기업은 AI 학습에 사용된 저작물이 자신들의 것인지 확인조차 어렵고 기나긴 소송을 제기하는 것 자체가 어려운 실정이다.
신용우 변호사(법무법인 지평)는 "AI 학습 데이터에는 저작물이 상당수 포함돼 있다. 특히 생성형 AI는 텍스트, 이미지 등을 생성하기 위해 그와 관련된 저작물을 대규모로 학습한다"면서 "AI 학습을 위한 저작물의 이용이 우리나라 현행 저작권법 해석상 저작권 침해가 면제되는 공정 이용에 해당하는지 여부가 명확하지 않다"고 설명했다. 이어 "AI 학습에 대규모 데이터가 필요함에 따라 데이터의 가치가 높아지고 있고 법적으로 이를 보호할 필요성이 높아지고 있다"고 덧붙였다.
이대희 고려대 법학전문대학원 교수는 "소규모 저작권자들은 AI 학습에 사용된 저작물이 자신들의 것인지 확인하는 것조차 엄청난 노력이 들어간다"며 "안다고 해도 소송 과정 자체도 비용과 시간이 많이 들기 때문에 소송을 제기하는 것조차 쉽지 않다"고 밝혔다.
전문가들은 AI 서비스 개발 단계부터 창작자 권리를 존중하는 표준이 만들어져야 한다고 지적한다. 이 교수는 "정부와 관련 부처가 나서서 이해관계자들을 모아 합의할 수 있는 협의체를 구성하는 것이 가장 좋은 방법"이라며 "소규모 AI 개발자들이 저작권 문제로 기술 개발이 제한되지 않도록, 저작물 사용에 대해 합리적인 비용을 제시하고, 이후 일정 수익에 따른 보상 체계를 마련해야 한다"고 말했다.