AI가 채울 수 없는, 저널리즘 공백에 대한 공포가 소송을 부른다

[한정훈의 어차피 미디어, 그래도 미디어]

뉴욕타임스 AI 저작권 침해 법적 대응 나서…잠재적 경쟁자 견제로도 해석
‘저널리즘 위축 vs. 기술 발전 제약’ 그 가운데 크리에이티브 산업은 우려 중

주식 : 더피알=한정훈 | 주어진 명령에 따라 이미지, 비디오, 텍스트를 만들어내는 생성AI가 창작 생태계를 흔들고 있다. 생성AI는 대형 언어 모델(LLM)과 머신러닝을 통해 나날이 진화하면서 인간의 일자리를 위협하고, 학습 과정에서 저작권 침해 위협도 증가하고 있다.

investing : 글로벌 1위 구독 뉴스 미디어 뉴욕타임스(The New York Times)가 2023년 12월 말 오픈AI와 마이크로소프트 등 AI 툴 개발 기업을 저작권 침해(Copyright Infringement)로 고소했다. 자신들의 허락 없이 AI 학습을 위해 기사 콘텐츠를 사용했다는 것이다.

미국 메이저 언론사가 기사 저작권 무단 사용을 이유로 AI 플랫폼 기업을 고소한 것은 이번이 처음이다. 하지만 AI 학습으로 인한 저작권 침해는 모든 언론사에 해당돼 유사한 법적 분쟁이 일어날 가능성이 크다.

뉴욕타임스 “수백만 건의 기사가 AI 챗봇 훈련에 무단 사용”

뉴욕 맨해튼 법원에 제기된 이번 소송은 뉴욕타임스가 발행한 수백만 건의 기사가 자동화된 챗봇을 훈련시키는 데 사용되었으며, 심지어 이 챗봇은 뉴스 매체와 경쟁하고 있다고 주장한다. 다만 뉴욕타임스는 이번 소송에서 금전적 요구 수준을 명기하지 않았다.

다만 피고들(마이크로소프트, 오픈AI)은 뉴욕타임스의 저작물 불법 복제 및 기사 무단 사용에 대한 수십억 달러의 법적 및 실질적 손해에 대해 책임을 져야 한다고 명시했다.(unlawful copying and use of The Times’s uniquely valuable works) 배상 규모가 수십억 달러에 달할 수 있다는 것을 예상케 하는 대목이다.

뉴욕타임스의 요구, 보상과 데이터 파기

뉴욕타임스는 소송에서 모든 상황을 원상 복구하길 원했다. 보상과 함께 뉴욕타임스의 저작권이 있는 자료를 사용하는 모든 챗봇 모델과 트레이닝 데이터를 파기할 것을 요구했다.

뉴욕타임스는 지난해 4월 마이크로소프트와 오픈AI에 저작권 침해 우려를 전달하고 협상을 진행해왔다. 당시 뉴욕타임스는 기사 콘텐츠 사용에 대한 금전적 보상과 기술적 가이드라인 등 원만한 해결 방안(Amicable Resolution)을 찾기 위해 접촉을 이어갔다고 공개했다. 그러나 양 측은 최종 결론을 내지 못했고, 결국 소송으로 이어졌다.

오픈AI의 대변인 린제이(Lindsey)는 자료에서 “회사는 뉴욕타임스와 건설적인 협상을 이어갔지만 소송을 제기한 것에 대해 놀랐고 실망했다”고 설명했다. 오픈AI는 또 “우리는 콘텐츠 크리에이터와 저작권 보유자의 권리를 존중한다”며 “AI 기술 사용에 대한 이점과 새로운 매출 모델의 혜택을 누릴 수 있도록 노력했다”고 강조했다.

하지만 마이크로소프트는 공개 답변을 거부했다.

뉴욕타임스가 시작한 뉴스 vs AI 전쟁

뉴욕타임스가 제기한 ‘뉴스 vs AI 전쟁’은 이제 시작이다. 이번 소송에서 우리는 AI 이용에 따른 뉴스 저작권 보호 방향, 보상 수준, 보상 방법 등을 엿볼 수 있다. AI가 지배하는 세상에서 뉴스 미디어가 저작권을 지키며 보상받는 방법의 바이블로 작용할 수 있다.

생성AI가 뉴스 미디어에 영향을 미치는 이유는 대규모 데이터 세트를 학습한 후 텍스트와 이미지나 비디오 등의 콘텐츠를 만들어낼 수 있기 때문이다. 지면에서 온라인 구독 저널리즘으로의 변신에 성공한 뉴욕타임스도 AI의 기사 무단 사용을 막지 못할 경우 수익이 급감할 수 있다.

이와 함께 뉴스 미디어들의 불만은 그들의 콘텐츠를 이용해 오픈AI 등 AI 플랫폼이 자사의 회사 가치를 높이는 데 활용했다는 것이다. 실제로 AI 테크 기업들은 뉴스와 방송 등 언론사들의 기사 콘텐츠를 무단으로 사용해 복제하는 능력으로 수십억 달러를 투자받았다.

챗GPT의 오픈AI는 800억 달러가 넘는 시장 가치를 인정받고 있다. 마이크로소프트는 오픈AI에 1300억 달러 투자를 약속했으며, 검색 엔진 빙 등 자사 오피스 제품이 오픈AI의 기술을 탑재하고 있다.

블룸버그는 2023년 12월 23일 오픈AI가 1000억 달러 규모의 새로운 펀딩을 논의 중이라고 보도했다. 이 경우 역대 최대 가치의 스타트업으로 등극할 수 있다.

언론사들은 AI 기업들을 향해 콘텐츠를 무단 이용해 이익을 높이는 이른바 ‘무임승차'(Free-ride)를 하고 있다고 비난의 수위를 높였다.

뉴욕타임스는 소장에서 “엄청난 투자를 통해 만들어놓은 저널리즘에 AI 기업들이 무임승차했다”며 “이들은 뉴욕타임스 콘텐츠 사용에 대해 어떠한 금전적 보상도 없이 뉴욕타임스를 대체하는 콘텐츠를 만들고 오디언스를 빼앗아갔다”고 비난했다.

마이크로소프트나 오픈AI 등도 뉴스 미디어들의 잠재적 저작권 소송에 대비하고 있었다. 마이크로소프트는 2023년 9월 AI 툴을 사용한 고객들이 저작권 소송에 휘말릴 경우 이를 배상하고 소송 비용을 지원하겠다고 밝힌 바 있다.

기술 진영에선 빅테크를 엄호하는 흐름도 있다. 과거 빌 클린턴 정부 시절 인터넷 플랫폼이 이용자들이 올린 콘텐츠의 선정성과 저작권 위반 사례로 공격받자, 통신품위유지법(DCA)에 면책조항(섹션230)을 만들어낸 것과 유사한 흐름이다. 섹션 230에 따라 인터넷 플랫폼은 블라인드나 삭제 등 일정 수준의 조치를 취할 경우 콘텐츠의 문제로 인한 처벌에서 면제된다.

2023년 10월 벤처캐피털이자 오픈AI의 초기 투자자인 앤드리슨 호로위츠(Andreessen Horowitz)는 미국 저작권청에 보낸 서한에서 “AI 기업들이 저작권 책임에 노출될 경우 개발이 느려지거나 고사될 것”이라고 경고했다. 그는 “저작권 콘텐츠들을 AI 훈련에 사용하는 것은 공정 이용에 해당한다”며 “만약 AI 개발에 지나치게 저작권을 주장한다면 미국의 AI 기술 경쟁력은 크게 퇴보할 것”이라고 강조했다.

AI는 뉴스 미디어의 잠재적 경쟁자

뉴욕타임스가 오픈AI와 마이크로소프트에 소송을 제기한 이유는 저작권 보호에만 있지 않다. ‘모든 이들이 AI에 묻는 상황’에서 오픈AI가 뉴욕타임스의 잠재적인 경쟁자가 될 수 있다는 우려도 작동했다.

뉴욕타임스는 소송을 뉴스 산업의 잠재적인 경쟁자를 견제하겠다는 포석으로 삼았다.

이슈나 특정 개념에 대한 사람들의 질문에 답을 만들어내는 생성AI의 기능은 언론의 사회적 역할과 유사할 수 있다. 독자들이 검색이나 언론 사이트를 방문하지 않아도 궁금증을 해소할 수 있게 된 것이다. AI의 이용은 결국 뉴스 웹 트래픽 감소와 광고 및 구독 매출의 저하를 불러올 수 있다.

뉴욕타임스는 소장에서 AI 챗봇이 뉴욕타임스의 유료 기사를 무단으로 이용해 사용자에게 제공한 사례를 여럿 공개했다. 이에 대해 오픈AI와 마이크로소프트는 자료의 신뢰성과 정확성 때문에 AI 프로그램 훈련에 뉴욕타임스 기사를 사용하고 있다고 주장했다.

또 소장에서 뉴욕타임스는 챗GPT 기반 마이크로소프트 검색 엔진 '브라우즈 위드 빙'(Browse With Bing)이 뉴욕타임스 유료 제품 리뷰 사이트 와이어커터(Wirecutter)의 결과를 거의 그대로 노출한 사례도 지적했다.

빙에 노출된 텍스트는 와이어커터 기사로 연동되지 않았고, 와이어커터가 추천을 기반으로 판매 수수료를 생성하는 데 사용하는 텍스트의 추천 링크도 제거됐다고 뉴욕타임스는 밝혔다.

뉴욕타임스는 또한 AI 사용으로 인한 잠재적인 브랜드 이미지 훼손도 지적했다. 이른바 ‘AI 환각’(A.I. Hallucinations)으로 인한 회사의 신뢰도 하락이다. AI 환각은 챗봇이 허위 정보를 제공한 뒤 출처를 잘못 표현하는 것을 말한다.

이와 관련해 뉴욕타임스는 소장에서 마이크로소프트의 빙챗(Bing Chat)이 뉴욕타임스로부터 발췌했다고 하는 정보의 부정확성도 지적했다. 뉴욕타임스에 보도되었다고 언급한 내용 상당수가 실제 기사화된 적이 없었던 것이다.

뉴욕타임스는 “뉴욕타임스 등 뉴스 미디어가 AI로부터 보호받지 못한다면, AI가 생산할 수 없는 저널리즘의 공백이 생길 것”이라며 “이는 저널리즘의 위축과 이로 인한 엄청난 사회적 비용 증대로 이어질 것”이라고 설명했다.

뉴욕타임스는 2023년 8월 AI 툴이 학습용으로 뉴욕타임스 콘텐츠에 접근하는 것을 막은 바 있다. 이런 움직임은 CNN과 BBC에도 확산됐다. 뉴욕타임스, 월스트리트저널, 복스미디어 등은 2023년 6월 AI와의 협상을 위한 연대 결성을 추진하기도 했다.

뉴욕타임스는 이번 소송의 법률 대리인으로 서스만 고드프리(Susman Godfrey)와 로스웰(Rothwell), 피그(Figg), 에른스트 앤드 맨벡 로펌(Ernst & Manbeck)을 선임했다. 특히 서스만 고드프리는 폭스뉴스를 상대로 한 선거 개표 시스템 도미니언 보팅 시스템(Dominion Voting Systems)의 명예훼손 소송을 대리해 7억 8750만 달러의 합의금을 받아내 유명해졌다.

서스만 고드프리는 또한 논픽션 작가들을 대행해 마이크로소프트와 오픈AI를 상대로 집단소송도 진행했다. 이들의 AI 시스템이 작가들의 책과 다른 작품의 저작권을 침해했다는 논리다.

크리에이티브 산업과 AI 전쟁

물론 뉴스 미디어들도 생성AI의 확산에 대응하고 있다. 일부 언론사들은 이미 AI 플랫폼과 뉴스 사용에 대한 보상과 합의를 마쳤다.

AP는 2023년 7월, 비즈니스 인사이더와 폴리티코를 보유한 독일 미디어 악셀 스프링거(Axel Springer)는 12월에 오픈AI와 잠재적인 뉴스 데이터 사용에 대한 합의를 끝냈다. 이 합의로 오픈AI는 1985년 이후 AP의 모든 기사를 AI 훈련에 사용할 수 있게 됐다. 구체적인 금전 보상 수준은 공개되지 않았다.

AI를 저널리즘과 뉴스 보도에 활용하는 방법도 연구 중이다. 뉴욕타임스는 AI 기술을 활용하는 방법을 자체적으로 모색하고 있는 것으로 알려졌다.

뉴욕타임스는 뉴스룸의 AI 사용에 대한 기본 원칙을 담은 ‘AI 이니셔티브'(Artificial Intelligence Initiatives)를 담당할 편집 디렉터로 잭 스워드(Zach Seward)를 최근 선발했다. 잭 스워드는 AI 기술을 뉴욕타임스 취재와 보도에 적용하는 방법을 연구하는 역할도 맡았다. 스워드는 디지털 세대를 위한 비즈니스 뉴스 쿼츠(Quartz)의 개국 에디터였다.

우려로 가득 찬 크리에이티브 산업

금전 보상 없는 AI의 지적재산권 무단 사용은 크리에이티브 산업 전반에 우려로 작동하고 있다. 여배우 사라 실버맨(Sarah Silverman)은 2023년 7월 AI 프로그램이 텍스트를 훈련시키는 용도로 자신의 회고록을 무단 사용했다며 메타와 오픈AI를 고소했다.

특히 소설가 등 텍스트 기반 창작자들의 우려가 크다. AI가 데이터 학습을 위해 엄청난 양의 책과 데이터를 흡수하고 있기 때문이다. 조너선 프랜즌과 존 그리샴 등 많은 유명 작가들이 2023년 9월 오픈AI를 상대로 소송을 제기한 것이 이를 반증하다.

사진 유통 플랫폼 게티이미지도 그림이나 이미지를 생성하는 AI 플랫폼을 대상으로 소송을 진행했다. 자신들이 저작권을 가지고 있는 시각 이미지를 AI 이미지 생성기가 사용, 무단으로 복제하고 있다는 주장이다

AI의 등장으로 인터넷 시대에 만들어진 저작권의 개념도 흔들리고 있다. 비영리 뉴스 프로퍼블리카(ProPublica)의 전 대표인 리처드 포펠은 뉴욕타임스와의 인터뷰에서 “대법원의 결정을 피할 수 없을 것”이라며 “언론사는 일정 기간 합의를 하겠지만, 근본적인 해결을 위해서는 법적 판단이 필요하다”고 설명했다.

Tag#뉴욕타임스#마이크로소프트#오픈AI#뉴스미디어#저작권저작권자 © The PR 더피알 무단전재 및 재배포 금지한정훈다이렉트미디어랩 대표, 전 JTBC 미디어 전문기자다른기사 보기