OpenAI, 미디어 산업을 집어삼키다

수많은 기업들이 OpenAI와 자발적으로 협력하려는 움직임을 보면서, 권력의 중심이 어디에 있는지 분명해졌습니다. 하지만 미디어 회사들에게는...

2024년 5월 29일 오후 8:46- 4달 전VENTUREBEAT.COM- Carl Franzen

OpenAI, 미디어 산업을 집어삼키다

요약생성

바쁠 때는 리얼라이즈가 내용을 요약해 드려요.

먼저 분명히 해 두자면, 저는 일반적으로 생성형 AI를 지지하는 입장입니다. 적어도 저는 저널리즘 업계에 있는 많은 동료들 보다 생성형 AI에 대해 훨씬 더 호의적이며, ChatGPT를 통해 정보를 분석하고 ChatGPT와 Midjourney로 이미지를 생성하는 방식으로 매일 사용하고 있습니다.

그럼에도 불구하고 저는 ChatGPT와 그 기반이 되는 GPT 시리즈 대규모 언어 모델(LLM)의 제작사인 OpenAI가 미국 및 해외의 주요 언론사와 파트너십을 체결하는 최근 추세에 대해 궁금증과 우려를 느끼고 있습니다.

바로 오늘, OpenAI는 제가 이전에 근무했던 두 곳의 주요 언론사인 _The Atlantic_과 Vox Media와 파트너십을 발표했습니다.

전자는 미국에서 가장 오래된 출판물 중 하나인 167년 역사의 인쇄 매체로, 다양한 사설과 잘 쓰여진 기사를 통해 디지털 및 온라인 시대에 성공적으로 재창조되었습니다.

후자는 인기 스포츠 블로그인 SB Nation에서 시작된 신생 미디어 스타트업으로, 2011년에 인기 기술 매체인 The Verge(제가 근무했던 곳)를, 2014년에는 정치 및 종합 뉴스 매체인 Vox를 출범시켰으며, 최근 몇 년 동안 New York Magazine과 같은 명성 있고 수상 경력에 빛나는 매체를 포함하여 점점 더 많은 매체를 인수했습니다.

결론적으로 OpenAI는 1년도 채 안 되는 기간 동안 7개의 주요 언론사와 제휴를 맺었으며, 그중 일부는 독일 출판사인 악셀 스프링거와 같이 Politico, Business Insider, _BILD_와 같이 영향력 있는 유명 매체를 다수 보유하고 있는 지주 회사입니다. 제가 조사한 바에 따르면 전체 목록은 다음과 같습니다.

이러한 거래의 정확한 조건은 공 disclosed되지 않았지만(이들 중 상당수가 비상장 기업이기 때문에 모든 재무 거래를 공개할 의무가 없음), OpenAI는 이러한 언론사가 생산하는 모든 미디어를 손에 넣기 위해 수천만 달러, 뉴스 코퍼레이션의 경우 5년 동안 2억 5천만 달러를 지불한다고 합니다.

VentureBeat 자체는 저 개인적으로는 아니지만, 저희 직원들이 OpenAI에 연락하여 파트너십 가능성을 논의한 적이 있지만, 지난 1년 동안 저희 쪽에서 연락을 취한 것 외에는 해당 논의가 어떻게 진행되고 있는지, 어떤 내용이 논의되었는지 알지 못합니다.

왜 이런 일이 일어나고 있을까요?

OpenAI는 왜 이러한 언론사와 파트너십을 맺고 있을까요?

가장 명확한 답은 이를 통해 OpenAI는 일반적인 월스트리트 저널 기자만큼 글을 잘 쓸 수 있는 강력한 새 AI 모델을 구축하는 데 사용할 수 있는 라이선스가 부여된 학습 데이터에 액세스할 수 있기 때문입니다.

누가 이걸 원할까요? 우선 OpenAI는 ChatGPT의 성능을 개선하고 궁극적으로는 동일한 언론사 또는 업계의 다른 언론사에 도구를 다시 상용화하기를 바랍니다.

YouTube용 동영상 콘텐츠와 Netflix용 라이선스가 부여된 다큐멘터리 및 시리즈를 제작하는 Vox와 같은 디지털 미디어 매체의 경우, OpenAI는 아마도 생성형 AI 동영상 모델인 Sora를 교육하여 텍스트 프롬프트에서 다큐멘터리 스타일의 콘텐츠를 제작할 수 있을 것입니다. 여기에는 화면에 표시되는 제목 카드와 그래픽이 포함될 수 있습니다.

OpenAI는 무료로 스크래핑할 수 있는(경우에 따라 이미 스크래핑된) 콘텐츠의 라이선스를 받기 위해 왜 비용을 지불할까요?

OpenAI는 과거에 인터넷에서 공개 게시물을 스크래핑하여 무료로 학습해 왔는데, 왜 이 모든 콘텐츠에 대한 비용을 지불하려고 할까요?

아티스트, 크리에이티브, 심지어 _뉴욕 타임스_와 같은 언론사의 반발이 거세지면서(뉴욕 타임스는 OpenAI가 NYT 온라인 신문 기사를 무단으로 가져다 사용했다는 이유로 저작권 침해 소송을 제기함) 공개적으로 이용 가능한 데이터를 변형적 상업적 목적으로 합법적으로 스크래핑할 수 있다는 회사의 입장이 더욱 불안정해졌고, 솔직히 윤리적으로도 문제가 있는 입장이 되었습니다.

이에 따라 OpenAI는 작년에 웹사이트 소유자가 웹사이트에 추가하여 OpenAI가 웹사이트를 스크래핑하고 학습하는 것을 중단할 수 있는 새로운 코드를 도입했습니다.

회사 측은 웹사이트의 robots.txt 파일을 편집하여 Google에서 웹사이트를 스크래핑하고 검색에서 색인을 생성하지 못하도록 차단하는 것과 마찬가지로, 이 코드를 추가하는 모든 사이트는 스크래퍼에서 제외될 것이라고 말합니다.

OpenAI는 또한 최근 아티스트, 크리에이티브, 그리고 아마도 출판사에서 온라인에 게시했거나 게시할 예정이며 AI 스크래퍼가 가져다가 자신의 작업과 경쟁할 수 있는 새로운 모델을 만드는 데 사용하는 것을 원하지 않는 작업에 플래그를 지정하는 데 사용할 수 있는 새로운 제품인 Media Manager를 만들 것이라고 발표했습니다.

하지만 이는 2025년까지 출시되지 않을 예정이며, 또 다시 콘텐츠 제작자 또는 소유자가 AI 스크래핑 및 교육을 거부하는 힘든 작업을 해야 합니다.

출판사에 돈을 지불하고 입을 다물게 하고 AI 스크래핑과 교육을 받아들이게 하는 것은 OpenAI 입장에서는 가 worthwhile한 비용일 수 있습니다. 출판사를 귀찮게 하지 않고 필요한 데이터를 얻고, 투자자와 사용자에게 저작권법과 윤리를 준수하고 있음을 보장할 수 있기 때문입니다. 어느 정도는요.

이미 스크래핑되어 모델 교육에 사용된 콘텐츠의 소유자에게는 아무런 보상도 하지 않지만, 시작이라고 할 수 있습니다.

제가 알기로는 예외 없이 모든 출판사는 OpenAI 콘텐츠 라이선스 계약을 통해 돈(기자, 직원, 장비/인프라, 웹 호스팅 등에 필요한 비용) 외에도 무언가를 얻는다는 사실을 인정하면서 계약을 발표했습니다. 바로 게재입니다.

특히 OpenAI와 손을 잡은 거의 모든 출판사는 ChatGPT가 결과물 중간에 기사를 표시할 것이라고 언급했습니다.

따라서 사용자가 “최신 기술 뉴스 요약'을 입력하면 Business Insider, The Verge(Vox 소유), 월스트리트 저널 또는 계약에 포함된 기타 출판물의 기사 요약이 출처 링크와 함께 표시될 수 있습니다.

여기서 중요한 단어는 “수도 있다'입니다. 특정 출판물의 기사 또는 기타 콘텐츠가 ChatGPT에서 사용자에게 언제, 왜 표시되는지 보여주는 정확한 계약 언어 또는 기술 문서를 아직 미디어 매체나 OpenAI에서 공개적으로 공유하지 않았기 때문입니다.

또한 ChatGPT가 응답에서 인용하거나 요약한 출처 출판물로 얼마나 많은 추천 트래픽을 유도하는지 보여주는 유용한 공개 데이터는 아직 없습니다.

또한 ChatGPT가 인상적이지만 로봇 같은 글쓰기 실력을 사용하여 기본 콘텐츠를 요약하는 대신 기사에서 얼마나 많이 직접 인용(직접 복사하여 붙여넣기)하는지는 아직 확실하지 않습니다. 이는 원래 작성자의 실제 의미와 예술성을 일부 없앨 수 있을 뿐만 아니라, 사용자가 처음 게시된 실제 사이트를 방문할 필요성을 없애 해당 출판물이 광고 노출을 판매하거나 유료 구독자를 확보하는 데 사용하는 트래픽을 빼앗을 수도 있습니다.

The Information 설립자인 제시카 레신, Gawker 기자인 해밀턴 놀란, Vice 기자인 에드워드 온스웨고 주니어를 포함한 언론인들이 OpenAI와의 거래에서 언론사가 불리한 조건을 받아들이는 것 같다고 지적한 이유가 바로 여기에 있습니다.

결국 ChatGPT가 순수한 정보를 원하는 독자에게 해당 정보를 제공한다면, 독자가 기본 미디어 매체를 방문하거나 비용을 지불하고 구독할 이유가 무엇일까요? OpenAI는 기본 출판물 대신 ChatGPT Plus 구독자로부터 매달 20달러의 수익을 얻고 있습니다.

역사는 반복된다

Google 뉴스가 처음 출시되었을 때(2006년), Facebook, Twitter와 같은 소셜 플랫폼이 사용자와 인기를 얻기 시작하면서 빠르게 출판사의 주요 추천 트래픽 출처가 되었던 시절을 겪었던 많은 디지털 언론인들에게는 섬뜩할 정도로 익숙한 일입니다.

이는 지난 15~20년 동안 기본적으로 사실이었지만, 이러한 플랫폼 이면의 기술 대기업의 관리와 끊임없는 알고리즘 변경 덕분에 트래픽은 썰물처럼 빠져나갔고, 특정 플랫폼이나 전략에 너무 몰두했던 사이트는 기술 플랫폼의 “알고리즘 변경'으로 인해 갑자기 시청자를 잃게 되면 손실을 입게 되었습니다.

하지만 변화는 계속되었고, 이제는 기술 플랫폼과 출판사보다 한 발 앞서 가장 큰 변화가 일어나고 있습니다. 바로 생성형 AI입니다.

Google은 검색 결과 페이지 상단에 자체적으로 잘못된 AI 개요 요약 결과를 게재하고 출판사 및 뉴스 기사로의 직접 링크를 아래로 밀어내고, 더 많은 사람들이 ChatGPT를 뉴스 출처 또는 애그리게이터로 채택함에 따라 뉴스 출판사와 이를 담당하는 임원들은 궁지에 몰린 느낌을 받았을 것입니다. 게임의 규칙이 또다시 바뀌고 있으며, AI가 등장하여 사람들이 온라인에서 뉴스를 접하는 기존 방식을 대체하고 있으므로, 파괴자들과 협력하여 물결을 타지 않을 이유가 있을까요?

하지만 위에서 설명한 짧은 역사적 교훈에서 알 수 있듯이, 기술 기업은 미디어 기업을 곤혹스럽게 하면서 전략과 도구를 항상, 무작위로, 예측 불가능하게 변경합니다.

따라서 미디어 기업은 또다시 취재 과정에서는 거짓말을 하지만 거래 과정에서는 절대 거짓말을 하지 않는 기술 기업과의 파트너십을 추구하고 있습니다. 그리고 그들은 모든 면에서 자신들에게 거짓말을 한 다른 기술 기업이 초래한 위기에서 벗어나기 위해 부분적으로 그렇게 하고 있습니다.

— 에드워드 온스웨고 주니어(@bigblackjacobin) 2024년 5월 29일

OpenAI는 현재 출판사와 좋은 관계를 유지하고 있지만, 적어도 공개적으로 알려진 바에 따르면 이러한 관계가 영원히 지속될 것이라는 또는 출판사가 과거에 다른 유distribution 채널을 통해 확보했던 수익과 구독자를 유지하는 데 도움이 될 것이라는 보장은 없습니다.

또한 OpenAI와 파트너십을 맺는 출판사가 많을수록 각 출판사 자체가 ChatGPT의 잠재적인 정보 출처로서 희석되고, 전체 미디어 산업이 더욱 상품화되어 OpenAI 모델과 요약의 재료가 될 뿐입니다.

이러한 파트너십에 대한 낙관적인 전망은 “글쎄요, 기술이 변하고 있고, 미디어 소비 습관이 변하고 있고, 어차피 더 이상 Google이나 소셜 사이트에 의존할 수 없으니' 이것이 미디어 출판사에게 가장 나쁜 선택일 수 있다는 식의 무관심한 반응입니다.

하지만 수많은 기업들이 자발적으로 OpenAI와 거래하려고 줄을 서는 것을 보면 권력의 중심이 어디에 있는지 분명해집니다. 그리고 그것은 미디어 기업이 쉽게 양보해서는 안 되는 것입니다. 그들이 투자한 만큼의 가치를 얻기를 바랍니다.

덜 알려진 다른 작은 길

한편, 404 Media, Platformer, Newcomer와 같은 개인, 자영업자 또는 근로자 소유 출판물의 부상(주로 뉴스레터 플랫폼 Substack에서 제공하는 기술 인프라를 기반으로 구축됨)은 현재 다른 길을 추구하고 있습니다. 다시 말해, 인기 있는 스타트업에서 제공하는 기본 기술을 활용하면서 독자 및 구독자와 직접적인 관계를 구축하려고 노력하고 있습니다.

하지만 이러한 출판물은 의도적으로 규모가 작으며, 과거에 대형 신문사와 방송사에서 수행했던 것처럼 상을 수상하고 경우에 따라 역사의 흐름을 바꾼 대규모 조사를 수행할 수 있는 인력과 자원이 제한적입니다.

하지만 방송 및 케이블 뉴스 시청률이 감소하고 점점 더 많은 젊은층이 YouTube, TikTok과 같은 대체 뉴스 출처로 눈을 돌리면서 신문 자체의 독자 수도 감소하고 있는 상황에서, 과연 시청자가 신문과 방송사에서 전달하던 종류의 조사에 관심이 있는지조차 확실하지 않습니다.

기존 언론 매체와 그들의 탐사 능력에서 벗어나고 있는 시청자들은 민주주의, 정보 생태계, 서로 간의 관계, 우리 사회에 어떤 영향을 미칠까요?

저는 이것이 모든 것을 망칠 것이라고 종말론적으로 생각하지 않습니다. 사실 저는 소셜 미디어가 독자, 소위 “시민 기자' 또는 아마추어 탐정, 그리고 다른 사람들이 중요한 정보(또는 적어도 흥미로운 가십)를 캐내기 위해 연 coalition하고 노력할 수 있는 그 어느 때보다 많은 방법을 제공했다고 생각하기 때문에, 이것이 불의와 문제를 폭로하는 일의 종말을 의미한다고 생각하지 않습니다. 전혀 그렇지 않습니다.

하지만 반대로 기존 언론 매체를 방문하고 참여하는 사람들이 줄어들면서 미국 내 전반적인 뉴스 소비 비율이 감소하고 전혀 사실이 아닌 디지털 군중 심리가 증가하고 있다는 점은 누구에게도 도움이 되지 않는다고 생각합니다. 세상에 대한 이해나 공유된 사실적 현실을 유지하는 데 말이죠.

미디어는 진입 장벽이 낮고 경쟁이 치열하며 수익성이 낮은 매우 힘든 사업입니다. 휴대폰, TV, PC에 있는 다른 모든 관심을 끄는 앱이 직접적 및 간접적인 경쟁자입니다. 적어도 미국에서는 공 funded으로 운영되는 미디어의 전통이 없습니다. 다른 대안은 부유한 가족과 개인의 지원을 받는 것이었습니다.

OpenAI는 이러한 미디어에 대한 직접 자금 지원 부족을 교묘하게 이용하여 자신과 사용자의 이익을 추구하고 있습니다.

이 모든 것의 분명한 결과는 OpenAI가 더 많은 직접적인 사실 정보 출처를 확보하게 되었고, 정보는 곧 힘이기 때문에 더 많은 힘을 얻게 되었다는 것입니다.

ChatGPT가 Google이 오랫동안 그랬던 것처럼 많은 사람들에게 새로운 “인터넷 홈페이지'가 될까요? 저는 ChatGPT의 현재 형태, 현재 인터페이스로는 다소 회의적입니다. 최고의 멀티미디어 소비 경험을 제공하지 못하기 때문입니다. 하지만 시간이 지나면서 개선될 수 있고, 또 그렇게 될 것입니다.

사실 저는 OpenAI가 다른 기술 기업과 마찬가지로 사용자가 신뢰할 수 있는 출처의 뉴스를 풍부하게 이용할 수 있더라도 ChatGPT에 와서 뉴스를 찾지 않는다는 사실을 알게 될 수도 있다고 생각합니다. Facebook도 똑같은 시도를 했지만 결국 뉴스의 우선순위를 낮추고 “친 friends 및 가족'이 공유하는 사용자 생성 콘텐츠를 우선시했습니다. ChatGPT는 사용자가 가져오거나 제공하는 기존 정보로 작업하는 도구로는 훌륭하지만, 다양한 출처에서 최고의 정보를 찾는 도구로는 부족해 보입니다. 하지만 저는 틀릴 수도 있습니다(그리고 자주 틀렸습니다).

누군가 ChatGPT에서 긴 기사를 읽거나 클릭하여 기사를 찾을지도 저에게는 더욱 불분명합니다. 하지만 이제 곧 알게 되겠죠.