요약생성
바쁠 때는 리얼라이즈가 내용을 요약해 드려요.
비디오에서, 인산인해를 이룬 여름 음악 축제에서 관객들이 열광하고 있습니다. 스피커에서 비트가 울려 퍼지기 시작하자, 마침내 무대에 등장하는 사람은 바로 조커입니다. 빨간 슈트를 입고 녹색 머리에 특유의 얼굴 화장을 한 조커는 주먹을 쥐고 무대를 가로질러 춤을 추며, 팬들로 가득 찬 무대 앞까지 달려갑니다. 랩을 시작할 때가 되자, 조커는 무릎을 굽히고 땅에서 튀어 오르며, 한 발로 360도 회전을 합니다. 마치 아무렇지도 않게 보이지만, 실제로 시도해 본다면 얼굴부터 땅에 닿을 것입니다. 조커는 이렇게 멋진 모습을 보여준 적이 없었습니다.
그리고 또 다른 비디오에서는 NBA 올스타 조엘 엠비드가 무대 뒤에서 나와 관객들에게 인사를 건네고 같은 춤 동작을 선보입니다. 그 다음에는 “커브 유어 엔써지아즘”의 스타 래리 데이빗이 등장합니다. 하지만 이 장면들에서 조금 이상한 점이 있습니다. 조커든, 조엘 엠비드든, 래리 데이빗이든, 연기자의 몸은 흔들리고, 얼굴 표정은 변하지 않습니다.
물론 이 모든 것은 Viggle이라는 회사 덕분에 AI로 생성되었습니다.
원본 비디오는 래퍼 릴 야치가 2021년 서머 스매시 페스티벌에서 무대에 오르는 장면을 보여줍니다. 650만 회 이상의 조회수를 기록한 유튜브 비디오 제목에 따르면, 이 등장은 “역대급 강렬한 등장입니다.” 4월에 사람들이 좋아하는 유명인사 또는 악당 — 샘 뱅크먼-프리드와 같은 —을 릴 야치가 무대에 오르는 비디오에 삽입하면서 트렌드 밈 형식으로 변했습니다.
텍스트에서 비디오로 AI 기능이 놀라울 정도로 발전하고 있지만, “샘 뱅크먼-프리드가 2021년 서머 스매시에서 릴 야치처럼 등장하는 모습”이라고 입력한다고 해서 Sora가 정확히 무슨 뜻인지 알 수 있는 것은 아닙니다. Viggle은 다르게 작동합니다.
Viggle의 디스코드 서버에서 사용자는 어떤 종류의 움직임을 보여주는 비디오 — 대개 TikTok 춤 —와 한 사람의 사진을 업로드합니다. 그러면 Viggle은 해당 사람이 비디오에서 보여주는 움직임을 따라 하는 비디오를 생성합니다. 이 비디오가 실제가 아니라는 것은 분명하지만, 여전히 재미있습니다. 하지만 릴 야치 밈이 바이럴되면서 Viggle은 인기를 얻었고, 열기는 식지 않고 있습니다.
“저희는 제어 가능한 비디오 생성 모델이라고 부르는 것을 구축하는 데 집중하고 있습니다.”라고 Viggle 설립자인 행 추는 TechCrunch에 말했습니다. “콘텐츠를 생성할 때, 캐릭터가 어떻게 움직이는지, 또는 장면이 어떻게 보이는지 정확히 제어하고 싶습니다. 하지만 현재 도구는 텍스트에서 비디오로의 변환에만 초점을 맞추고 있으며, 텍스트 자체만으로는 모든 시각적 미묘함을 지정하기에 충분하지 않습니다.”
추에 따르면 Viggle은 두 가지 주요 유형의 사용자를 보유하고 있습니다. 일부 사람들은 밈을 만들고 있지만, 다른 사람들은 게임 디자인과 VFX의 제작 과정에서 도구로 사용하고 있습니다.
“예를 들어, 애니메이션 엔지니어 팀은 몇 가지 컨셉 디자인을 빠르게 거칠지만 빠른 애니메이션 자산으로 변환할 수 있습니다.”라고 추는 말했습니다. “목표는 최종 계획의 거친 스케치에서 어떻게 보이고 느껴지는지 확인하는 것입니다. 이 작업은 수동으로 설정하는 데 며칠 또는 몇 주가 걸리지만, Viggle을 사용하면 기본적으로 즉시 자동으로 수행할 수 있습니다. 이렇게 하면 지루하고 반복적인 모델링 작업을 크게 줄일 수 있습니다.”
3월에 Viggle의 디스코드는 몇 천 명의 회원을 보유하고 있었습니다. 5월 중순에는 180만 명의 회원이 되었고, 6월이 되기 전에 Viggle의 서버는 300만 명 이상의 회원으로 증가했습니다. 이는 Valorant와 Genshin Impact와 같은 게임 서버를 합친 것보다 더 큰 규모입니다.
Viggle의 성장은 둔화될 기미가 보이지 않습니다. 다만, 비디오 생성에 대한 높은 수요로 인해 인내심 없는 사용자에게는 대기 시간이 너무 길어졌습니다. 하지만 Viggle은 디스코드 중심이기 때문에, 디스코드 개발 팀은 2년 된 스타트업인 Viggle의 빠른 성장을 돕기 위해 직접 협력했습니다.
Viggle에게 다행스럽게도 디스코드는 이전에도 이런 경험이 있습니다. 디스코드에서도 운영되는 Midjourney는 서버에 2,030만 명의 회원을 보유하고 있으며, 이는 플랫폼에서 가장 큰 단일 커뮤니티입니다. 디스코드는 전체적으로 월간 사용자 수가 약 2억 명입니다.
이미지 출처: Viggle/Discord
“이러한 규모의 성장에 대비할 준비가 된 사람은 아무도 없기 때문에, 바이럴 단계에서 그들을 돕기 시작합니다. 그들은 준비가 되어 있지 않기 때문입니다.”라고 디스코드의 제품 담당 부사장인 벤 샹켄은 TechCrunch에 말했습니다. “저희는 준비가 되어 있어야 합니다. 현재 전송되는 메시지의 상당 부분이 Viggle과 Midjourney이고, 디스코드에서 상당한 소비와 사용이 사실상 생성형 AI입니다.”
Viggle과 Midjourney와 같은 스타트업에게 디스코드에서 앱을 구축한다는 것은 사용자를 위한 전체 플랫폼을 구축할 필요가 없다는 것을 의미합니다. 대신, 이미 기술에 정통한 사용자를 보유하고 있으며, 내장된 콘텐츠 모더레이션 도구를 갖춘 플랫폼에서 호스팅됩니다. 직원이 15명에 불과한 Viggle에게 디스코드의 지원은 매우 중요합니다.
“저희는 백엔드 서비스로 모델을 구축하는 데 집중할 수 있고, 디스코드는 프런트엔드에서 자체 인프라를 활용할 수 있기 때문에, 기본적으로 더 빠르게 반복할 수 있습니다.”라고 추는 말했습니다.
Viggle 이전에 추는 3D 도구 대기업인 오토데스크에서 AI 연구원으로 일했습니다. 그는 페이스북, 엔비디아, 구글과 같은 회사에서도 연구를 수행했습니다.
디스코드가 AI 스타트업을 위한 우연한 SaaS 회사 역할을 하는 것은 비용이 들 수 있습니다. 한편으로, 이러한 앱은 디스코드에 새로운 사용자를 유치하고, 사용자 지표에 도움이 될 수 있습니다. 하지만 플랫폼 전반의 다른 사용자가 라이브 비디오 게임 스트리밍, 비디오 채팅, 음성 통화를 하고 있는 상황에서, 이렇게 많은 비디오를 호스팅하는 것은 기술적으로 어렵고 비용이 많이 들 수 있습니다. 하지만 디스코드와 같은 플랫폼이 없었다면, 이러한 스타트업은 같은 속도로 성장하지 못했을 수도 있습니다.
“어떤 유형의 회사도 확장하기 쉽지 않지만, 디스코드는 이러한 규모를 위해 만들어졌고, 그들을 잘 흡수할 수 있습니다.”라고 샹켄은 말했습니다.
이러한 회사는 디스코드의 콘텐츠 가이드라인을 채택하고 콘텐츠 모더레이션 앱을 사용할 수 있지만, 300만 명의 사용자가 모두 제대로 행동하도록 하는 것은 항상 어려울 것입니다. 심지어 릴 야치 등장 밈도 Viggle의 규칙을 위반합니다. Viggle은 사용자에게 동의 없이 유명인을 포함한 실제 사람들의 이미지를 생성하지 않도록 권장합니다.
현재 Viggle의 구세주는 아직까지 출력이 100% 현실적이지 않다는 점일 수 있습니다. 기술은 정말 놀랍지만, 우리는 더 잘 알고 있습니다. 저 조잡한 조커 애니메이션은 분명히 실제가 아니지만, 정말 웃깁니다.
_AI 뉴스레터를 출시합니다! 여기 에서 가입하여 6월 5일에 받아보세요.