요약생성
바쁠 때는 리얼라이즈가 내용을 요약해 드려요.
빠르게 변화하는 AI 업계를 따라잡는 것은 쉬운 일이 아닙니다. 따라서 AI가 대신 해 줄 때까지, 최근 머신러닝 세계의 주요 뉴스와 독자적으로 다루지 않은 주목할 만한 연구 및 실험을 간략하게 살펴보겠습니다.
참고로 테크크런치는 6월 5일에 AI 뉴스레터를 출시할 예정입니다. 계속 지켜봐 주세요. 한편, 이전에는 한 달에 두 번(혹은 그 정도) 발행되었던 AI 칼럼을 매주 발행하기로 했습니다. 더 많은 내용을 기대해 주세요.
이번 주 AI에서는 오픈AI가 새로운 출판 거대 기업인 뉴스 코퍼레이션과 계약을 체결했다고 발표했습니다. 이 계약을 통해 오픈AI는 월스트리트 저널, 파이낸셜 타임즈, 마켓워치를 포함한 뉴스 코퍼레이션 브랜드의 기사를 사용하여 오픈AI가 개발한 생성형 AI 모델을 훈련할 수 있게 되었습니다. 회사들은 이 계약을 “다년간” 지속되는 “역사적인” 계약이라고 묘사하며, 오픈AI는 ChatGPT와 같은 앱에서 특정 질문에 대한 답변으로 뉴스 코퍼레이션의 매체 이름을 표시할 권한을 얻었습니다. 답변이 뉴스 코퍼레이션 출판물에서 전부 또는 일부 출처를 얻은 경우를 가정합니다.
양쪽 모두에게 이익이 되는 것 같지 않나요? 뉴스 코퍼레이션은 미디어 업계의 전망이 평소보다 더 암울한 시기에 콘텐츠에 대한 현금 유입 – 보도에 따르면 2억 5천만 달러 이상 –을 얻게 됩니다. (생성형 AI는 문제를 악화시키지 않았습니다, 출판물의 참조 트래픽을 크게 줄일 위협이 되고 있습니다.) 한편, 공정 사용 분쟁으로 여러 측면에서 저작권 보유자와 싸우고 있는 오픈AI는 비용이 많이 드는 법정 싸움을 하나 덜 걱정하게 되었습니다.
하지만 자세히 살펴보면 문제가 있습니다. 뉴스 코퍼레이션과의 계약에는 종료 날짜가 있습니다. 오픈AI의 모든 콘텐츠 라이선스 계약에도 마찬가지입니다.
오픈AI 입장에서 이 자체가 나쁜 의도는 아닙니다. 모든 당사자가 거래 재협상의 가능성을 열어두려는 의도를 가지고 있기 때문에 영구 라이선스는 미디어에서 드문 일입니다. 하지만 오픈AI CEO 샘 알트먼이 최근 AI 모델 훈련 데이터의 감소하는 중요성에 대해 언급한 내용을 고려해 볼 때 약간 의심스럽습니다.
“올인” 팟캐스트에 출연한 알트먼은 “모델이 충분히 똑똑해지면 어느 시점에서 더 많은 데이터를 사용하는 것이 중요하지 않을 것입니다. 적어도 훈련에는 그렇지 않을 것입니다”라고 말했습니다. 또한 MIT 테크놀로지 리뷰의 제임스 오도넬에게 “오픈AI 또는 더 넓게 AI 업계가 더 많은 훈련 데이터를 필요로 하는 문제를 해결할 방법을 찾을 것이라고 낙관하고 있다”고 말했습니다.
모델은 아직 그렇게 “똑똑하지” 않아서 오픈AI는 보도에 따르면 합성 훈련 데이터를 실험하고 있습니다 그리고 웹의 먼 곳 – 그리고 유튜브 –에서 유기적인 출처를 찾고 있습니다. 하지만 언젠가는 획기적인 발전을 위해 더 많은 데이터가 필요하지 않다고 가정해 보겠습니다. 그렇게 되면 출판사, 특히 오픈AI가 모든 보관 자료를 스크랩한 후에는 어떻게 될까요?
제가 말하고자 하는 것은 출판사, 그리고 오픈AI와 협력한 다른 콘텐츠 소유자는 단기적인 편의를 위한 파트너일 뿐입니다. 오픈AI는 라이선스 계약을 통해 법적 위협을 효과적으로 무력화합니다. 적어도 법원이 AI 훈련과 관련하여 공정 사용이 어떻게 적용되는지 결정할 때까지는 그렇습니다. 그리고 홍보 효과도 누릴 수 있습니다. 출판사는 꼭 필요한 자본을 얻습니다. 그리고 출판사에게 심각한 피해를 입힐 수 있는 AI 작업은 계속됩니다.
지난 몇 일 동안 주목할 만한 AI 관련 뉴스를 소개합니다.
- 스포티파이의 AI DJ: 스포티파이는 사용자에게 개인 맞춤형 음악 선택을 제공하는 AI DJ 기능을 추가하면서 AI 미래로의 첫 발을 내디뎠습니다. 사라는 스포티파이가 스페인어를 구사하는 DJ의 대안 버전을 개발하고 있다고 썼습니다.
- 메타의 AI 위원회: 메타는 수요일에 AI 자문 위원회를 설립했다고 발표했습니다. 하지만 큰 문제가 있습니다. 위원회는 백인 남성으로만 구성되어 있습니다. AI 기술의 단점으로 인해 가장 큰 피해를 볼 가능성이 높은 소외된 그룹을 고려해 볼 때 이는 다소 무감각한 행동입니다.
- FCC의 AI 공개 제안: 연방 통신 위원회(FCC)는 AI 생성 콘텐츠를 정치 광고에서 공개하도록 요구했지만, 금지는 하지 않았습니다.
- 사용자의 목소리로 전화 응답: 널리 알려진 발신자 ID 서비스인 트루콜러는 곧 고객이 AI 기반 비서를 사용하여 자신의 목소리로 전화를 받을 수 있도록 할 예정입니다. 이는 마이크로소프트와의 새로운 파트너십 덕분입니다.
- 휴먼, 매각 고려: 지난 달 많은 관심을 받았던 AI 핀을 출시한 휴먼은 매수자를 찾고 있습니다. 이 회사는 7억 5천만 달러에서 10억 달러 사이의 가격을 제시했으며, 매각 절차는 초기 단계에 있습니다.
- 틱톡, 생성형 AI 활용: 틱톡은 화요일에 브랜드를 위한 새로운 틱톡 심포니 AI 스위트를 출시한다고 발표하면서 광고 사업에 생성형 AI를 통합한 최신 기술 회사입니다. 이 도구는 마케팅 담당자가 스크립트를 작성하고, 비디오를 제작하고, 기존 광고 자산을 개선하는 데 도움이 됩니다.
- 서울 AI 정상회담: 한국 서울에서 열린 AI 안전 정상회담에서 정부 관계자와 AI 업계 임원들은 빠르게 변화하는 분야에 기본적인 안전 조치를 적용하고 국제 안전 연구 네트워크를 구축하기로 합의했습니다.
- **마이크로소프트의 AI PC:** 마이크로소프트는 이번 주 연례 빌드 개발자 컨퍼런스에서 키노트 연설을 통해 코파일럿+ PC라고 불리는 새로운 라인업의 윈도우 머신(및 서피스 랩탑)과 사용자가 과거에 본 앱, 파일 및 기타 콘텐츠를 찾는 데 도움이 되는 리콜과 같은 생성형 AI 기반 기능을 공개했습니다.
- **오픈AI의 음성 논란:** 오픈AI는 ChatGPT의 텍스트 음성 변환 기능에서 하나의 음성을 제거하고 있습니다. 사용자들은 스카이라는 이름의 음성이 스칼렛 요한슨(이전에 AI 캐릭터를 연기한 적이 있음)과 매우 흡사하다는 것을 알아챘습니다. 요한슨 본인도 스카이 음성에 대해 문의하고 개발 방법에 대한 정확한 정보를 얻기 위해 법률 자문을 고용했다는 성명을 발표했습니다.
- **영국의 자율 주행 법률:** 영국의 자율 주행 자동차 규정은 왕실 재가를 받아 공식화되었습니다. 이는 법률로 제정되기 전에 모든 법안이 거쳐야 하는 최종 절차입니다.
더 많은 머신러닝
이번 주에 AI와 관련된 몇 가지 흥미로운 연구를 소개합니다. 워싱턴 대학교의 다작 연구자인 샤얌 콜라코타는 듣고 싶은 사람의 목소리만 들을 수 있도록 모든 소리를 차단하는 소음 제거 헤드폰을 개발했습니다. 헤드폰을 착용한 상태에서 버튼을 누르고 사람을 바라보면 특정 방향에서 나오는 목소리를 샘플링하여 청각 배제 엔진을 구동하여 배경 소음과 다른 목소리를 걸러냅니다.
콜라코타와 여러 대학원생이 이끄는 연구자들은 이 시스템을 타겟 스피치 히어링이라고 부르며 지난 주 호놀룰루에서 열린 컨퍼런스에서 발표했습니다. 접근성 도구와 일상적인 옵션으로 유용하게 사용할 수 있는 이 기능은 대형 기술 회사들이 차세대 하이엔드 헤드폰에 도입할 만한 기능입니다.
EPFL의 화학자들은 특히 18가지 작업을 수행하는 데 지쳐서 ChemCrow라는 모델을 훈련하여 대신 수행하도록 했습니다. 실제로 적정 및 피펫팅과 같은 작업이 아니라 문헌을 검색하고 반응 사슬을 계획하는 작업과 같은 계획 작업입니다. 물론 ChemCrow는 연구자들을 위해 모든 작업을 수행하는 것이 아니라 자연어 인터페이스 역할을 하며 필요에 따라 검색 또는 계산 옵션을 사용합니다.
이미지 출처: EPFL
ChemCrow를 선보이는 논문의 주 저자는 이 모델이 “계산기와 데이터베이스에 접근할 수 있는 인간 전문가” – 즉 대학원생과 유사하다고 말했습니다. 희망적으로 그들은 더 중요한 일을 하거나 지루한 부분을 건너뛸 수 있을 것입니다. Coscientist를 약간 떠올리게 합니다. 이름에 대해 말하자면, “까마귀는 도구를 잘 사용하는 것으로 알려져 있기 때문입니다.” 꽤 괜찮네요!
디즈니 연구 로봇 과학자들은 모든 움직임을 일일이 수동으로 애니메이션할 필요 없이 로봇의 움직임을 더 사실적으로 만들기 위해 열심히 노력하고 있습니다. 7월에 SIGGRAPH에서 발표할 새로운 논문은 절차적으로 생성된 애니메이션과 그것을 조정하기 위한 아티스트 인터페이스를 결합하여 실제 이족 보행 로봇(그루트)에서 작동하는 것을 보여줍니다.
아이디어는 아티스트가 움직임 유형 – 튀어 오르는, 뻣뻣한, 불안정한 –을 만들 수 있고, 엔지니어는 모든 세부 사항을 구현할 필요 없이 특정 매개변수 내에 있는지 확인하면 됩니다. 그런 다음 제안된 시스템은 본질적으로 정확한 움직임을 즉흥적으로 연주하여 실시간으로 수행할 수 있습니다. 몇 년 후 디즈니 월드에서 이를 볼 수 있을 것으로 예상됩니다…