요약생성
바쁠 때는 리얼라이즈가 내용을 요약해 드려요.
엔비디아는 새로운 GeForce RTX AI 노트북에서 실행되는 AI 어시스턴트와 디지털 휴먼에 성능을 제공하는 새로운 RTX 기술을 공개했습니다.
이 대형 AI 및 그래픽 기술 회사는 PC 게임 및 앱에 문맥 인식 도움말을 제공하는 RTX 기반 AI 어시스턴트 기술 데모인 프로젝트 G-Assist를 공개했습니다. 프로젝트 G-Assist 기술 데모는 Studio Wildcard의 ARK: Survival Ascended와 함께 처음 공개되었습니다.
엔비디아는 또한 Nvidia Ace 디지털 휴먼 플랫폼을 위한 최초의 PC 기반 Nvidia NIM(Nvidia Inference Microservices)을 선보였습니다. 엔비디아는 대만에서 열린 Computex 트레이드쇼에서 CEO 젠슨 황의 기조연설 중에 이러한 발표를 했습니다.
이러한 기술은 개발자가 Windows PC에서 대규모 생성형 AI 모델을 최적화하고 배포할 수 있도록 지원하는 새로운 도구 및 SDK 제품군인 Nvidia RTX AI 툴킷을 통해 구현됩니다. 이러한 기술은 500개 이상의 PC 애플리케이션과 게임, 200개 이상의 OEM 노트북 디자인을 가속화하는 엔비디아의 풀스택 RTX AI 혁신에 합류합니다. 엔비디아는 데이터센터, 엣지, 가정에서 전 세계에 AI를 확산시키기 위해 노력하고 있습니다.
또한 ASUS 및 MSI에서 새롭게 발표한 RTX AI PC 노트북은 최대 GeForce RTX 4070 GPU와 Windows 11 AI PC 기능을 갖춘 전력 효율적인 시스템온칩을 탑재하고 있습니다.
엔비디아의 소비자 AI 부문 부사장인 제이슨 폴은 성명을 통해 “엔비디아는 2018년 RTX Tensor Core GPU 및 DLSS 기술을 출시하면서 AI PC 시대를 열었습니다.”라며 “이제 프로젝트 G-Assist 및 Nvidia ACE를 통해 1억 명이 넘는 RTX AI PC 사용자를 위한 차세대 AI 기반 경험의 문을 열고 있습니다.”라고 말했습니다.
GeForce AI Assistant, 프로젝트 G-Assist
AI 어시스턴트는 게임 전략 제안 및 멀티플레이어 리플레이 분석부터 복잡한 크리에이티브 워크플로우 지원에 이르기까지 게임 및 앱 내 경험을 혁신할 준비가 되어 있습니다. 프로젝트 G-Assist는 이러한 미래를 엿볼 수 있는 기회를 제공합니다.
PC 게임은 방대한 세계를 탐험하고 복잡한 메커니즘을 마스터할 수 있는 기회를 제공하지만, 가장 열성적인 게이머에게도 어렵고 시간이 많이 걸리는 일입니다. 프로젝트 G-Assist는 생성형 AI를 사용하여 플레이어가 게임 지식을 손쉽게 얻을 수 있도록 지원하는 것을 목표로 합니다.
프로젝트 G-Assist는 플레이어의 음성 또는 텍스트 입력과 게임 화면의 상황 정보를 가져와 AI 비전 모델을 통해 데이터를 실행합니다. 이러한 모델은 게임 지식 데이터베이스에 연결된 대규모 언어 모델(LLM)의 상황 인식 및 앱별 이해도를 향상시킨 다음 텍스트 또는 음성으로 전달되는 맞춤형 응답을 생성합니다.
엔비디아는 Studio Wildcard와 협력하여 ARK: Survival Ascended에서 이 기술을 시연했습니다. 프로젝트 G-Assist는 생물, 아이템, 지식, 목표, 어려운 보스 등에 대한 질문에 답변할 수 있습니다. 프로젝트 G-Assist는 컨텍스트를 인식하기 때문에 플레이어의 게임 세션에 맞춰 응답을 개인화합니다.
또한 프로젝트 G-Assist는 최적의 성능과 효율성을 위해 플레이어의 게임 시스템을 구성할 수 있습니다. 성능 지표에 대한 인사이트를 제공하고, 사용자의 하드웨어에 따라 그래픽 설정을 최적화하고, 안전한 오버클럭을 적용하고, 심지어 성능 목표를 유지하면서 지능적으로 전력 소비를 줄일 수도 있습니다.
최초의 ACE PC NIM 데뷔
디지털 휴먼에 성능을 제공하는 Nvidia ACE 기술이 NVIDIA NIM과 함께 RTX AI PC 및 워크스테이션에 적용됩니다. NVIDIA NIM은 개발자가 배포 시간을 몇 주에서 몇 분으로 단축할 수 있는 추론 마이크로서비스입니다. ACE NIM은 자연어 이해, 음성 합성, 얼굴 애니메이션 등을 위해 장치에서 로컬로 실행되는 고품질 추론을 제공합니다.
Computex에서는 Inworld AI와 공동 개발한 Covert Protocol 기술 데모에서 PC에서 Nvidia ACE NIM을 게임에 처음으로 선보입니다. 이제 NVIDIA Audio2FaceTM 및 NVIDIA Riva 자동 음성 인식이 장치에서 로컬로 실행되는 모습을 보여줍니다.
Windows Copilot 런타임, 로컬 PC SLM을 위한 GPU 가속 추가 Microsoft와 NVIDIA는 개발자가 Windows 네이티브 및 웹 앱에 새로운 생성형 AI 기능을 도입할 수 있도록 협력하고 있습니다. 이러한 협력을 통해 애플리케이션 개발자는 Windows Copilot 런타임으로 구동되는 장치에서 실행되는 검색 증강 생성(RAG) 기능을 구현하는 GPU 가속 소형 언어 모델(SLM)에 애플리케이션 프로그래밍 인터페이스(API)를 통해 쉽게 액세스할 수 있습니다.
SLM은 콘텐츠 요약, 콘텐츠 생성, 작업 자동화를 포함하여 Windows 개발자에게 엄청난 가능성을 제공합니다. RAG 기능은 기본 모델에 잘 표현되지 않은 도메인별 정보에 대한 액세스 권한을 AI 모델에 제공하여 SLM을 강화합니다. RAG API를 통해 개발자는 애플리케이션별 데이터 소스를 활용하고 애플리케이션 요구 사항에 맞게 SLM 동작 및 기능을 조정할 수 있습니다.
이러한 AI 기능은 Nvidia RTX GPU와 다른 하드웨어 공급업체의 AI 가속기로 가속화되어 최종 사용자에게 광범위한 Windows 생태계에서 빠르고 즉각적으로 반응하는 AI 경험을 제공합니다.
이 API는 올해 하반기에 개발자 프리뷰로 공개될 예정입니다.
RTX AI 툴킷으로 더 빠르고 작아진 모델
AI 생태계는 앱 개발자가 활용할 수 있도록 수십만 개의 오픈소스 모델을 구축했지만, 대부분의 모델은 일반적인 용도로 사전 학습되었으며 데이터센터에서 실행되도록 구축되었습니다.
개발자가 PC에서 실행되는 애플리케이션별 AI 모델을 구축할 수 있도록 엔비디아는 RTX AI PC에서 모델 사용자 지정, 최적화 및 배포를 위한 도구 및 SDK 제품군인 RTX AI 툴킷을 출시합니다. RTX AI 툴킷은 6월에 더 많은 개발자가 이용할 수 있도록 제공될 예정입니다.
개발자는 오픈소스 QLoRa 도구를 사용하여 사전 학습된 모델을 사용자 지정할 수 있습니다. 그런 다음 Nvidia TensorRT 모델 최적화 프로그램을 사용하여 RAM 사용량을 최대 3배까지 줄이도록 모델을 양자화할 수 있습니다. 그런 다음 Nvidia TensorRT Cloud는 RTX GPU 라인업에서 최고의 성능을 발휘하도록 모델을 최적화합니다. 그 결과 사전 학습된 모델에 비해 최대 4배 빠른 성능을 제공합니다.
현재 조기 액세스로 제공되는 Nvidia AI Inference Manager(AIM) 소프트웨어 개발 키트(SDK)는 PC와 클라우드에서 AI 추론을 원활하게 조율하여 PC 애플리케이션 개발자의 AI 통합 복잡성을 단순화합니다. 또한 통합 NIM 형식으로 필요한 AI 모델, 엔진 및 종속성을 사용하여 PC를 사전 구성하고 GPU, NPU, CPU를 포함한 다양한 프로세서에서 TensorRT, DirectML, Llama.cpp, PyTorch-CUDA를 포함한 모든 주요 추론 백엔드를 지원합니다.
Adobe, Blackmagic Design, Topaz와 같은 소프트웨어 파트너는 RTX AI PC에서 AI 성능을 가속화하기 위해 널리 사용되는 크리에이티브 앱에 RTX AI 툴킷의 구성 요소를 통합하고 있습니다.
Adobe의 Creative Cloud 제품 마케팅 부사장인 디파 수브라마니안은 성명을 통해 “Adobe와 엔비디아는 비디오, 이미징, 디자인, 3D 등 모든 크리에이티브 워크플로우에서 획기적인 고객 경험을 제공하기 위해 계속해서 협력하고 있습니다.”라며 “RTX PC의 TensorRT 10.0은 크리에이터, 디자이너, 개발자에게 전례 없는 성능과 AI 기반 기능을 제공하여 Photoshop과 같은 업계 최고의 크리에이티브 도구에서 콘텐츠 제작을 위한 새로운 창의적 가능성을 열어줍니다.”라고 말했습니다.
TensorRT-LLM과 같은 RTX AI 툴킷의 구성 요소는 Automatic1111, ComfyUI, Jan.AI, Langchain, LlamaIndex, Oobabooga, Sanctum.AI를 포함한 생성형 AI를 위한 널리 사용되는 개발자 프레임워크 및 애플리케이션에 통합되어 있습니다.
콘텐츠 제작을 위한 AI
엔비디아는 또한 크리에이터, 모더, 비디오 애호가를 위한 앱에 RTX AI 가속을 통합하고 있습니다.
작년에 엔비디아는 가장 인기 있는 Stable Diffusion 사용자 인터페이스 중 하나인 Automatic1111\에 TensorRT를 사용하는 RTX 가속을 도입했습니다. 이번 주부터는 RTX가 인기 있는 ComfyUI도 가속화하여 현재 출시된 버전보다 최대 60% 향상된 성능과 MacBook Pro M3 Max에 비해 7배 빠른 성능을 제공합니다.
Nvidia RTX Remix는 전체 레이 트레이싱, NVIDIA DLSS 3.5 및 물리적으로 정확한 머티리얼을 사용하여 클래식 DirectX 8 및 DirectX 9 게임을 리마스터링하기 위한 모딩 플랫폼입니다. RTX Remix에는 런타임 렌더러와 게임 에셋 및 머티리얼 모딩을 용이하게 하는 RTX Remix 툴킷 앱이 포함되어 있습니다.
작년에 엔비디아는 RTX Remix 런타임을 오픈소스로 만들어 모더가 게임 호환성을 확장하고 렌더링 기능을 발전시킬 수 있도록 했습니다.
올해 초 RTX Remix 툴킷이 출시된 이후 20,000명의 모더가 이 툴킷을 사용하여 클래식 게임을 모딩했으며, 그 결과 RTX Remix Showcase Discord에서 130개 이상의 RTX 리마스터가 개발 중입니다.
이번 달에 엔비디아는 RTX Remix 툴킷을 오픈소스로 만들어 모더가 에셋 교체 및 장면 재조명 방식을 간소화하고, RTX Remix의 에셋 수집기에서 지원되는 파일 형식을 늘리고, 새로운 모델로 RTX Remix의 AI 텍스처 도구를 강화할 수 있도록 지원할 예정입니다.
또한 엔비디아는 RTX Remix 툴킷의 기능을 REST API를 통해 액세스할 수 있도록 하여 모더가 Blender와 같은 디지털 콘텐츠 제작 도구, Hammer와 같은 모딩 도구, ComfyUI와 같은 생성형 AI 앱에 RTX Remix를 라이브 링크할 수 있도록 지원합니다. 또한 엔비디아는 RTX Remix 런타임용 SDK를 제공하여 모더가 DirectX 8 및 9 클래식 게임 외에 다른 애플리케이션과 게임에도 RTX Remix의 렌더러를 배포할 수 있도록 지원합니다.
RTX Remix 플랫폼의 더 많은 부분이 오픈소스로 제공됨에 따라 전 세계의 모더는 더욱 놀라운 RTX 리마스터를 만들 수 있습니다.
Google Chrome, Microsoft Edge, Mozilla Firefox 브라우저에서 지원되는 인기 있는 AI 기반 초고해상도 기능인 Nvidia RTX Video가 이제 모든 개발자가 사용할 수 있는 SDK로 제공되어 업스케일링, 선명화, 압축 아티팩트 감소, HDR(High Dynamic Range) 변환을 위한 AI를 기본적으로 통합할 수 있도록 지원합니다.
곧 비디오 편집 소프트웨어인 Blackmagic Design의 DaVinci Resolve 및 Wondershare Filmora에 적용될 예정인 RTX Video를 통해 비디오 편집자는 저품질 비디오 파일을 4K 해상도로 업스케일링하고 SDR(Standard Dynamic Range) 소스 파일을 HDR로 변환할 수 있습니다. 또한 무료 미디어 플레이어인 VLC 미디어는 기존의 초고해상도 기능에 RTX Video HDR을 곧 추가할 예정입니다.