독점: NinjaTech, GPU 대신 AWS 칩으로 구동되는 자율 AI 에이전트 출시

AWS의 클라우드 기능을 사용하는 NinjaTech의 AI 에이전트는 여러 작업을 동시에 수행하여 사용자 생산성을 크게 향상시킬 수 있습니다.

2024년 5월 21일 오후 7:23- 4달 전VENTUREBEAT.COM- Carl Franzen

독점: NinjaTech, GPU 대신 AWS 칩으로 구동되는 자율 AI 에이전트 출시

요약생성

바쁠 때는 리얼라이즈가 내용을 요약해 드려요.

2024년 5월 21일 오후 12:23

파란색 톤으로 사무직원의 책상 위로 뛰어넘는 닌자의 AI 그림

출처: VentureBeat, Midjourney V6으로 제작

실리콘 밸리에 기반을 둔 생성형 AI 회사인 NinjaTech AI가 연구원, 소프트웨어 엔지니어, 스케줄러/비서 등의 역할을 수행하도록 설계된 웹 애플리케이션인 새로운 AI 에이전트 서비스 Ninja AI의 공개 베타 출시를 발표했습니다. 사용자는 지금 바로 myninja.ai에서 직접 사용해 볼 수 있습니다.

이 서비스는 무료 등급과 유료 구독으로 운영됩니다. 유료 사용자의 경우 OpenAI의 GPT-4o, Anthropic의 Claude 3, Google Gemini를 포함한 여러 주요 생성형 AI 모델에 대한 액세스 권한을 애플리케이션 프로그래밍 인터페이스(API)를 통해 제공합니다.

Ninja의 에이전트는 Llama3 70B를 기반 모델로 학습된 NinjaLLM으로 구동됩니다. 또한 사용자는 OpenAI, Google, Anthropic의 다른 모델과 비교 및 대조하여 사용 가능한 최상의 답변을 찾을 수 있습니다.

GPT-4를 사용하여 여러 AI 모델의 결과를 실시간으로 비교(공통점 요약 및 차이점 표시), 사용자를 대신하여 캘린더 일정 예약 및 충돌 방지(Google 캘린더용 Google 계정으로 로그인해야 하며, 가까운 시일 내에 Apple iCal 통합이 로드맵에 예정됨),

또한 사람 수신자에게 자율적으로 초대 이메일을 보내고(에이전트가 자체 이메일 주소에서 직접 수행 가능), Unreal Engine으로 구동되는 3D 캐릭터를 통해 다양한 음성으로 사용자에게 말하고 화상 채팅까지 할 수 있습니다.

또한 Ninja AI는 이러한 여러 작업을 동시에 비동기적으로 수행할 수 있으며, 사용자가 Ninja AI 또는 기기의 다른 곳에서 다른 작업을 수행하는 동안 백그라운드에서 작동합니다.

작업이 완료되면 서비스에서 사용자에게 알림을 보내고, 사용자는 사이드바를 클릭하여 각 워크플로우를 확인할 수 있습니다. 또한 ChatGPT 및 기타 일반 사용자를 대상으로 하는 AI 챗봇과 달리 사용자는 Ninja AI에 여러 요청을 한 번에 입력할 수 있으며 Ninja AI는 사용자가 요청한 순서대로 모든 요청을 처리하려고 시도합니다.

NinjaTech AI의 설립자 겸 CEO인 Babak Pahlavan은 VentureBeat와의 화상 채팅 인터뷰에서 “모든 것이 질문과 답변에 관한 것은 아닙니다.”라고 말했습니다. “특히 현실 세계에서는 소프트웨어뿐만 아니라 다른 사람과도 소통할 수 있는 인간 비서가 필요합니다.”

현재 Ninja AI에서 제공하는 5가지 주요 에이전트는 다음과 같습니다.

  • Ninja Advisor
  • Ninja Coder
  • Basic Scheduler
  • Real time Web Search
  • Limited third-party LLM access

유료 등급에서는 더 많은 작업 제공

Pahlavan의 말에 따르면 Ninja AI는 사용자에게 Advisor, Coder, Researcher, 타사 LLM에서 매일 최대 20개의 작업과 Scheduler 에이전트에서 매일 5개의 작업을 제공하는 “넉넉한” 무료 옵션을 제공하도록 설계되었습니다.

하지만 월 10달러, 20달러 또는 30달러를 기꺼이 지불하는 사용자는 그 결과 매일 및 매월 훨씬 더 많은 작업을 수행할 수 있습니다.

Pahlavan은 이전에 Google에서 10년 넘게 근무했으며, 다양한 엔터프라이즈 소프트웨어 분야를 총괄한 후 2022년에 제품 관리 담당 수석 이사로 재직했습니다.

Pahlavan은 VentureBeat에 “저는 아무리 똑똑해지더라도 질문과 답변 시스템을 뛰어넘는 무언가가 필요하다고 생각했습니다.”라고 말했습니다. “그리고 우리는 Google 내에서 거의 해냈습니다.”

그는 Google을 떠난 후 비영리 과학 연구 그룹인 SRI International에 상주 기업가로 합류했으며, 이곳에서 NinjaTech AI와 Ninja AI의 씨앗이 뿌려졌습니다.

Pahlavan의 공동 설립자로는 Meta의 AI 시스템 엔지니어링 책임자였던 Sam Naghshineh가 있으며, 그는 현재 NinjaTech의 최고 기술 책임자(CTO)를 맡고 있습니다. 두 사람은 Pahlavan과 함께 NinjaTech에 대한 아이디어를 떠올렸습니다.

Pahlavan의 가까운 친구이자 Amazon Web Services(AWS)의 선임 응용 과학자였던 Arash Sadrieh가 나중에 합류하여 현재 NinjaTech의 최고 과학 책임자를 맡고 있습니다.

Pahlavan은 “우리는 기본적으로 Google, AWS, Meta에서 글로벌 환경에서 대규모 소프트웨어 시스템을 구축하는 방법에 대해 배운 모든 것을 하나로 모으고 있습니다.”라고 말했습니다.

NinjaTech AI 공동 설립자 사진(왼쪽부터): Arash Sadrieh, Babak Pahlavan, Sam Naghshineh. 출처: NinjaTech AI

여러 AI 모델을 하나의 지붕 아래에서 작동시키려는 야심찬 목표

목표는 바쁜 전문 소비자(프로슈머)가 새로운 모델 형태의 이론적인 미래의 혁신을 기다릴 필요 없이 지금 바로 AI를 최대한 활용할 수 있도록 서비스를 제공하는 것입니다.

Pahlavan은 “Advisor 에이전트는 수천 건의 사람과의 다중 라운드 대화를 통해 학습되었습니다.”라고 설명했습니다. “따라서 사려 깊고, 친절하고, 깔끔하고, 전문적이며, 업무 환경에 적합하도록 설계되었습니다.”

또한 Ninja AI는 사용자가 여러 AI 모델을 하나의 가상 공간에서 동시에 활용할 수 있도록 설계되었으므로 여러 모델을 수동으로 열고 탭을 전환할 필요가 없습니다.

Pahlavan은 “회사의 핵심 역량은 복잡한 작업을 세분화하고, 동적으로 계획을 수립한 다음, 실시간으로, 작업이 완료될 때까지 비동기적으로 또는 차단되어 사용자에게 질문이 있을 때까지 해당 작업을 실행하기 위해 마음대로 사용할 수 있는 도구를 활성화할 수 있는 에이전트에 관한 것입니다.”라고 말했습니다.

AWS 실리콘으로 구동

흥미롭게도 NinjaTech AI는 Nvidia의 주요 생성형 AI 칩인 그래픽 처리 장치(GPU) 대신 파트너인 TSMC(Taiwan Semiconductor Manufacturing Company)에서 제조한 Amazon Web Services(AWS) 맞춤형 머신 러닝 칩을 사용합니다.

NinjaTech는 이러한 칩인 Trainium 및 Inferentia2와 Amazon의 클라우드 기반 머신 러닝 서비스인 Amazon SageMaker를 사용하여 AI 에이전트를 구축, 학습 및 확장하고 젊은 스타트업의 비용을 증가시키지 않고 여러 작업을 동시에 수행할 수 있도록 했습니다.

Pahlavan은 “모든 모델은 AWS Trainium 칩을 사용하여 학습되고 AWS Inferentia2를 통해 제공되며 모든 오케스트레이션은 Amazon SageMaker를 사용하여 수행됩니다.”라고 말했습니다.

AWS의 제품 관리 이사인 Rahul Kulkarni는 VentureBeat와의 화상 통화 인터뷰에서 이번 협업의 이점에 대해 언급하면서 맞춤형 실리콘이 Amazon Sagemaker에서 가장 잘 작동하도록 지원 및 설계되었다고 강조했습니다.

Kulkarni는 “실리콘을 제공하는 것뿐만 아니라 NinjaTech와 같은 회사에서 사용할 수 있도록 소프트웨어 기능에 적합한 프레임워크를 제공하는 것입니다.”라고 말했습니다.

하지만 Inferentia2 칩은 비슷한 Nvidia GPU보다 얼마나 저렴할까요? AWS는 고객이 동등한 성능당 최대 40%까지 저렴한 가격을 기대할 수 있다고 말합니다.

매우 까다롭고 계산 집약적인 작업의 경우 GPU가 여전히 해결책이며 AWS는 탄력적인 클라우드(EC2) 서비스를 통해 GPU도 제공합니다.

Kulkarni는 “Nvidia와의 파트너십은 계속해서 번창하고 있으며 우리는 가장 최신 인프라를 대규모로 제공할 것입니다.”라고 말했습니다. “하지만 우리에게 있어 맞춤형 실리콘 이니셔티브도 마찬가지로 중요합니다.”

NinjaTech AI는 Google, AWS, Meta 출신의 전문가 팀을 통해 사용자가 시간이 많이 소요되는 작업을 AI 에이전트에게 위임하여 보다 전략적인 활동에 집중할 수 있도록 함으로써 생산성을 재정의하는 것을 목표로 합니다.