요약생성
바쁠 때는 리얼라이즈가 내용을 요약해 드려요.
기업의 지식 라이브러리에 AI를 학습시키는 데 있어서 중요한 정보가 실수로 누락될 수 있다는 것이 현실입니다. 이미지, 비디오, 문서, 스프레드시트를 업로드하여 모델을 학습시키는 것은 쉽지만 청구서, 이메일, PDF와 같은 다른 비정형 데이터 유형은 어떨까요? 이러한 파일을 검색 가능한 것으로 변환할 수는 있지만 수동으로 이루어지며 시간이 많이 걸립니다. 엔지니어링 팀에 필요한 머신러닝 기능이 없을 수도 있습니다.
그러나 한 회사는 조직이 찾고 있는 솔루션을 가지고 있다고 믿습니다. Antonio Bustamante와 Upal Saha가 설립한 Bem은 개발자가 구조화되었든 비구조화되었든 모든 입력을 모든 데이터 형태로 변환하는 데 사용할 수 있는 API를 제공하는 AI 데이터 인터페이스 회사입니다. 이 스타트업은 이러한 미션을 지원하기 위해 Uncork Capital이 주도하는 시드 펀딩으로 370만 달러를 모금했습니다. Lookout의 설립자인 Kevin Mahaffey, Roar Ventures, Y Combinator의 Garry Tan과 같은 엔젤 투자자도 참여했습니다.
Bustamante는 성명에서 “엔지니어링 팀은 시간의 약 44%를 데이터 파이프라인을 구축한 다음 모니터링하고 유지 관리하는 데 사용합니다.”라고 말했습니다. “Bem은 본질적으로 AI 데이터 인터페이스로서 상호 운용성과 통합의 범위를 재정 تعریف하여 이러한 팀의 시간과 좌절감을 줄여 제품에 진정으로 중요한 것에 집중할 수 있도록 합니다. 우리의 목표는 엔지니어가 통합이나 데이터 수집 파이프라인에 대해 다시는 걱정하지 않도록 하는 것입니다. 우리는 엔지니어가 사용자에게 가치 있는 작업에 집중하기를 바랍니다.”
서비스로서의 구조화된 데이터 구축
엔지니어를 대상으로 하는 Bem은 사용하기 쉽고 교육이나 구성이 필요하지 않습니다. 개발자는 회사의 API를 사용하여 정보를 전송하기 전에 원하는 데이터 형태나 스키마를 지정할 수 있습니다. Bustamante는 이를 Stripe가 구현하기 쉬운 순수 API로 시작한 방법과 비교합니다.
이미지 출처: Bem
일회성 서비스도 아닙니다. “brilliant enterprise magic”의 약자인 Bem은 조직에서 Bem으로, 다시 Bem에서 조직으로 전송되는 데이터 파이프라인입니다. “고객은 파이프라인을 설정하고 매분, 매시간 수천 개의 데이터를 보냅니다. 연속적인 데이터 스트림입니다.”
어떤 면에서 엔지니어링 팀을 위한 서비스형 구조화된 데이터(SDaaS)를 제공합니다. Bustamante도 동의하는 부분입니다. “그렇게 표현하는 것이 좋습니다. [기업이] 우리에게 보내는 이러한 모든 입력은 믿을 수 없을 정도로 지저분합니다.”라고 VentureBeat와의 인터뷰에서 말했습니다. 우리 사용자에게 필요한 것은 내부 데이터 형태와 스키마처럼 보이는 모든 입력의 구조화된 버전입니다. 따라서 결국 우리는 그들에게 변환 구조화 서비스만 제공하는 것입니다.”
Bem은 자사 서비스에 엄청난 잠재력이 있다고 믿습니다. 사내 전문 지식이 부족할 뿐만 아니라 기업들은 Bustamante가 “발등에 떨어진 불”이라고 설명하는 문제에 대한 자체 솔루션을 개발하기에는 너무 바쁩니다.
“우리는 물류, 공급망, 건강 보험 분야에서 제품을 구축하는 소프트웨어 회사와 협력합니다. 시중에 나와 있는 대부분의 비정형 데이터를 정형 데이터로 변환하는 시스템은 문서 검토 워크플로우에 더 적합합니다. 많은 문서를 검토해야 하는 보험 회사가 있는 경우 우리는 소위 기본 요소입니다. 우리는 제품 구성 요소에 매우 가깝습니다. 따라서 이러한 유형의 기능을 최종 제품에 직접 통합하고 최종 사용자에게 공개하려는 경우 재무 제표 등을 검토하는 백오피스 프로세스에 더 적합한 다른 공급자 대신 당사를 사용하게 됩니다.”
이미지 출처: Bem
Bem은 스타트업이 미세 조정하고 학습시킨 기반 모델과 오픈 소스 모델의 조합을 기반으로 구축되었습니다. 또한 고객이 파이프라인을 더 자주 사용할수록 모델의 인텔리전스가 향상됩니다. 그러나 Bem은 고객 데이터에 대한 글로벌 모델을 학습시키지 않으므로 모든 것이 서로 격리됩니다. “고객이 얻는 이러한 작은 모델은 학습을 받습니다. 각 고객에 대해서만 학습을 받습니다. 우리는 서로 다른 모델 간에 데이터를 공유하지 않습니다.”
시장 진출을 위한 자본 조달
Bem은 출시되었지만 비공개 베타를 통해 액세스할 수 있습니다. Bustamante는 현재 10개의 초기 고객이 제품을 사용하고 있으며 스타트업은 시리즈 C와 공개 단계 사이의 조직을 목표로 하고 있다고 말합니다. 그는 회사가 시리즈 C에 도달하면 이 문제가 “믿을 수 없을 정도로 분명해진다”고 생각합니다. 또한 Bustamante는 물류, 공급망, 의료 및 보험 분야의 사람들이 “이러한 고통을 가장 많이 겪는” 4가지 산업이라고 강조합니다.
스타트업이 받은 370만 달러는 Bem의 플랫폼을 더욱 발전시키는 데 사용될 것입니다. 특히 엔지니어링 팀, 연구 개발 및 제품 개선에 투자할 계획입니다.
“저는 모든 회사가 해야 하고 일반적으로 제대로 하지 못하는 일을 맡아 생산성을 높이고 서비스로 제공하는 회사를 좋아합니다.”라고 Uncork Capital의 매니징 파트너인 Andy McLoughlin은 VentureBeat에 말했습니다. “제가 함께 일했던 모든 회사는 항상 지저분한 데이터 수집과 관련하여 몇 가지 문제를 겪었습니다. 보험, 물류 또는 농업 분야에서 일하는 일부 회사의 경우 더욱 두드러지지만 모든 회사에 이러한 문제가 있습니다. 그리고 지금 현재 상태는 무엇이든 들어오면 누군가가 수동으로 검토해야 한다는 것입니다. 자동으로 처리되는 것이 있으면 당연한 일입니다.”
그는 Bem이 하고 있는 일이 데이터의 민주화와 데이터의 힘이라고 믿습니다. 대부분 Bem이 제공하는 것처럼 데이터를 변환할 수 있는 인프라와 기능을 갖춘 것은 전 세계의 대형 기술 회사뿐이었습니다. “우리가 투자한 모든 종류의 개발자 인프라, 개발자 도구 및 회사에서 보아온 것은 그들이 자신과 비슷해 보이는 회사에 판매하는 것에서 부모님이 들어봤을 법한 회사에 판매하는 것으로 도약할 때입니다. 그때가 바로 여러분이 그것을 제대로 해내고 있다는 것을 알게 되는 때입니다. 왜냐하면 이러한 모든 회사는 더 잘하고 싶어하고, 더 잘 만들고 싶어하고, Facebook과 같은 방식으로 소프트웨어를 만들고 싶어하기 때문입니다. 하지만 그렇게 하려면 도구가 필요합니다. 그리고 그것이 바로 우리가 투자하고 싶어하는 것입니다.”
경쟁업체 목록에 이름을 올리는 것을 자랑스럽게 여기는 Bem의 CEO는 Unstructured를 언급했습니다. 그러나 그는 Unstructured가 다른 고객 기반에 중점을 두고 문서만 다룬다고 말했습니다. 하지만 Bem의 가장 큰 경쟁자는 아마도 현 상태, 즉 이러한 기능을 사내에서 구축하려는 회사일 것입니다. “다행히도 우리에게는 많은 고객이 실제로 그렇게 하고 싶어하지 않습니다. 그리고 스스로 이것을 구축하기 시작하는 사람들 중 일부는 처음 생각했던 것보다 훨씬 더 많은 비용이 든다는 것을 깨닫습니다.”
Bem은 아직 가격을 공식화하지 않았으며 현재 “사례별로” 이루어지고 있으며 회사는 전송된 각 데이터를 측정하여 이를 중심으로 비용 계획을 설계합니다. Bustamante는 향후 몇 개월 동안 가격 구조를 표준화하여 “매우 구체적이고 눈에 띄도록” 하고 “해결하는 데 비용이 많이 드는 문제이기 때문에” 최소 25~30배의 ROI를 제공하기를 희망한다고 말합니다.
평가액은 공개되지 않았습니다.