스노우플레이크 데이터 클라우드, 다중 모달 대형 언어 모델(LLM) 통합 확대
스노우플레이크 데이터 클라우드가 스리다르 라마스와미의 주도로 다중 모달 대형 언어 모델(LLM)을 통합하여 능력을 확장하고 있습니다. 이 회사는 DeepMind, Google, Meta 출신의 연구원들이 설립한 AI 스타트업 Reka와 협력하여 자사의 독창적인 모델을 스노우플레이크 데이터 플랫폼에 통합하고 있습니다. 이번 협력은 스노우플레이크의 최근 Mistral과의 파트너십에 이어 진행되며, 데이터 클라우드를 사용하는 기업들이 텍스트, 이미지, 비디오를 처리할 수 있는 생성 AI 애플리케이션을 개발할 수 있도록 합니다. 이를 통해 팀들은 데이터셋에서 새로운 통찰을 얻을 수 있는 길이 열립니다.
스노우플레이크는 지난해 Reka의 6천만 달러 투자 라운드에 참여했지만, 이번 파트너십을 통해 투자를 늘릴지 여부는 확인하지 않았습니다. 스노우플레이크 AI의 제품 관리 책임자 바리스 굴테킨은 회사가 파트너를 지원하고 고객 혁신을 강화하기 위해 지속적으로 노력하고 있다고 밝혔지만, 투자에 관한 구체적인 내용은 공개되지 않았습니다.
스노우플레이크 코르텍스에서 Reka Flash 및 Core 소개
스노우플레이크는 출시 이후 고객을 위한 선호 데이터 인프라로 자리매김하는 것을 목표로 해왔습니다. 처음에는 기본 데이터 웨어하우스를 제공하였으나, 다양한 데이터 형식과 기능을 지원하도록 발전하여 AI 및 분석 애플리케이션에 최적화된 종합 데이터 클라우드로 진화했습니다.
급증하는 생성 AI 시장에 대응하기 위해, 스노우플레이크는 LLM 애플리케이션 개발을 위한 완전 관리형 서비스인 스노우플레이크 코르텍스를 도입했습니다. 코르텍스는 기업들이 안전하게 데이터를 분석하며 특정 비즈니스 요구에 맞는 애플리케이션을 개발할 수 있도록 오픈소스 LLM을 포함한 AI 빌딩 블록을 제공합니다.
스노우플레이크는 초기에는 감정 분석과 같은 특화된 LLM에 중점을 두었지만, 이제 Reka의 두 가지 모델인 Flash와 Core로 범위를 확장하고 있습니다. Reka Flash는 210억 개의 파라미터를 가진 최첨단 모델로, 언어 및 비전 기준에서 더 큰 모델과 유사한 성능을 제공합니다. 반면, Core는 Reka의 가장 큰 모델로 GPT-4 및 Gemini Ultra와 유사한 성능을 보이지만 현재 공개되지 않았습니다.
스노우플레이크는 Flash 모델을 코르텍스에 즉시 통합할 계획이며, Core 모델은 향후 출시를 위해 개발 중입니다. 굴테킨은 일정은 제공하지 않았지만, 조만간 사용할 수 있을 것이며, 수요에 따라 다른 Reka 모델 추가 가능성도 언급했습니다.
스노우플레이크 사용자에게 다중 모달 AI의 이점
코르텍스와 Reka의 AI 모델 통합으로, 스노우플레이크 사용자들은 텍스트, 이미지, 비디오를 처리할 수 있는 생성 AI 애플리케이션을 개발할 수 있습니다. 이 기능은 비디오 자막 생성, 이미지 태그 지정, 전자상거래를 위한 제품 설명 생성, 그래픽 데이터 분석 등 다양한 애플리케이션을 지원합니다.
굴테킨은 차트를 해석하는 챗봇과 영상 및 이미지 자산을 활용한 엔터테인먼트 기업의 마케팅 콘텐츠 생성 등 여러 잠재적 애플리케이션을 강조했습니다. Reka 모델을 활용하는 기업 수는 공개하지 않았지만, 400개 이상의 기업이 코르텍스와 호스팅된 모델을 사용하여 생성 AI 애플리케이션을 개발 중이라고 밝혔습니다. 이러한 애플리케이션은 서비스 티켓의 보안 취약점 식별부터 보험 데이터로 의료 제공자 간 커뮤니케이션 개선에 이릅니다.
Reka 모델 추가로 코르텍스에서 사용할 수 있는 LLM의 총 수는 Mistral 및 Google에서 최근 도입된 모델과 함께 12개로 증가합니다.
굴테킨은 스노우플레이크의 AI 혁신 파이프라인이 "고속 진행 중"이라고 설명하며 모든 사용자가 AI를 활용해 빠르게 의미 있는 비즈니스 성과를 창출하도록 하고 싶다는 목표를 밝혔습니다. 그는 6월 연례 회의 전에 추가 AI 발전에 대한 발표가 있을 것이라고 힌트를 주었습니다.
"우리의 로드맵은 효과적인 AI 전략이 강력한 데이터 전략에 기반해야 한다는 원칙을 반영합니다. 데이터는 AI의 연료입니다. 우리는 스노우플레이크의 안전하고 신뢰할 수 있는 데이터 기반 위에 AI 및 ML 워크플로우에서 생산성, 협업 및 전반적인 효율성을 향상시키기 위해 최선을 다하고 있습니다."라고 굴테킨은 말했습니다.
눈여겨볼 점은, 데이터 생태계의 경쟁자인 Databricks가 유사한 접근 방식을 시행하고 있다는 것입니다. MosaicML 인수 이후, 이 회사는 생성 AI 애플리케이션 개발을 위한 오픈 모델과 개선된 도구를 도입했습니다. 최근에는 AI 훈련을 위한 비정형 데이터 분석 및 정제 전문 스타트업 Lilac을 인수했습니다.