モンタナ州に拠点を置くデータサービスおよびクラウドストレージプロバイダーのSnowflakeは、データクラウドに大規模言語モデル(LLM)を統合した完全マネージドサービス「Cortex」を発表しました。これは、年次イベント「Snowday」で明らかにされたもので、Snowflakeのデータクラウドを利用する企業に向けて、データ分析やビジネス特有のアプリケーション開発を支援する一連のAIツールが提供されます。
SnowflakeのAI担当上級副社長、スリダール・ラマスワミは、「Snowflake Cortexを用いることで、企業は大規模言語モデルを迅速に活用でき、数分でカスタムLLM搭載アプリケーションを構築し、自社のデータに対する柔軟性と制御を維持できます。これにより、生成的AIがビジネス成長に役立つ新しい形を提供します」と述べました。
Cortexは今日からプライベートプレビューで利用可能で、データクラウド内の特定機能を強化するタスク特化型モデルのスイートが含まれています。Snowflakeは、このサービスを生成的AIツールの中核である「Snowflake Copilot」、「Universal Search」、「Document AI」に活用する予定です。
Cortexを使ったLLMアプリケーションの構築
企業が生成的AIの導入に意欲的である一方で、専門的な人材が必要な技術導入の複雑さに直面しています。Snowflake Cortexは、このプロセスを簡素化することを目指しています。このサービスでは、ユーザーがサーバーレスのAI機能を幅広く利用でき、SQLやPythonのシンプルな呼び出しで機能的なAIアプリケーションを開始できます。
Cortexの機能は、特定の分析タスクを自然言語入力で実行するための言語および機械学習モデルを活用しています。たとえば、これらのモデルは質疑応答、データ要約、言語翻訳、提供されたデータに基づく予測、異常検出などをサポートします。さらに、一般的な機能では、開発者はLlama 2のようなオープンソースLLMや、テキスト入力をSQLに変換してデータをクエリするSnowflake独自のモデルなど、多様なモデルを利用できます。
重要なのは、これらの一般機能にはベクトル埋め込みや検索機能が含まれており、ユーザーは自身のデータに基づいて応答を文脈化し、さまざまなユースケースに特化したカスタマイズ可能なアプリケーションを作成できます。
「ユーザーはリソースを準備する必要がありません。私たちが準備とデプロイを担います。これはOpenAIの提供に似ていますが、Snowflake内で完結します。お客様のデータは分離されており、安全です」とラマスワミは補足しました。また、広範なプログラミングスキルは必要なく、SQL内で作業が可能です。
CortexによるネイティブLLM体験
Cortexはまだ発表されたばかりですが、すでにプラットフォーム向けの三つの新機能(Snowflake Copilot、Universal Search、Document AI)がプライベートプレビューで強化されています。Snowflake Copilotは、ユーザーがデータに関する質問を自然言語で行い、SQLクエリを構築・精練し、洞察を抽出するための会話型アシスタントです。Universal SearchはLLMを利用した検索機能を搭載しており、ユーザーが必要なデータやアプリケーションを素早く見つけ出せます。Document AIは、Snowflakeデータクラウドに保存された構造化されていない文書から情報を抽出するという役割を果たします。
データ業界の他のプレイヤー、例えばDatabricksもLakehouseIQのような同様の機能を導入し、Snowflakeとの競争が激化しています。InformaticaやDremioもLLMソリューションを提供しており、企業が自然言語を使用してデータを管理しクエリできるように支援しています。
Snowday 2023からのその他の発表
Cortexの他にも、SnowflakeはIcebergテーブルの進化を発表し、データのシロにを排除し、データクラウド内で情報を統合できるようにしました。また、データ品質のモニタリングや、データ系統の可視化を強化したHorizonガバナンスソリューションの新機能も公開されました。最後に、Snowflakeは、初期段階のスタートアップに向けて最大1億ドルを投資する資金提供イニシアチブを発表し、そのためのベンチャーキャピタル部門とAltimeter Capital、Amplify Partners、Menlo Venturesなどの複数の企業が支援します。