サンフランシスコに本拠を置くAIスタートアップ、Datasaurは、AIプロジェクト向けのテキストと音声のラベリングを専門としており、ChatGPTに似たカスタム大規模言語モデルアプリケーションの作成とトレーニングを支援するための包括的プラットフォーム「LLM Lab」を発表しました。
LLM Labは、クラウドおよびオンプレミスのデプロイメントオプションを提供し、企業が第三者サービスに伴うビジネスおよびデータプライバシーのリスクを軽減しながら、内部の生成AIアプリケーションを構築することを可能にします。このことにより、チームはプロジェクトに対する管理権を強化できます。
「我々は、一般的な課題に対処し、進化するベストプラクティスをサポートし、プロセスを簡素化するためのデザイン理念を具体化したツールを開発しました」と、DatasaurのCEOで創業者のIvan Leeは述べました。「内部使用やクライアント向けのカスタムモデル構築の経験をもとに、スケーラブルで使いやすいLLM製品を開発しました。」
Datasaur LLM Labの主な機能
2019年に設立されたDatasaurは、AIおよびNLP向けの強固なデータアノテーションプラットフォームを進化させてきました。LLM Labの発表は、これらの提供内容の重要な進展を示しています。
「このツールは、エンティティ認識やテキスト分類といった従来の自然言語処理(NLP)にとどまらず、LLMは次世代の言語技術を代表します。私たちは、テキスト、文書、および音声AIアプリケーションの業界標準ソリューションを目指しています」とLeeは説明しました。
現在、LLM Labは、内部データの取り込み、データ準備、検索増強生成(RAG)、埋め込みモデルの選択、LLM応答の最適化を含む、LLMアプリケーション開発の各コンポーネントのための統一インターフェースを提供しています。この製品は、モジュール性、組み合わせ性、シンプルさ、メンテナンス性の原則を考慮して設計されています。
「このアプローチにより、異なるテキスト埋め込み、ベクトルデータベース、基礎モデルを効率的に管理できます。LLM領域の動的性は技術に依存しないプラットフォームを必要とし、ユーザーが最適なソリューションのために技術を入れ替えられることを可能にします」とLeeは付け加えました。
LLM Labの使用を開始するには、ユーザーは基盤となるモデルを選択し、温度や最大応答長などの設定を調整します。サポートされているモデルには、MetaのLlama 2、アブダビのTechnology Innovation InstituteからのFalcon、AnthropicのClaudeなどがあり、ベクトルデータベースにはPineconeも利用可能です。
次に、ユーザーはプロンプトテンプレートを選択してその効果をテストし、RAG用に文書をアップロードします。これらの設定を行った後、品質パフォーマンスのための最終設定を行い、アプリケーションを展開します。ユーザーはプロンプト/完成ペアを評価し、モデルの微調整のために人間のフィードバックを通じた強化学習(RLHF)を使用してフィードバックを取り入れることができます。
技術的課題の克服
Leeは、現在LLM Labをテストしている企業の数を明かしませんでしたが、初期ユーザーからの良いフィードバックを報告しています。プラットフォームのユーザーであるGLAIR.aiの創設者兼CEO、Michell Handakaは、Labがエンジニアリングチームと非エンジニアリングチームとの間のコミュニケーションを促進し、LLMアプリケーション開発の障壁を効果的に取り除くことを強調しました。
Datasaurは、すでに金融、法律、ヘルスケアなどの主要産業において、非構造化データを貴重な機械学習データセットに変換する支援を行っています。注目すべきパートナーには、Qualtrics、Ontra、Consensus、LegalTech、Von Wobeser y Sierraが含まれます。
「我々は前向きな考えを持つ業界リーダーを支援し、2024年には収益が5倍になる見込みです」とLeeは述べています。
DatasaurとLLM Labの今後の展望
来年、DatasaurはLLM Labをさらに強化し、企業向けのLLM開発に投資を進める計画です。ユーザーは成功した設定を保存し、同僚と洞察を共有できるようになります。Labは新興の基礎モデルも取り入れる予定です。
カスタムでプライバシー重視のLLMアプリケーションに対する需要の高まりを考慮すると、LLM Labは注目すべき影響を及ぼす可能性があります。2023年のLLM調査報告書によると、回答者の約62%がChatGPTやGitHub CopilotのようなLLMアプリケーションを利用して、チャットボット、カスタマーサポート、コーディングなどの機能を行っています。
プライバシーへの懸念が高まる中、多くの企業が汎用モデルから、セキュリティ、プライバシー、規制基準に準拠したカスタム内部ソリューションに移行しています。