利用Braintrust数据加速LLM评估：为企业提供更快速的解决方案

Home AI News CN 利用Braintrust数据加速LLM评估：为企业提供更快速的解决方案

Updated on 十二月 13 2023

位于加利福尼亚的Braintrust Data公司成功筹集了510万美元的种子资金，此轮融资由Greylock Partners领投。创始人Ankur Goyal曾将其人工智能企业Impira出售给Figma，他创立Braintrust的目的是帮助企业更高效地评估和优化人工智能模型，确保其在投入生产前达到最佳状态。

尽管Braintrust是一家新创企业，但其迅速吸引了众多客户和投资者，其中包括行业知名人士Elad Gil、Clem Delangue和Greg Brockman。该公司计划扩展团队，继续提供创新解决方案，以帮助开发者在快速发展的人工智能领域中保持竞争力。

在生产中应对AI挑战

人工智能是现代应用的核心，但集成和维护这些系统常常面临挑战。为了提升应用性能的小规模代码修改，可能会无意中扰乱整个工作流程，导致后端团队不得不急忙寻找解决方案。这种反应式策略会对客户体验产生不良影响，因此在开发阶段评估AI表现至关重要。团队会评估特定上下文的数据和指标，同时尝试不同模型和技术来优化结果。

精简时间与资源

尽管传统评估方法有效，但通常耗费大量时间和资源，造成功能发布延迟，这是Goyal在Impira时遇到的问题。为此，他创建了Braintrust Data，以便加快评估和对代码变更进行实际测试的速度。

Goyal向媒体表示：“我们的产品可以在不到一小时的时间内为您的代码设置评估功能。您可以在更改后快速重新运行评估，并即时反馈模型性能，确保在最终部署之前调试特定案例。这包括从预生产和正式环境中记录示例，以识别新的用户边缘案例。”

快速获得客户认可

自2023年8月推出以来，Braintrust已经吸引了数百家企业和初创公司客户，包括Airtable、Zapier、Coda和Instacart。客户在短短几周内提高了其AI产品的准确性超过30%，实现了更快的发布周期和更好的团队协作。

Goyal补充道：“我们的产品可以在您自己的云环境中运行，确保企业级别的安全性——在充满个人识别信息和专有数据的AI环境中至关重要。这种能力使客户能够在关键工作负载中使用Braintrust。”

提高AI团队效率

除了评估工具，Braintrust还提供其他功能，帮助AI团队更快速地迭代，包括一个用于比较提示的实验平台、输入-输出对的基准测试、数据集管理，以及从OpenAI、Anthropic、LLaMa 2和Mistral等流行模型提供访问的AI代理。

聚焦提升AI质量

随着企业越来越多地采用AI解决方案，对评估模型表现和弥补差距的工具需求强烈。Braintrust并不是唯一的市场参与者，自ChatGPT推出以来，很多公司纷纷涌现，提供各种产品以衡量模型表现并改善可观察性。

Goyal强调，Braintrust的独特之处在于：“许多产品专注于可观察性，仅在部署后提供见解，而我们的评估方法使工程团队能够在速度上达到十倍于仅依赖后期修复的创新水平。”

在Greylock的最新融资帮助下，Braintrust的总融资额已达到830万美元。Goyal计划扩充团队，推进产品路线图，增强Braintrust在评估和AI工具方面的能力，包括提示平台功能、生产日志、多模态模型支持等。

探索 Midjourney Alpha: 网络版 AI 图片生成的无限潜力

谷歌AI工具“MusicFX”：用简单几句话创造独特音乐

Most people like

Pixellot

281K

AI自动化体育摄像头：实时直播与精准分析在现代体育中，AI自动化技术正逐步改变比赛的观赏体验和分析方式。通过智能摄像头，实时直播和数据分析变得更加高效，提升了观众和教练员的互动性和洞察力。探索这种前沿科技如何推动体育直播与分析的创新发展。

AI 相机其他

Pixel-Art.ai

18.2K

将您的创意化为完美无瑕的像素艺术作品，呈现独特的视觉体验。

像素艺术 AI艺术生成器

Mixpeek

44.6K

Mixpeek是一款功能强大的智能文件存储服务，专注于高效的搜索能力，帮助用户快速找到所需文件。

AI工具 AI搜索引擎

GeniusTutor

7.2K

免费的AI家教，旨在为学生提供全面的作业帮助和学习支持。借助先进的人工智能技术，我们的服务能够迅速解答问题，提升学习效率，让每位学生都能在学习过程中获得个性化的指导和帮助。

AI 辅导员作业帮助工具

Find AI tools in YBX