标普全球推出颠覆性AI基准,重塑金融行业

标准普尔全球公司(S&P Global)宣布推出S&P AI基准,这是由Kensho开发的一项创新解决方案,旨在为评估复杂金融应用中的大型语言模型(LLMs)建立新的标准。

此基准工具由Kensho团队开发,能够评估LLM在定量推理、从财务文档中提取数据以及展示领域特定知识等任务中的表现。结果通过排行榜展示,为每个模型的性能提供透明的视角。

S&P AI基准通过关键的金融和定量指标对LLM进行排名,包括领域知识、数据提取量和程序合成。标准普尔全球首席人工智能官兼Kensho首席执行官Bhavesh Dayalji表示:“S&P AI基准将Kensho的前沿AI研究与标准普尔全球的金融智能相结合。我们的目标是将此解决方案打造成复杂金融推理中评估LLM的行业标准,推动FinAI领域的创新。”

此项发售在金融服务行业恰逢其时,越来越多的机构在探索生成式AI和大型语言模型的潜力,以增强运营和获得竞争优势。由于缺乏标准化基准,组织很难评估哪些模型适合其特定需求。

Dayalji解释道:“像这样的基准解决方案对于帮助机构确定在特定应用中应使用哪些LLM至关重要。S&P AI基准将通过指导金融专业人士了解每个模型的强项及其提供最大价值的方式,促进创新。”

S&P AI基准的方法论是由一支多样化的专家团队开发并验证的,包括工程师、研究人员、学者和金融专业人士,共同致力于严谨测试LLM的性能,评估内容涵盖600个问题,分为三个关键类别。

行业分析师认为,S&P AI基准的发布是金融行业在人工智能采用方面的重要里程碑。随着先进AI技术在金融领域的广泛整合,拥有可靠且透明的基准工具,对于希望做出明智部署决策的公司来说,显得尤为重要。标准普尔全球的这一解决方案或将加速LLM的负责任使用,并推动FinAI领域的创新。

展望未来,标准普尔全球设想S&P AI基准将在金融服务的AI未来中扮演重要角色。Dayalji表示:“我们的愿景是让LLM更有效地适应行业需求,而像我们这样的解决方案将推动这一进程。我们也鼓励所有模型提供商参与进来,帮助我们不断完善这一框架。”

随着金融行业在快速变化的AI与生成式AI领域中前行,Kensho的S&P AI基准有望成为重要资源,助力组织利用这些技术,同时确保准确性、透明度和负责任的使用。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles