如果您昨晚观看了超级碗并经过广告,您可能看到了微软推出的新 Copilot AI 应用的宣传。这款被称为“日常 AI 伴侣”的 Copilot 不仅仅是一个搜索工具,它还利用先进的生成性 AI 大语言模型(LLM)帮助用户创作图像和游戏代码。这个超级碗广告显然取得了成功,Copilot 在撰写时已成为苹果应用商店下载量第二的应用,并在安卓设备的谷歌 Play 商店中排名第12。
然而,微软的 AI 之旅并非没有挑战。在 X 平台(前身为推特)上,一些用户报告称,Copilot 和谷歌的竞争对手 Gemini 都提供了有关超级碗及其参赛队伍(旧金山49人队和堪萨斯城酋长队)的过时和错误信息。相比之下,使用普通的谷歌搜索则能准确提供这些球队的详细信息。
例如,Copilot 错误地将迈阿密海豚队的选手泰里克·希尔列为仍是堪萨斯城酋长队的一员,突显了潜在的知识截止问题。
尽管我刚刚发现 Copilot 的回答相当准确,但这种不一致性是 LLMs 常见的缺陷,相似的提示可能会为不同用户生成截然不同的答案。
尽管人们对微软 Copilot 应用的关注日益增加,这对其 AI 目标来说是个好兆头,但应用的准确性和可靠性将最终决定用户的留存率。微软现在有一个关键的机会,可以利用超级碗广告引发的公众好奇心——他们如何应对这一时刻,将对 Copilot 的未来成功产生重大影响。