上周,创始人埃隆·马斯克宣布xAI将向部分用户开放其首款AI产品。11月5日(星期日)早上,他向公众展示了这一AI产品,充分体现了马克斯的幽默风格,同时提供实时信息和高效能。
这款名为“Grok”的大型语言模型(LLM)旨在与OpenAI的GPT和Anthropic的Claude 2等顶尖产品竞争。马斯克于凌晨近1点通过其平台X宣布了Grok的发布。
根据xAI网站的介绍,Grok目前仅限于美国的一部分用户。潜在用户可以在X平台上加入候补名单以获得早期访问权限,使用Grok似乎没有费用。
网站详细介绍了Grok的开发历程,从原型模型“Grok-0”开始,后者是在330亿个参数的数据上进行训练的。相比之下,Meta的LLaMA 2模型拥有700亿个参数,而OpenAI的旧版GPT-3.5模型约有200亿个参数。xAI声称Grok-0“在标准语言模型基准上接近LLaMA 2的能力,但训练资源仅使用了一半”。
xAI团队表示,他们显著增强了Grok的推理和编程能力,使得Grok-1诞生,成为Grok聊天机器人的“前沿LLM”,类似于OpenAI的GPT为ChatGPT提供支持。
xAI还提供了一张性能对比图,展示了Grok在四项机器学习基准测试中的优势,包括中学数学(GSM8k)、多项选择题(MMLU)、Python代码完成(HumanEval)和使用LaTeX编写的数学问题(MATH)。xAI网站指出,Grok“超越了其计算类别中的所有其他模型,包括ChatGPT-3.5”,只被那些训练在显著更大数据集上的模型(如GPT-4)所超越。这一点凸显了xAI在高效训练LLM方面的快速进展。
在xAI的网站上,Grok被比喻为“以《银河系漫游指南》为模型”,这部1970年代的广播剧及讽刺科幻系列由道格拉斯·亚当斯创作。在这个背景下,Grok旨在回答几乎所有问题,并注入幽默和反叛精神,因而不适合那些不喜欢幽默的人。
11月3日,马斯克分享了Grok对提问的幽默回应,包括一份关于“如何制作可卡因”的讽刺性逐步指南,并明确说明:“开玩笑的!请不要真的尝试制作可卡因。”
马斯克在另一条帖子中强调了Grok的讽刺性,隐晦表示他对其个性的影响。
Grok的一个独特特点是可以通过X平台访问实时知识。马斯克在早间的帖子中展示了Grok的信息检索能力与典型模型的对比,展示了其在回应特定查询(如与乔·罗根的最新采访细节)时的准确性。
关于xAI如何利用来自X平台的数据训练Grok的细节仍不明确,但马斯克此前已限制OpenAI使用该平台进行训练。这一点尤为讽刺,因为他早期曾参与OpenAI的发展,后来因内部冲突而退出。
马斯克最近的帖子显示,他计划在Grok结束早期测试阶段后将其开放给所有X Premium+用户,但尚未提供具体时间表。他快速分享Grok的能力,似乎旨在跟上OpenAI的步伐,后者将在11月6日的DevDay大会上发布新AI功能。