Mistral首席执行官确认新开放源代码AI模型泄露,性能接近GPT-4

过去几天,对于开源人工智能社区来说,无疑是一场旋风,甚至在其通常快速发展的节奏中也显得尤为引人注目。

事件时间线:

1月28日,名为“Miqu Dev”的用户在HuggingFace平台上上传了一系列文件,这是一种顶级开源AI模型的平台。此次上传引入了新的大型语言模型(LLM),即“miqu-1-70b”。该HuggingFace条目强调,该LLM采用与巴黎知名AI公司Mistral的Mixtral 8x7b模型相同的提示格式。Mixtral被许多人认为是目前表现最佳的开源LLM,这是对Meta的Llama 2的精细调优版本。

病毒式传播的发现:

同一天,一个匿名用户在4chan(可能是“Miqu Dev”)分享了miqu-1-70b文件的链接。随着信息的传播,X(前身为Twitter)上用户们开始讨论该模型在常见LLM任务上的出色表现,根据基准测试,这一表现甚至可以与OpenAI的GPT-4在EQ-Bench上抗衡。

社区反应:

机器学习研究人员在LinkedIn上纷纷表达好奇。JP Morgan & Chase的ML科学家Maxime Labonne质疑" Miqu"是否代表“MIstral QUantized”。他指出:“感谢@152334H,现有的miqu无量化版本已上线,”暗示未来经过精细调优的版本可能在性能上超过GPT-4。量化是一种技术,通过简化模型架构中的复杂数值序列,使AI模型能够在性能较低的硬件上运行。

推测与确认:

有推测认为“Miqu”可能是Mistral模型的新泄露版本,考虑到该公司发布更新的低调风格。Mistral联合创始人兼首席执行官Arthur Mensch证实了这一理论,在X上宣布,一名早期访问客户的员工泄露了他们已公开训练的一个旧模型的量化版。Mensch解释道:“我们于访问集群的当天重新训练了这个模型,从Llama 2开始。”而不是要求删除HuggingFace的帖子,Mensch则建议发布者考虑适当的归属。

对AI领域的影响:

Mensch提醒用户“请保持关注!”这暗示Mistral正在开发一个可能与GPT-4相抗衡的“Miqu”模型。这或将成为开源生成AI乃至整个AI领域的关键时刻。自2023年3月发布以来,GPT-4已被公认为最先进的LLM,甚至超越了谷歌备受期待的Gemini模型。

类似GPT-4的开源模型的出现,可能会对OpenAI施加显著的竞争压力,尤其是随着企业越来越寻求结合开源与专有元素的模型。尽管OpenAI可能凭借其更快的GPT-4 Turbo和GPT-4V(视觉)保持领先,但开源AI社区正在迅速缩小差距。悬而未决的问题是:OpenAI的先发优势和独特产品能否让其继续引领LLM领域?

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles