伊隆·馬斯克的 xAI 最近推出了 Grok-2 大型語言模型(LLM)聊天機器人,並引起廣泛關注。該聊天機器人現可通過每月 8 美元的訂閱在社交平台 X 上使用。Grok-2 的兩個版本,包括速度更快但功能稍弱的 Grok-2 mini,顯著提高了信息處理速度和響應時間。這一升級是由 xAI 開發者 Igor Babuschkin、Lianmin Zheng 和 Saeed Maleki 在僅三天內重新編寫推理代碼所實現的。
Babuschkin 在 X 上分享道:“Grok 2 mini 現在比昨天快了兩倍。在過去三天中,@lm_zheng 和 @MalekiSaeed 完全重寫了我們的推理堆棧,使用了 SGLang。這一改進使我們能夠以合理的速度提供需要多服務器推理的更大 Grok 2 模型。這兩個模型不僅速度更快,準確性也稍微提高。請持續關注更多的速度提升!”
SGLang 是一個高效的開源系統,用於執行複雜的語言模型程序,在此次重寫中發揮了重要作用,其吞吐量比現有系統高達 6.4 倍。SGLang 由斯坦福大學、加州大學伯克利分校、德克薩斯農工大學及上海交通大學的研究人員開發,通過將前端語言與後端運行時整合,簡化了語言模型應用的編程。它支持多種模型,包括 Llama、Mistral 和 LLaVA,並兼容開放權重和基於 API 的模型,如 OpenAI 的 GPT-4。
Grok-2 和 Grok-2 Mini 的性能亮點
在最新的 Lmsys 聊天機器人競技場排行榜中,Grok-2 以 1293 的競技場得分獲得第二名,來自 6686 票的支持,成為全球第二強大的 AI 模型,僅次於 OpenAI 的 ChatGPT-4o,並與谷歌的 Gemini-1.5 Pro 齊名。受益於最近的改進,Grok-2 mini 現已上升至第五名,競技場得分 1268,來自 7266票,緊隨 GPT-4o mini 和 Claude 3.5 Sonnet 之後。這兩個模型反映了 xAI 對推動 AI 技術發展的承諾。
Grok-2 特別擅長數學任務,榮獲第一名,並在硬提示、編程及遵循指令等各類別中保持強勁表現,讓 Grok-2 超越 OpenAI 的 GPT-4o,後者目前排名第四。
未來發展
Babuschkin提到,Grok-2 mini 相對於完整的 Grok-2 模型,主要優勢在於其卓越的速度。他還表示,正持續進行努力以進一步提升 Grok-2 mini 的處理速度,這使其對於優先考量高效能及低計算資源的用戶來說更具吸引力。
Grok-2 和 Grok-2 mini 的加入在聊天機器人競技場排行榜上引起 AI 社區的廣泛關注,展現了 xAI 對創新的承諾,並推動擴展 AI 技術的能力。隨著持續的改進,Grok-2 和 Grok-2 mini 有望引領未來的 AI 進步,承諾提供更高的速度與準確性。