Reka是一家位於舊金山的人工智慧初創公司,由來自DeepMind、Google和Meta的研究人員創立,最新推出了一個名為Reka Core的多模態語言模型。這款模型被譽為公司的「最大且最強大」的產品,使用數千個GPU從零開始訓練而成。
Reka Core目前可通過API、企業內部或設備上部署,並且是公司第三款語言模型。該模型在理解文本、圖像、音頻和視頻等多種模態方面表現出色。儘管在不到一年的時間內訓練完成,其表現已趕上OpenAI、Google和Anthropic等行業巨頭。
Reka的聯合創辦人兼CEO Dani Yogatama在最近的訪談中表示:「短時間內訓練出高效能模型的能力使我們與眾不同。」
Reka Core在Netflix的《三體》上進行測試,成功將屏幕上的行動翻譯成文本。Reka的首席科學家兼聯合創辦人Yi Tay強調,模型是使用「數千個H100」進行開發的。雖然要與OpenAI的GPT-4和Anthropic的Claude 3 Opus等領先模型競爭並不簡單,Tay仍然堅信Core的表現仍在持續改進中。
Reka Core提供了什麼?
雖然Reka Core的參數具體數量尚未披露,但其被描述為「非常大模型」(前一版本Reka Flash擁有210億參數)。該模型基於多種數據來源進行訓練,包括授權的、公共可用的和合成數據,涵蓋文本、音頻、視頻和圖像格式。
這種全面的訓練使得Reka Core能夠處理多模態,並在數學和編碼等各個領域中準確回應,展現出卓越的推理能力。它支持32種語言,並擁有128,000個tokens的廣泛上下文窗口,適合處理長篇文檔。Yogatama指出,Core是繼Google的Gemini Ultra之後,第二個涵蓋所有模態並能提供高質量輸出的模型。
在性能測試中,Reka Core在視頻感知方面超越了Gemini Ultra,得分為59.3,相較之下Gemini Ultra得分54.3。在圖像任務的MMMU基準測試中,Core以56.3的得分緊隨於GPT-4(56.8)、Claude 3 Opus(59.4)和Gemini Ultra(59.4)之後。而Elon Musk的xAI旗下的Grok模型得分僅為53.6。
獨立評估顯示,Reka Core在多模態性能方面名列第二。此外,Core在各種基準測試中與知名模型的表現相等或超過。在MMLU知識測試中,Core得分為83.2,與GPT-4、Claude 3 Opus和Gemini Ultra不相上下。此外,在推理和編碼任務中,Core以92.2和76.8的得分超越了GPT-4。
為了在短時間內達成如此表現,公司採取了逆向開發方式。他們並非按照傳統的模型訓練方式,而是設立了具體性能目標,並倒推所需數據量和GPU需求。
合作與未來計劃
Reka專注於多模態能力及具競爭力的定價—每百萬個輸入tokens收取10美元,輸出tokens收取25美元,旨在探索電子商務、遊戲、醫療和機器人等行業的多種使用案例。作為參考,OpenAI的GPT-4 Turbo對於輸入tokens收取相同價格,但輸出則為30美元。
雖然仍處於早期階段,Reka正積極努力挑戰OpenAI、Anthropic和Google的市場主導地位。該初創公司已經與行業夥伴展開合作,例如Snowflake最近將Reka Core和Flash納入其Cortex服務中,以開發語言模型應用。與Oracle和AI Singapore(聯合新加坡研究機構)也在進行合作。
Yogatama表示,自Reka系列最初模型(Flash和Edge)推出以來,企業對其強烈感興趣,客戶需求不斷增長。關於合作的更多細節預計將很快發布。
在首年的重點是將模型推向市場的基礎上,Reka計劃在提升產品同時擴展業務運營。團隊致力於改善Core的表現,並同時開發下一版本。
儘管持續進展,Yogatama澄清公司目前並無開源技術的即時計劃。他支持開源原則,但強調需平衡共享內容,以確保業務可持續增長。
Reka Core的競爭格局
隨著Reka Core在競爭激烈的AI市場中崭露頭角,其展現出的潛力使其有望與當前市場上的領先模型競爭。