Tenyx的AI突破:開源Llama 3模型超越GPT-4性能

在一次獨家訪談中,AI初創公司Tenyx的創始人兼首席執行官Itamar Arel揭示了自然語言處理的卓越進展。Tenyx對Meta的開源Llama-3語言模型進行了精細調整,現稱為Tenyx-70B,並在特定領域超越了OpenAI的GPT-4,這是開源模型首次超越專有標準。

Arel解釋道:“我們開發了一種精調技術,使基礎模型在原有訓練基礎上得到增強。 我們對這種方法感到興奮,因為它可以通過利用大型模型中的冗餘性來實現持續或增量學習。”

Tenyx的Llama-3模型在數學和編程方面的表現超過了GPT-4,同時在所有能力上也優於基礎的Llama-3模型。根據Arel的說法,這一成就預示著開源AI的新時代。

解決“災難性遺忘”

Tenyx針對“災難性遺忘”問題進行挑戰。這種情況下,模型在接觸新數據時可能會喪失之前獲得的知識。Tenyx通過選擇性地更新模型參數中的一小部分,有效地在不損害現有技能的情況下進行新信息的訓練。

Arel指出:“如果僅改變5%的模型參數,同時保留其他部分不變,我們可以更積極地進行這一過程,而不會扭曲其他功能。”這種方法使Tenyx能夠在僅用100個GPU的情況下,在15小時內精調70億參數的Llama-3模型。

對開源AI的承諾

Tenyx通過以與原始Llama-3相同的許可證釋出其精調模型Tenyx-70B,積極推廣開源AI。Arel表示:“我們相信開源模型,分享進展能促進社區的創新,為大家帶來好處。”

Tenyx的後期訓練優化技術應用廣泛,從開發專業聊天機器人到促進已部署模型的頻繁更新,確保它們保持與新興信息的同步。

重塑AI生態

Tenyx的突破具有重大意義,使企業和研究人員能夠獲得先進語言模型,而無需承擔專有解決方案的高昂成本。這一進展也可能激發開源社區的進一步創新,讓其他人能夠在Tenyx的成功基礎上繼續發展。

Arel深入思考:“這對行業以及像OpenAI的公司意味著什麼?”隨著AI領域競爭的加劇,Tenyx對開源模型的精調可能重新定義行業格局以及企業對自然語言處理的應對方式。

雖然Tenyx優化的Llama-3仍保留了一些基礎模型中的限制,如偶爾的不合理回應,但其提升成效顯著。Arel報告稱,該模型在數學和推理方面的準確率接近96%,而基礎模型為85%。

隨著Tenyx引領開源AI創新的新潮流,其突破對AI生態系統的長期影響尚需觀察。然而,顯然Tenyx證明了開源模型可以與專有模型競爭甚至超越,為人工智能的更具包容性和協作性的未來鋪平道路。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles