本週全新 DeepMind AI 智能代理系統揭曉

Home AI新聞本週全新 DeepMind AI 智能代理系統揭曉

本週AI領域的熱門新聞

1. DeepMind推出人類教學AI系統

Google DeepMind推出了一種創新的AI代理系統，能直接向人類教師學習複雜任務。研究團隊在《自然》雜誌發表了一篇突破性論文，介紹了一種被稱為文化傳遞的方法，該方法使AI模型能在無需預先收集人類數據的情況下學習技能。這一新穎的方式模仿了人類通過觀察學習的過程，類似於觀看視頻教學。通過名為GoalCycle3D的模擬環境中的獨特少量模仿過程，AI代理成功模擬了人類示範者的行為，並在示範結束後長時間保持對任務的出色回憶。DeepMind表示，這一技術為將文化演化納入人工通用智能的發展奠定了基礎，顯著推動該領域的進步。

2. 為AI職場革命做好準備

Qantm AI創辦人兼CEO Seth Dobrin在一篇有見地的專欄中探討了組織和員工如何主動利用AI的進步。隨著技術的快速演變，當今的勞動力必須迅速再培訓，適應AI驅動的經濟。Dobrin強調，教育系統、企業培訓計劃和政府政策必須隨之演變。生成式AI的影響遍及所有行業，涉及到手工勞動和白領崗位。因此，各方利益相關者需協同努力，以做好這一變革期間的準備，盡量減少勞動力的沖擊。

3. Google推出Gemini：強大的新語言模型

Google正式推出其備受期待的下一代大型語言模型Gemini，被譽為其產品線中最大、最強大的模型。經過一段時間的期待，Google發布了關於Gemini的詳細信息，該模型提供三種配置：Ultra、Pro和Nano，適用於從手機到數據中心的各種設備。Gemini Pro現已為Google的Bard聊天機器人提供支持，增強了其推理和理解能力。Google計劃在2024年初推出功能更強大的Bard Advanced。自12月13日起，開發者和企業用戶將可通過Vertex AI和Google AI Studio的Gemini API訪問Gemini Pro。

4. Meta的Audiobox：將文本轉化為獨特聲音

Meta推出了其最新AI模型Audiobox，專門用於音頻生成，能將文本轉化為聲音。與其前身Voicebox不同，Audiobox允許用戶使用自然語言提示來描述所需生成的音頻。例如，輸入“海狸啃食鳳梨片”便能生成基於該描述的獨特聲音景觀。此外，該模型還能通過結合文本提示和聲音輸入來合成音頻，讓用戶對生成音頻的風格和音效有更高的控制權——這是在早期模型中無法實現的功能。在Meta的研究網站上體驗一些音頻樣本吧。

5. OpenAI從Rain AI進行戰略芯片購買

OpenAI與Rain AI簽訂了一項價值5100萬美元的重大協議，以收購AI芯片。Rain AI由CEO Sam Altman共同創立，此合作旨在複製人類大腦的信息處理方式。OpenAI與Rain的合作可以追溯到2019年，顯示出雙方在創新方面的長期合作關係。儘管最近有關於Altman的內部爭議，該交易仍將提升OpenAI的能力，Rain預計將於2024年10月交付其首批硬件產品。

微軟預測2024年人工智慧應用將迅速增長：2023紐約AI高峰會洞察

蘋果推出開放原始碼人工智慧開發工具，專為Mac使用者設計