本週AI領域的熱門新聞
1. DeepMind推出人類教學AI系統
Google DeepMind推出了一種創新的AI代理系統,能直接向人類教師學習複雜任務。研究團隊在《自然》雜誌發表了一篇突破性論文,介紹了一種被稱為文化傳遞的方法,該方法使AI模型能在無需預先收集人類數據的情況下學習技能。這一新穎的方式模仿了人類通過觀察學習的過程,類似於觀看視頻教學。通過名為GoalCycle3D的模擬環境中的獨特少量模仿過程,AI代理成功模擬了人類示範者的行為,並在示範結束後長時間保持對任務的出色回憶。DeepMind表示,這一技術為將文化演化納入人工通用智能的發展奠定了基礎,顯著推動該領域的進步。
2. 為AI職場革命做好準備
Qantm AI創辦人兼CEO Seth Dobrin在一篇有見地的專欄中探討了組織和員工如何主動利用AI的進步。隨著技術的快速演變,當今的勞動力必須迅速再培訓,適應AI驅動的經濟。Dobrin強調,教育系統、企業培訓計劃和政府政策必須隨之演變。生成式AI的影響遍及所有行業,涉及到手工勞動和白領崗位。因此,各方利益相關者需協同努力,以做好這一變革期間的準備,盡量減少勞動力的沖擊。
3. Google推出Gemini:強大的新語言模型
Google正式推出其備受期待的下一代大型語言模型Gemini,被譽為其產品線中最大、最強大的模型。經過一段時間的期待,Google發布了關於Gemini的詳細信息,該模型提供三種配置:Ultra、Pro和Nano,適用於從手機到數據中心的各種設備。Gemini Pro現已為Google的Bard聊天機器人提供支持,增強了其推理和理解能力。Google計劃在2024年初推出功能更強大的Bard Advanced。自12月13日起,開發者和企業用戶將可通過Vertex AI和Google AI Studio的Gemini API訪問Gemini Pro。
4. Meta的Audiobox:將文本轉化為獨特聲音
Meta推出了其最新AI模型Audiobox,專門用於音頻生成,能將文本轉化為聲音。與其前身Voicebox不同,Audiobox允許用戶使用自然語言提示來描述所需生成的音頻。例如,輸入“海狸啃食鳳梨片”便能生成基於該描述的獨特聲音景觀。此外,該模型還能通過結合文本提示和聲音輸入來合成音頻,讓用戶對生成音頻的風格和音效有更高的控制權——這是在早期模型中無法實現的功能。在Meta的研究網站上體驗一些音頻樣本吧。
5. OpenAI從Rain AI進行戰略芯片購買
OpenAI與Rain AI簽訂了一項價值5100萬美元的重大協議,以收購AI芯片。Rain AI由CEO Sam Altman共同創立,此合作旨在複製人類大腦的信息處理方式。OpenAI與Rain的合作可以追溯到2019年,顯示出雙方在創新方面的長期合作關係。儘管最近有關於Altman的內部爭議,該交易仍將提升OpenAI的能力,Rain預計將於2024年10月交付其首批硬件產品。