OpenAI總裁揭曉首張由GPT-4o創作的圖像

Home AI新聞 OpenAI總裁揭曉首張由GPT-4o創作的圖像

OpenAI的總裁Greg Brockman近期在他的X帳號上分享了該公司新推出的GPT-4o模型產生的首幅公開圖像。這幅圖像顯示一位穿著印有OpenAI標誌黑色T恤的人正在黑板上書寫，內容為「模態轉換。假設我們直接用一個大型自回歸變壓器來建模P（文本、像素、聲音）。這樣的優缺點是什麼？」

GPT-4o模型於週一發布，改進了之前的GPT-4系列（包括GPT-4、GPT-4 Vision和GPT-4 Turbo），提供更快的處理速度、降低成本，以及更佳的多樣性輸入資訊保存能力，包括音頻與視覺資料。

OpenAI在訓練GPT-4o時採用多媒體代幣，無需先將音頻和視覺數據轉換為文本，這使模型能直接分析和解釋這些媒體格式，運作更為流暢和高效，相較於早期依賴多個相互連接模型的GPT-4。

相比於2023年9月發布的OpenAI DALL-E 3產生的圖像，GPT-4o模型在質量、照片真實感和文本準確性方面有明顯的提升。

目前，GPT-4o的原生圖像生成能力尚未公開，正如Brockman在他的帖子中所提到的，「團隊正在努力將其推向市場。」

9.3K

解鎖智慧，讓所有人共享：連結知識與通路在知識即力量的世界裡，我們的使命是讓智慧民主化。我們相信，每個人都應該有機會獲得有價值的信息和見解，無論其背景如何。通過打破障礙和增進理解，我們旨在賦能個人和社區。與我們攜手，共同踏上讓智慧對所有人皆可得的旅程！

人工智慧 AI Analytics Assistant

88K

Kive是一個創新的人工智慧平台，旨在實現無縫的創意資產管理，激發協作並提升創意流程。

人工智慧驅動的平台 AI Presentation Generator

45.5K

Subtxt 是一款最尖端的寫作工具，旨在幫助故事創作者編寫引人入勝的敘事。藉由其智能功能，Subtxt 賦予用戶提升講故事技巧的能力，並有效吸引讀者。

大綱工具 AI Book Writing

透過 PeopleAI 創新的數字孿生技術，提升您的個人品牌並增強線上能見度。

數位雙胞胎 AI Chatbot

Find AI tools in YBX