Google 將透過革新工具提升其網頁開發平台,使用戶能夠使用自然語言提示創建應用程序,並擁有強大的多模態功能。在最近的 Medium 文章中,JavaScript 工程師 Bedros Pamboukian 分享了 MakerSuite 新興 AI 功能的截圖,包括備受期待的多模態 AI 模型 Gemini,該模型將支持文本、圖像和音頻的輸入與輸出。雖然這些功能尚未公開確認,但早期截圖顯示它們仍處於開發階段,幾個界面元素似乎尚未完成。
已揭示的內容
泄露的功能中,包括一個名為 Stubbs 的突出工具,旨在簡化 AI 生成的應用原型的創建和分享過程,使其變得更加輕鬆。如果準確,Stubbs 將提供一種針對非技術性人員的友好網頁應用開發方式。此外,還有一個名為 Stubbs Gallery 的附加功能,將允許 MakerSuite 用戶探索和修改現有的原型。值得注意的是,用戶創建的 Stubbs 默認為私人,並可選擇與他人分享。
Gemini,也被稱為 MakerSuite 整合的代號「Jetway」,預計將推動平台的多模態功能,包括文本識別、物體識別、圖像的上下文理解,以及在提示中加入視頻和 HTML 的能力。工程師指出,Gemini 也將與 Vertex AI 整合,即 Google 的應用開發環境。
即將推出的其他功能
新功能中包括 MakerSuite 的自動保存功能、多語言提示的翻譯支持以及與 Google Drive 的整合,便於將圖像和文件無縫導入編輯環境中。
Google Gemini:見解與期待
自從在 5 月的 I/O 活動上宣布 Gemini 以來,Google 一直在進行預告,首席執行官 Sundar Pichai 強調其相比以往模型的顯著多模態能力。Gemini 項目由 Google DeepMind 團隊開發,結合了 Brain Team 和 DeepMind 的專業知識,為業界領先者如 OpenAI 的 ChatGPT 提供了強而有力的競爭者。
雖然細節仍然有限,但 Gemini 的多模態特性已確認,使其能處理和生成文本、視頻和圖像回應。它還設計為能夠訪問各種工具和 API,以增強功能。
促進更簡便的應用開發
對於利用 AI 促進更高效的網頁應用開發的日益關注顯而易見,而 Google 正在推進這一目標,推出了一個名為 Project IDX 的新開發環境。這一計劃加入了 MetaGPT 和 GitHub Copilot 等其他工具,通過自然語言處理簡化應用開發過程。
最近,一位前 Google 工程師提出了一種創新的方法,在設備上本地構建 AI 驅動的網頁應用,而不是僅依賴雲基礎設施。根據 AI 和數據分析首席分析師 Bradley Shimmin 的說法,如果傳聞中的 Stubbs 的加入確實成立,將顯著民主化訪問應用開發的機會。
科技泄露的現狀
需要注意的是,Pamboukian 文章中呈現的信息尚未得到 Google 的正式驗證。截圖的來源仍不明確,儘管 Pamboukian 表示這些截圖是直接獲得的,沒有外部來源影響內容。歷史上,開發者在揭露未發布的功能方面其中不乏成功,例如,早在 6 月,開發者就預告了 Instagram 的 AI 聊天機器人計劃,比 Meta 首席執行官 Mark Zuckerberg 在 Connect 2023 活動上的正式公告早了三個月。
隨著 Google 部署這些潛在的變革性能力,科技社區翹首期待更多將塑造應用創建未來的發展。