谷歌正式推出了备受期待的下一代大型语言模型——Gemini,声称这是其迄今为止开发的“最大”和“最强大”的模型。经过一段时间的 speculation,谷歌在一篇博客文章中详细介绍了这一模型的能力,Gemini有三个版本:Ultra、Pro和Nano。这种多样性使其能够在移动设备和大型数据中心中高效运行。
从今天开始,Gemini将为多个应用提供支持,包括最初配备Gemini Pro模型的Bard聊天机器人,首发语言为英语。谷歌表示,这将显著提升Bard的推理和理解能力。展望未来,公司计划在2024年初推出Bard Advanced,尽管有关此版本的详细信息仍然有限,但已提到将从Gemini Ultra开始提供“高级模型及功能”接入。
新发布的Pixel 8 Pro将成为首款能够运行Gemini Nano的智能手机。在即将到来的一年里,用户将能体验到诸如录音机应用中的“摘要”功能和Gboard中用于WhatsApp的Smart Reply开发者预览等新功能。此外,Gemini将与谷歌广告、Chrome和Duet AI集成,未来还会在多个产品中推出更多功能。值得注意的是,谷歌表示,它正在不断优化该模型在搜索中的性能,以提升搜索生成体验(SGE)。
虽然博客文章没有提到与Makersuite功能的集成,但之前有泄漏消息称,谷歌的网页开发平台将利用Gemini的生成能力。该模型最初由谷歌CEO桑达尔·皮查伊在I/O 2023活动上首次发布,旨在在快速发展的AI领域树立竞争地位。
从12月13日起,开发者和企业客户可以通过Vertex AI或谷歌AI Studio的Gemini API访问Gemini Pro。Gemini Ultra将在2024年初对部分组织开放,随后将更广泛地提供给企业客户。希望开发Gemini应用的Android开发者可以通过Android AICore申请早期预览Nano版本。
Gemini于5月的公司活动中首次宣布,但自那以后信息较少。作为领先的前沿模型,它优先考虑大型语言模型的基础性进展,这是最近举行的AI安全高峰会的重要议题。虽然谷歌计划在本周的私人活动中展示该模型,但由于处理非英语查询的挑战,这些演示被取消。不过,仍然对一些未公开的商业伙伴进行了私下展示。
在内部,谷歌的高层管理人员强烈希望Gemini能与OpenAI的ChatGPT竞争,强调尽早发布的紧迫性,以保持竞争优势。此外,随着微软的AI Copilot在集成多种OpenAI技术的生产力软件中取得重大进展,谷歌也受到推动,希望保持创新的步伐。
在硬件方面,谷歌在其自有的TPU芯片上训练了Gemini。随着该模型的发布,还宣布了新一代AI加速器Cloud TPU v5p。这些新芯片在大型语言模型的训练速度上较上一代TPU v4快了2.8倍,并且比现有的Cloud TPU v5e更强大。
谷歌云还推出了AI超级计算机,这是一种专为增强AI训练和优化而设计的创新超级计算机架构。该先进基础设施满足生成式AI应用日益增长的计算需求,提供了一整套专为AI量身定制的硬件、软件、机器学习框架及计算模型。
要使用Cloud TPU v5p或访问新的AI超级计算机,企业需要与其指定的谷歌云客户经理联系,确保能够利用这些先进技术满足业务需求。