谷歌发布Gemini：下一代大型语言模型引领人工智能技术革命

Home AI News CN 谷歌发布Gemini：下一代大型语言模型引领人工智能技术革命

谷歌正式推出了备受期待的下一代大型语言模型——Gemini，声称这是其迄今为止开发的“最大”和“最强大”的模型。经过一段时间的 speculation，谷歌在一篇博客文章中详细介绍了这一模型的能力，Gemini有三个版本：Ultra、Pro和Nano。这种多样性使其能够在移动设备和大型数据中心中高效运行。

从今天开始，Gemini将为多个应用提供支持，包括最初配备Gemini Pro模型的Bard聊天机器人，首发语言为英语。谷歌表示，这将显著提升Bard的推理和理解能力。展望未来，公司计划在2024年初推出Bard Advanced，尽管有关此版本的详细信息仍然有限，但已提到将从Gemini Ultra开始提供“高级模型及功能”接入。

新发布的Pixel 8 Pro将成为首款能够运行Gemini Nano的智能手机。在即将到来的一年里，用户将能体验到诸如录音机应用中的“摘要”功能和Gboard中用于WhatsApp的Smart Reply开发者预览等新功能。此外，Gemini将与谷歌广告、Chrome和Duet AI集成，未来还会在多个产品中推出更多功能。值得注意的是，谷歌表示，它正在不断优化该模型在搜索中的性能，以提升搜索生成体验（SGE）。

虽然博客文章没有提到与Makersuite功能的集成，但之前有泄漏消息称，谷歌的网页开发平台将利用Gemini的生成能力。该模型最初由谷歌CEO桑达尔·皮查伊在I/O 2023活动上首次发布，旨在在快速发展的AI领域树立竞争地位。

从12月13日起，开发者和企业客户可以通过Vertex AI或谷歌AI Studio的Gemini API访问Gemini Pro。Gemini Ultra将在2024年初对部分组织开放，随后将更广泛地提供给企业客户。希望开发Gemini应用的Android开发者可以通过Android AICore申请早期预览Nano版本。

Gemini于5月的公司活动中首次宣布，但自那以后信息较少。作为领先的前沿模型，它优先考虑大型语言模型的基础性进展，这是最近举行的AI安全高峰会的重要议题。虽然谷歌计划在本周的私人活动中展示该模型，但由于处理非英语查询的挑战，这些演示被取消。不过，仍然对一些未公开的商业伙伴进行了私下展示。

在内部，谷歌的高层管理人员强烈希望Gemini能与OpenAI的ChatGPT竞争，强调尽早发布的紧迫性，以保持竞争优势。此外，随着微软的AI Copilot在集成多种OpenAI技术的生产力软件中取得重大进展，谷歌也受到推动，希望保持创新的步伐。

在硬件方面，谷歌在其自有的TPU芯片上训练了Gemini。随着该模型的发布，还宣布了新一代AI加速器Cloud TPU v5p。这些新芯片在大型语言模型的训练速度上较上一代TPU v4快了2.8倍，并且比现有的Cloud TPU v5e更强大。

谷歌云还推出了AI超级计算机，这是一种专为增强AI训练和优化而设计的创新超级计算机架构。该先进基础设施满足生成式AI应用日益增长的计算需求，提供了一整套专为AI量身定制的硬件、软件、机器学习框架及计算模型。

要使用Cloud TPU v5p或访问新的AI超级计算机，企业需要与其指定的谷歌云客户经理联系，确保能够利用这些先进技术满足业务需求。

克服挑战：企业为何难以在2023年纽约人工智能峰会实现人工智能落地

升级Diffusion插件：提升您的AI图像生成体验