日本电信公司NTT推出了一系列创新研究项目,旨在提升人工智能(AI)技术及提高数据中心的能源效率。
在最近于旧金山举行的新闻发布会上,NTT的研究人员介绍了一种新开发的大型语言模型(LLM),该模型能够分析文档中的图形元素。同时,他们还宣布与哈佛大学合作启用了一个名为“智能物理学”的前沿研究领域,重点开发可持续和可靠的AI。
NTT展示了专为分布式数据中心设计的全光网络,显著提升了低延迟通信的效率。NTT IOWN开发办公室副总裁新田阳介强调,通过将大型数据中心迁至郊区,可降低成本并提高能源效率,特别是依托NTT高效的光纤连接。
NTT拥有超过33万人员工,年收入达到970亿美元,每年在研发上投入超过36亿美元。该公司五年前在硅谷设立了研发分部,并在旧金山举行的Upgrade 2024活动中展示了其最新成果。
“我们的使命是将您的常规观念提升到一个新的水平,”NTT研究的总裁兼首席执行官后藤和则表示。
美国与英国的低延迟网络
新田阳介指出,NTT的IOWN全光网络(APN)在连接的数据中心之间实现了极低的通信延迟,使其在AI分析和金融服务中不可或缺。他提到,城市地区面临高成本、土地短缺和高电价等挑战。NTT正在探索将数据中心分布在郊区的可行性,并利用光纤电缆实现高达400Gbps的数据传输速度。
在英国的测试中,分隔100公里的数据中心通过APN连接时延不到一毫秒,这相比传统网络显著降低了延迟波动,使地理分散的数据中心在功能上更接近单中心。NTT在伦敦北部和东部连接的数据中心,往返延迟亦在一毫秒以内。在美国维吉尼亚州的实验中取得了类似成果。
这个倡议旨在将遥远的IT基础设施转变为统一的数据中心体验。当地的二氧化碳排放法规和空间限制促使运营商寻求郊区的替代方案。然而,地理分散的中心仍然面临延迟挑战,NTT的光链路正在用于解决这些问题。
数据中心的先进演示
在独立试验中,NTT与NTT DATA成功利用APN技术连通英国和美国的数据中心。测试结果显示,英国的数据中心延迟在一毫秒以内,且延迟波动极低。相比之下,传统网络的延迟通常超过2000微秒。
APN系统满足当前及新兴应用的严格延迟要求,包括工业物联网的实时AI分析、智能能源管理和自然灾害响应。在金融领域,NTT DATA则进行低延迟对交易和汇款至关重要的演示。
新田阳介表示:“对数据中心的需求日益增加,但土地稀缺和电力供应限制了新设施的发展。我们致力于创造更高能效的数据中心以应对这些挑战。”
视觉理解的创新
NTT还推出了视觉机器阅读理解的突破技术,使大型语言模型能够解读文档中的图形元素,包括图表和示意图。该技术与东北大学的铃木纯教授合作开发,并应用于NTT的轻量级LLM tsuzumi。
与主流模型进行基准测试时,NTT的LLM在各种文档理解任务上表现优于开源选项,如LLaVA及OpenAI的GPT-3.5和GPT-4。NTT高级研究员西田恭介承认,尽管LLM的能力在不断增长,但处理多模态信息的挑战依然存在。
2023年11月首次推出的tsuzumi提供两种版本:一个拥有6亿参数的超轻量级版本和一个拥有70亿参数的轻量级版本。其紧凑的体积大幅降低了能耗和训练成本,使其成为企业的可持续选择。
tsuzumi的潜在应用范围广泛,包括呼叫中心的自动化、数字记录保存以及软件工程任务。该模型支持包括英语和日语在内的20多种语言,并正在与超过500家全球公司进行商业试验。
与哈佛大学脑科学中心的合作
NTT研究部承诺为哈佛大学脑科学中心(CBS)设立NTT奖学金项目,支持后博士研究,探索智能物理学这一新兴领域。该项可再生的两年捐款总额可能超过170万美元,支持计算机科学、神经科学与心理学交叉领域的创新研究。
NTT与哈佛CBS的合作过去已取得诸多宝贵成果,包括利用认知科学原理解决AI偏见问题。近期出版的研究探讨了生成AI的科学及其在神经科学中的应用。
“支持哈佛CBS与我们利用AI应对计算公平性和可持续性等紧迫问题的愿景相符,”后藤和则表示。
硅谷的独特定位
NTT研究部在加利福尼亚州圣克拉拉市设有大型办公室,以其基础研究的承诺而闻名。在过去五年内,NTT研究已发表超过450篇学术论文,并在各科学领域获得多个奖项。
后藤和则表示,当前的研究重点是开发光子集成电路和研究大脑功能,以更好地理解计算过程。此外,NTT还致力于推动量子抗攻击加密技术,以应对未来量子计算的挑战。
随着NTT的持续探索,未来将创建生物系统(如心脏)的数字孪生,以模拟药物反应,实现个性化医疗。
通过这些战略举措,NTT不仅推动了技术进步,也在提升人工智能和数据中心运营的未来中扮演重要角色。