抢占市场份额 亚马逊云科技与英伟达联手合作降低大模型训练门槛

【环球网报道 记者 李文瑶】在近日举办的英伟达GTC2024开发者大会上,亚马逊云科技和英伟达共同宣布,NVIDIA Blackwell GPU平台即将登陆亚马逊云科技。亚马逊云科技平台上的用户很快就能够使用基于新一代GPU的基础设施,在云上更快、更大规模、更安全地构建和运行数万亿参数的大语言模型。

这也是尖端GPU技术与云基础设施的深度融合。行业认为,双方合作,将推动相关企业以更低的成本在数万亿参数的大语言模型(LLM)上进行构建和运行实时推理,有望推进AI技术的发展进程,并促使更多行业和企业受益于AI及高性能计算所带来的变革。

外媒认为,亚马逊云科技和英伟达的合作加速了生成人工智能应用程序的开发,尤其值得关注的是,相关技术在生命健康医学领域的应用发展。

软硬件集成 计算性能提升超六倍

从目前对外发布的信息来看,此次合作整合了英伟达和亚马逊云科技各自的最优技术,包括英伟达最新的多节点系统,采用下一代NVIDIA Blackwell架构 GPU 和 AI 软件、Amazon Nitro 系统和 Amazon KMS 的高级安全性、Elastic Fabric Adapter (EFA) 的 petabit 级网络规模,以及 Amazon EC2 UltraCluster 的超大规模集群。

双方共同提供的云基础设施和计算芯片,对比上一代 Amazon EC2 上的 NVIDIA GPU,客户能够更快、大规模且低成本地构建和运行实时推理的万亿参数大语言模型(LLMs)。

其中,Blackwell继承了Hopper GPU架构,拥有2080亿个晶体管,是英伟达首个采用多芯片封装设计的GPU,推理能力是Hopper的30倍。英伟达创始人黄仁勋介绍,如果用Blackwell训练一个1.8万亿参数GPT模型,只需要2000个GPU,花费90天时间,以及四兆瓦的电力。

同时,Blackwell也加入了双方合作的Project Ceiba项目,这是一台专为英伟达自身的研究和开发而设的超级计算机,独家托管在亚马逊云科技上,搭载了20736颗GB200 Superchips芯片,并通过第四代EFA网络扩展,为每个Superchip提供高达800 Gbps的低延迟、高带宽网络吞吐量,与去年11月底的re:Invent2023全球大会上披露的上一代Ceiba相比,计算性能从65exaflops提升至414 exaflops,提升了六倍多。

此次合作是云服务提供商与硬件厂商的优势技术合作,软硬件结合增强了双方在人工智能、机器学习和高性能计算领域的服务能力。

降低万亿参数级大模型训练门槛

值得关注的是,双方的首要目标是降低企业训练大模型的准入门槛:英伟达的超强算力芯片系统与亚马逊云科技强大的Elastic Fabric Adapte (EFA)网络连接能力、高级虚拟化( Amazon Nitro System)和超大规模集群(Amazon EC2 UltraClusters)等领先技术的结合,使得企业能够更快更大规模且更安全地在云上构建和运行数万亿参数的大语言模型。

同时,亚马逊云科技方面透露,亚马逊云科技还计划提供配备基于新的英伟达B100 GPU的Amazn EC2实例,并能够在Amazon EC2 UltraClusters中进行大规模部署。此前,亚马逊云科技已经成功推出了基于英伟达H100芯片的Amazon EC2 P5实例,客户能够在云上将其P5实例扩展到超过2万个英伟达H100 GPU,后续还提供可短期使用这些实例的EC2 Capacity Blocks for ML功能,以帮助客户更好地安排云上生成式AI开发进程。

GB200芯片同时也在亚马逊云科技和英伟达共同开发的AI平台NVIDIA DGX Cloud上可用,这是一个在亚马逊云科技上双方共同开发的AI平台,为企业开发者提供了构建和部署先进生成式AI模型所需的专用基础设施和软件。

外媒认为,亚马逊云科技自研芯片(如Graviton系列)与英伟达GPU的组合使用,可以帮助客户以更低的成本实现更高的计算效能,满足多样化的业务需求。

这也意味着,用户可以通过云服务即时获取尖端芯片资源,无需投入大量资金购买和维护物理硬件,同时可以根据需求快速调整资源规模。企业在云服务的使用上,整体的灵活性和便捷性上都将获得提升。

2023年11月,亚马逊云科技与英伟达就曾表示将扩大战略合作,共同打造下一代生成式人工智能服务和基础设施。亚马逊云科技支持英伟达最新推出的H200 GPU,托管英伟达的人工智能训练即服务(AI-training-as-a-service)平台DGX Cloud,这两家科技巨头还将继续在设计新的GPU驱动的人工智能超级计算机等项目方面进行合作。

随着生成式AI技术的爆发,全球云计算市场也正迎来新的竞争。芯片成为提供算力和服务支撑的重中之重。头部云计算厂商亚马逊云科技、微软、阿里巴巴等,都通过“双管齐下”的方式来增加自身的竞争优势:既推出自研芯片,也同时提供英伟达最新AI芯片这样的可选项。

投资行业认为,亚马逊云科技推出更多面向人工智能的芯片、提供英伟达的最新芯片以及新的Graviton4处理器,为公司创造了潜在的额外收入来源和竞争优势。

而作为亚马逊的掌舵者,亚马逊CEO首席执行官安迪·贾西(Andy Jassy) 曾表示,生成式 AI 技术应用将为亚马逊云科技带来数百亿美元的收入,但预期的利润回报时间尚不清楚。而亚马逊云科技将持续为客户提供服务器租赁服务,利用芯片算力来开发 AI 技术。

而此次合作,借助英伟达的前沿AI芯片算力支持,亚马逊云科技有望巩固其市场竞争优势。同时,行业认为,两家公司的合作有助于定义未来云服务中的AI计算标准,并且可能会带动整个行业的技术进步和产业升级。

此外,在医疗、金融、媒体制作等多个行业中,这种强大的计算能力将直接助力企业进行更复杂的模型训练、更快的数据处理以及更高效的创新研发。

值得关注的是,亚马逊云科技与英伟达正在生命健康领域进行合作拓展,推出了新的NVIDIA BioNeMo基础模型,用于生成化学、蛋白质结构预测,以及理解药物分子与目标的相互作用。这些新模型将很快在Amazon HealthOmics上提供,这是一个专为帮助医疗保健和生命科学组织存储、查询和分析基因组、转录组及其他组学数据而设计的专用服务。

热门相关:神医娘亲:腹黑萌宝赖上门   文娱缔造者   九龙神鼎   翻天   弃妇种田忙