2025-10-26 11:20来源:本站

越来越多的公司正在运行大型语言模型,这需要使用gpu。到目前为止,最受欢迎的是英伟达的产品,这使得它们价格昂贵,而且经常供不应求。当您只需要为单个作业访问这些昂贵的资源时,从云提供商那里租用长期实例不一定有意义。
为了解决这个问题,AWS今天推出了亚马逊弹性计算云(EC2) ML容量块,使客户能够在规定的时间内购买这些gpu的访问权限,通常用于运行一些与人工智能相关的工作,例如训练机器学习模型或运行现有模型的实验。
“这是一种创新的调度GPU实例的新方法,你可以在你需要的时间内为未来的日期保留你需要的实例数量,”钱云在一篇宣布新功能的博客文章中写道。
该产品允许客户访问NVIDIA H100 Tensor Core gpu实例,集群大小为1到64个实例,每个实例8个gpu。他们可以提前8周以1天为单位预订最多14天的时间。当时间范围结束时,实例将自动关闭。
新产品允许用户在指定的时间段内注册他们需要的实例数量,就像在特定天数内预订酒店房间一样(正如该公司所说)。从客户的角度来看,他们将确切地知道作业将运行多长时间,他们将使用多少gpu以及它的前期成本,从而为他们提供成本确定性。
对于亚马逊来说,他们可以在近乎拍卖的环境中使用这些需求资源,确保他们的收入(当然,前提是客户来了)。该公司表示,获得这些资源的价格将是真正动态的,根据供需情况而变化。
当用户注册该服务时,它会显示时间框架和资源的总成本。用户可以根据自己的资源需求和预算,在同意购买之前调高或调低价格。
这项新功能从今天开始在AWS美国东部(俄亥俄州)地区普遍可用。