新的AWS服务允许客户租用Nvidia gpu来进行快速AI项目

2025-10-26 11:20来源:本站

  

  

  越来越多的公司正在运行大型语言模型,这需要使用gpu。到目前为止,最受欢迎的是英伟达的产品,这使得它们价格昂贵,而且经常供不应求。当您只需要为单个作业访问这些昂贵的资源时,从云提供商那里租用长期实例不一定有意义。

  为了解决这个问题,AWS今天推出了亚马逊弹性计算云(EC2) ML容量块,使客户能够在规定的时间内购买这些gpu的访问权限,通常用于运行一些与人工智能相关的工作,例如训练机器学习模型或运行现有模型的实验。

  “这是一种创新的调度GPU实例的新方法,你可以在你需要的时间内为未来的日期保留你需要的实例数量,”钱云在一篇宣布新功能的博客文章中写道。

  该产品允许客户访问NVIDIA H100 Tensor Core gpu实例,集群大小为1到64个实例,每个实例8个gpu。他们可以提前8周以1天为单位预订最多14天的时间。当时间范围结束时,实例将自动关闭。

  新产品允许用户在指定的时间段内注册他们需要的实例数量,就像在特定天数内预订酒店房间一样(正如该公司所说)。从客户的角度来看,他们将确切地知道作业将运行多长时间,他们将使用多少gpu以及它的前期成本,从而为他们提供成本确定性。

  对于亚马逊来说,他们可以在近乎拍卖的环境中使用这些需求资源,确保他们的收入(当然,前提是客户来了)。该公司表示,获得这些资源的价格将是真正动态的,根据供需情况而变化。

  当用户注册该服务时,它会显示时间框架和资源的总成本。用户可以根据自己的资源需求和预算,在同意购买之前调高或调低价格。

  这项新功能从今天开始在AWS美国东部(俄亥俄州)地区普遍可用。

边互网声明:未经许可,不得转载。