企业站

请登录登录

英伟达经济学：在GPU上每花1美元就能赚5-7美元

PConline 2024-07-01 12:38:31

企业站_资讯眼

英伟达表示，在四年的时间里，公司在GPU上每投资1美元，就可以获得5到7美元的收益。近日，英伟达超大规模和高性能计算业务副总裁兼总经理Ian Buck在美国银行证券2024年全球技术会议上表示，客户正在投资数十亿美元购买新的英伟达硬件，以跟上更新的人工智能模型，从而提高收入和生产力。

竞相建设大型数据中心的公司将尤其受益，并在数据中心4到5年的使用寿命中获得巨大回报。

“云计算提供商在GPU上每花1美元，四年后就能赚回5美元。”Buck说。

巴克说推理甚至更有利可图。

“这里的经济状况甚至更好：每消费1美元，在同一时期内就会有7美元的收益，而且还在增长。”巴克说。

围绕Llama、Mistral或Gemma的AI推理正在增长，并由tokens提供服务。英伟达正在将开源人工智能模型打包到名为Nvidia Inference Microservices (NIMs)的容器中。

英伟达表示，今年早些时候宣布的即将推出的Blackwell GPU针对推理进行了优化。GPU支持FP4和FP6数据类型，在运行低强度AI工作负载时可以提高能效。

为Rubin做准备

云提供商提前两年就开始规划数据中心，他们想知道GPU架构未来会是什么样子。

英伟达已经分享了Rubin的计划——在Computex上宣布了一款新的GPU——这样云提供商就可以为GPU准备数据中心了。Rubin将于2026年上市，接替Blackwell和Blackwell Ultra，后者将于2025年上市。

“这对我们来说真的很重要——数据中心不会从天上掉下来，它们是大型建设项目。他们需要了解Blackwell数据中心将会是什么样子，它与Hopper有什么不同?’”Buck说。

由于空气冷却效率不高，Blackwell提供了一个向更密集的计算形式转移的机会，并使用了液体冷却等技术。

英伟达每年都会推出一款新的GPU，这有助于该公司跟上人工智能的发展步伐，进而帮助客户规划产品和人工智能战略。

“Rubin已经和那些最大的客户谈了很长时间了——他们知道我们的发展方向和时间表。”Buck说。

人工智能的速度和能力与硬件直接相关。花在GPU上的钱越多，越多的公司可以训练更大的模型，这反过来又带来更多的收入。

微软和谷歌已将未来寄托在人工智能上，它们正在竞相开发更强大的大语言模型。微软严重依赖新的GPU来支撑其GPT-4后端，而谷歌则依赖其TPU来运行其人工智能基础设施。

Blackwell供不应求

英伟达现在正在生产Blackwell GPU，样品将很快发布。但客户可以预期，首批将于今年年底发货的GPU将供不应求。

“每一次新技术转型都伴随着供需方面的挑战。我们在Hopper项目上肯定经历过这种情况，在Blackwell项目的坡道上也会出现类似的供需限制……从今年年底到明年，”Buck说。

Buck说，数据中心公司正在弃用CPU基础设施，为更多的GPU腾出空间。Hopper GPU将被保留，而基于Ampere和Volta架构的旧GPU将被转售。

英伟达将保留多层GPU，随着Blackwell的崛起，Hopper将成为其主流AI GPU。为了提升Hopper的性能，英伟达已经对硬件和软件进行了多项改进。

所有的云提供商都将提供Blackwell的GPU和服务器。

Brain-Sized模式

Buck说，GPT-4模型有大约1.8万亿个参数，随着人工智能的扩展尚未达到极限，参数的数量将继续增长。

“人类的大脑有1000亿到150万亿，这取决于你是谁，你的大脑里有神经元和连接。我们现在在人工智能上大约有2万亿美元……我们还没有开始推理，”Buck说。

将会有一个拥有数万亿个参数的大模型，围绕这个模型将会建立更小、更专业的模型。参数的数量对英伟达有利，因为它有助于销售更多的GPU。

混合专家模型

英伟达正在调整其GPU架构，从最初的基础模型方法转向混合专家模型。

专家混合包括多个神经网络通过相互参照来验证答案。

“1.8万亿参数的GPT模型有16个不同的神经网络，它们都试图回答自己那一层的问题，然后相互交流，决定正确的答案是什么。”Buck说。

即将推出的GB200 NVL72机架级服务器，拥有72个Blackwell GPU和36个Grace CPU，专为混合专家模型而设计。多个GPU和CPU相互连接，从而允许混合专家模型。

“这些家伙都可以相互通信，而不会被IO阻塞。这种演变在模型架构中不断发生，”Buck说。

锁定客户的技巧

英伟达首席执行官黄仁勋本月在惠普(HPE)的Discover大会上发表了一些大胆的言论，敦促人们更多地购买该公司的硬件和软件。

英伟达和惠普宣布了一个新的产品组合，其名称并不复杂，名为“HPE的Nvidia AI Computing”。

“我们已经做到了，所以你可以选择小号，中号，大号，特大号。正如你所知，你买的越多，省的就越多。”

黄在今年早些时候发表的另一个值得质疑的言论是，他说未来的程序员不需要学习如何编程。但在Nvidia gpu上加载AI模型需要掌握命令行和脚本知识，才能创建和运行AI环境。

英伟达的专有言论和在人工智能市场的完全主导地位，使其成为反垄断调查的目标。

巴克在试图缓和对CUDA的担忧时不得不小心翼翼，他说“护城河是一个复杂的词”。

两位高管都解释说，CUDA是其GPU的必备组件——要最大限度地发挥GPU的性能，你需要CUDA。开源软件可以与Nvidia gpu一起工作，但没有CUDA的库和运行时的冲击力。

向后兼容性和连续性是英伟达的独特优势。支持Nvidia的AI模型和软件，可以延续到下一代GPU。对于像英特尔的高迪这样的ASIC来说，情况就不一样了，每推出一款新型号的ASIC都必须重新调优。

原文《Nvidia Economics: Make $5-$7 for Every $1 Spent on GPUs》

点击展开全文

网友评论

聚超值推荐

券后省30 ￥9.8 ￥39.8

券后省10 ￥188 ￥198

券后省5 ￥119 ￥124

XFX 讯景 RADEON RX 6750 GRE 海外版独立显卡 12GB ￥2049 ￥2410.6

券后省10 ￥46.8 ￥56.8

HONOR 荣耀 Magic6 Pro 5G手机 16GB+512GB 绒黑色骁龙8Gen3 券后省20 ￥5879 ￥5899

Beelink 零刻 SER7 迷你台式机琥珀橙色（锐龙R7-7840HS、核心显卡、32GB、1TB SSD） 券后省188 ￥3311 ￥3499

京东云无线宝 AX3000 后羿买一送一 券后省10 ￥239 ￥249

券后省12 ￥246.2 ￥258.2

相关推荐

长江存储起诉美光花钱资助咨询公司：散布虚假信息抹黑自己！ 企业站资讯

长江存储起诉美光花钱资助咨询公司：散布虚假信息抹黑自己！

ARM将SRAM加速到7 GHz 企业站资讯

ARM将SRAM加速到7 GHz

戴尔、超微将打造马斯克的xAI超级计算机 企业站资讯

戴尔、超微将打造马斯克的xAI超级计算机

SK海力士首次披露3D DRAM 的生产良率高达56.1% 企业站资讯

SK海力士首次披露3D DRAM 的生产良率高达56.1%

甲骨文将在西班牙投资10亿美元用于AI和云计算 企业站资讯

甲骨文将在西班牙投资10亿美元用于AI和云计算

OpenAI收购了企业分析初创公司Rockset 企业站资讯

OpenAI收购了企业分析初创公司Rockset

英特尔全面优化了英特尔3 FinFET技术 企业站资讯

英特尔全面优化了英特尔3 FinFET技术

华为云开发者大会|性能倍增、体验跃级，华为云Flexus云服务正式发布 企业站资讯

华为云开发者大会|性能倍增、体验跃级，华为云Flexus云服务正式发布

两网合一、三个中心、四种融合！细读重庆沙坪坝区教育网的破局革新思路 企业站资讯

两网合一、三个中心、四种融合！细读重庆沙坪坝区教育网的破局革新思路

别让机械硬盘拖了AI的后腿！QLC与AI业务可谓天作之合 企业站资讯

别让机械硬盘拖了AI的后腿！QLC与AI业务可谓天作之合

相关产品