
英伟达公司今日宣布计划向荷兰云服务提供商Nebius Group NV投资20亿美元,该公司专注于人工智能工作负载。
这笔资金将帮助该公司扩展数据中心基础设施。Nebius计划部署配备英伟达最新Rubin图形处理器和Vera中央处理器的服务器。公司还将采用BlueField芯片系列,该系列可以将存储硬件管理等辅助任务从服务器CPU中卸载。
Nebius目前向客户提供的最先进英伟达显卡系列是Blackwell。而Nebius即将采用的新GPU Rubin,其推理工作负载的成本效率提升了10倍。
Nebius将与Rubin一起部署的CPU Vera,效率也超越了其前代产品。据报道,配备这两种芯片的设备每瓦性能比英伟达上一代硬件提升了10倍。这些重约两吨的系统包含72个Rubin GPU、32个Vera CPU和超过1000个其他芯片。
该公司在内部运营的数据中心和托管设施中托管其基础设施。公司最大的站点是目前正在新泽西州建设的300兆瓦云计算园区。其数据中心网络还遍布英国、法国、芬兰和冰岛。
Nebius提供托管GPU以及旨在简化AI模型开发的托管服务。它提供MLFlow的托管版本,这是一个开源工具,可以分析AI训练运行的遥测数据来识别低效问题。Nebius的另一项服务提供Jupyter Notebook的云托管实现,这是一个在AI项目中广泛使用的代码编辑器。
结合英伟达的投资,Nebius今日在其云平台上推出了英伟达的Nemotron 3 Super模型。这是一个专家混合算法,优化用于驱动AI智能体。Nemotron 3 Super可以处理多达100万个Token的提示,并激活其1200亿参数中的十分之一来生成答案。
该模型通过Nebius名为Token Factory的服务提供。该服务为开源AI模型扩展了自动扩缩功能和安全防护措施。此外,还支持一种称为投机解码的性能优化方法。该技术通过使AI模型能够将某些计算卸载到更小、更硬件高效的神经网络来加速推理。
Nebius计划在本十年末之前部署超过5千兆瓦的额外计算能力来支持客户工作负载。除了为该计划提供硬件外,英伟达还将提供AI集群设计材料、"技术评审"和其他形式的支持。
这笔投资是在GPU制造商与另一家AI云服务商CoreWeave Inc.签署类似协议几周后进行的。英伟达同意在早先下达63亿美元云基础设施订单后向该初创公司投资20亿美元。CoreWeave计划到2030年部署超过5千兆瓦的计算能力。
Q&A
Q1:英伟达为什么要投资Nebius这家云服务商?
A:英伟达投资20亿美元给Nebius主要是为了扩展AI云计算基础设施。Nebius专注于人工智能工作负载,将部署英伟达最新的Rubin GPU和Vera CPU,帮助英伟达在AI云服务市场建立更强的合作伙伴关系。
Q2:Rubin GPU相比现有的Blackwell有什么优势?
A:Rubin GPU在推理工作负载方面的成本效率比现有产品提升了10倍。配备Rubin GPU和Vera CPU的系统,每瓦性能比英伟达上一代硬件提升了10倍,显著提高了计算效率和降低了运营成本。
Q3:Nebius的Token Factory服务有什么特色功能?
A:Token Factory是Nebius提供的AI模型服务平台,支持英伟达Nemotron 3 Super等模型。该服务为开源AI模型提供自动扩缩功能、安全防护措施,还支持投机解码技术来加速推理性能。