NVIDIA的前沿HopperGPU具有13,000个AI设计电路实例

摘要 不可否认,NVIDIA在过去几年中已经成为AI巨头,他们的GPU不仅成为HPC的首选,而且成为包括AI和深度学习生态系统在内的数据中心的首选。最近

不可否认,NVIDIA在过去几年中已经成为AI巨头,他们的GPU不仅成为HPC的首选,而且成为包括AI和深度学习生态系统在内的数据中心的首选。最近,NVIDIA宣布它正在利用AI设计和开发远远优于人类创造的GPU,看起来绿色团队的旗舰HopperGPU就是对这一声明的证明,它具有近13,000个电路实例,这些实例完全由人工智能。

在NVIDIA开发者网页上发布的博客中,该公司重申了其优势以及它自己如何利用其AI功能来设计其迄今为止最强大的GPU,即HopperH100。NVIDIAGPU主要使用最先进的EDA(电子设计自动化)工具设计,但在AI的帮助下,该方法利用PrefixRL方法,使用深度强化学习优化并行前缀电路,公司可以设计更小、更快、更节能的芯片,同时提供更好的性能。

计算机芯片中的算术电路是使用逻辑门网络(如NAND、NOR和XOR)和电线构成的。理想的电路应具有以下特点:

NVIDIA使用这种方法设计了近13,000个AI辅助电路,与同样快速且功能相同的EDA工具相比,它们的面积减少了25%。但是PrefixRL被提到是一项计算要求非常高的任务,并且对于每个GPU的物理模拟,它需要256个CPU和超过32,000个GPU小时。为了消除这个瓶颈,NVIDIA开发了Raptor,这是一个内部分布式强化学习平台,它特别利用NVIDIA硬件进行这种工业强化学习。

借助AI打造的全球最快AI芯片NVIDIAHopperGPU-拥有近13,000条AI设计电路

Raptor具有多项可提高可扩展性和训练速度的功能,例如作业调度、自定义网络和GPU感知数据结构。在PrefixRL的上下文中,Raptor使得跨CPU、GPU和Spot实例的混合分配工作成为可能。

Raptor在NCCL之间切换以进行点对点传输以将模型参数直接从学习器GPU传输到推理GPU的能力。

Redis用于异步和较小的消息,例如奖励或统计信息。

一种JIT编译的RPC,用于处理大容量和低延迟的请求,例如上传体验数据。

NVIDIA得出结论,将AI应用于现实世界的电路设计问题可以在未来带来更好的GPU设计。完整的论文在此处发布,您也可以在此处访问开发人员博客以获取更多信息。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。