什么是GB200 Grace Blackwell系统

AI解读 1个月前 硕雀
21 0

GB200 Grace Blackwell系统是英伟达推出的一款高性能计算平台,其核心组件为GB200 Grace Blackwell超级芯片。这款超级芯片通过900GB/s的超低功耗NVLink技术,将两个NVIDIA B200 Tensor Core GPU与一个Grace CPU相连,从而实现高效的计算协同。

GB200 Grace Blackwell超级芯片是英伟达Blackwell架构的重要组成部分,具有以下特点:

  1. 硬件组成:包含两颗B200 GPU和一颗Grace CPU,总功耗可达2700W。
  2. 内存与带宽:每个GPU配备192GB HBM3e内存,总带宽为8TB/s,CPU则配备512GB LPDDR5内存,通过16个内存通道连接,形成统一的内存域。
  3. 性能表现:在FP4训练精度下,GB200的AI性能可达40 petaFLOPS,同时支持大规模生成式AI任务。
  4. 互连技术:采用第五代NVLink-C2C技术,提供900GB/s的双向带宽,确保数据传输的高效性。
  5. 应用场景:适用于高度计算密集型的工作负载,如大规模语言模型(LLM)推理、实时生成式AI任务以及物理模拟等。

GB200 Grace Blackwell超级芯片还被整合到NVIDIA的多节点液冷机架扩展系统——GB200 NVL72中。该系统由36个Grace CPU和72个Blackwell GPU组成,能够提供高达1.4 exaFLOPS的AI性能和30TB的内存容量,是当前最强大的AI超级计算机之一。

GB200 Grace Blackwell系统通过其先进的硬件设计和强大的计算能力,为AI训练、推理以及大规模生成式AI任务提供了前所未有的性能支持,标志着计算技术迈向新的高度。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!