GPU 直连 SSD 破 AI 算力瓶颈
5 月 20 日消息,英伟达正联合亚马逊研发新一代存储架构,实现 GPU 直接操控 SSD,跳过传统 CPU 中转调度环节,
计划率先在下一代 Vera Rubin AI 平台搭载 **GIDS(GPU 发起直接存储访问)** 技术。
计划率先在下一代 Vera Rubin AI 平台搭载 **GIDS(GPU 发起直接存储访问)** 技术。
当前冯・诺依曼架构存在天然短板,数据需经 CPU 中转、DRAM 缓存后才能传输至 GPU,
CPU 处理能力与 GPU 海量并行算力严重失衡,成为 AI 训练与推理的性能瓶颈。
CPU 处理能力与 GPU 海量并行算力严重失衡,成为 AI 训练与推理的性能瓶颈。
GIDS 技术可让 GPU 直接向 SSD、高速闪存下发读写指令,省去 CPU 与 DRAM 中间层级。为适配该技术,
高带宽闪存(HBF)应运而生,用以弥补 HBM 容量短板。延世大学研究显示,6 颗 HBF 搭配 2 颗 HBM,
可将 GPU 存储容量由 192GB 提升至 3120GB,增幅超 16 倍。
高带宽闪存(HBF)应运而生,用以弥补 HBM 容量短板。延世大学研究显示,6 颗 HBF 搭配 2 颗 HBM,
可将 GPU 存储容量由 192GB 提升至 3120GB,增幅超 16 倍。
应用层面,HBF 更适配 AI 推理的静态模型参数存储,高频 AI 训练仍依赖 HBM。
行业端已加速布局:英伟达主导 GIDS 标准,亚马逊率先落地云端集群,微软、AMD 自研同类方案,三星则以 Z‑NAND 闪存抢占硬件赛道。
行业端已加速布局:英伟达主导 GIDS 标准,亚马逊率先落地云端集群,微软、AMD 自研同类方案,三星则以 Z‑NAND 闪存抢占硬件赛道。
