全球首例直触液冷AI基地落成:8192块AMD MI325X打造2048TB超能算力,算力狂飙引爆智能新时代
7月15日消息,AI基础设施企业TensorWave宣布,其在北美地区建成并部署了目前规模最大的AI训练基地,该基地共配置了8192块AMDInstinct MI325X AI加速卡。这一举措标志着企业在高性能计算与人工智能领域迈出了重要一步,也反映出当前AI技术对算力需求的持续攀升。随着AI应用的不断扩展,类似的大规模基础设施建设将成为推动行业发展的关键力量。
同时,这将是全球首个公开披露采用直触液冷技术的大型AI数据中心。
AMDMI325X是去年刚刚发布的新型处理器,采用了先进的5nm制造工艺,拥有304个计算单元(共计19456个核心),内部集成了1530亿个晶体管。其FP8精度下的算力达到2.6千万亿次浮点运算每秒,性能表现十分突出。同时,该芯片配备了256GB HBM3E高带宽内存,带宽高达6TB/s,能够有效支撑大规模并行计算任务。 从技术角度看,AMDMI325X的发布标志着高性能计算领域又迈出了重要一步。在AI、科学计算和大数据处理等对算力需求极高的场景中,这样的硬件配置无疑将带来显著的性能提升。不过,随着芯片复杂度的增加,功耗与散热问题也愈发值得关注。未来,如何在保持高性能的同时实现更高效的能源管理,将是厂商需要持续探索的方向。
尽管AMD最新推出了MI350X和MI355X显卡,但其部署仍需一定时间,目前MI325X仍是已实际应用的最先进的AMD AI加速卡。
8192块设备部署在一个系统中,总的核心数接近1.6亿个,FP8的计算性能达到惊人的2100亿亿次浮点运算每秒。
同时,显存总容量多达2048TB,总带宽超过2PB/s!
单卡功耗就达到1000W,在满载情况下,每小时耗电量超过8000度,确实需要配备液冷系统。所有节点的GPU均采用了TensorWave自有的芯片直触液冷循环系统,确保有效散热。
这套系统将以云服务的方式,对外提供租赁服务。
这还只是TensorWave更宏大工程的第一阶段,预计今年晚些时候引入AMDMI350X,支持FP4/FP6格式,性能和带宽更猛,但功耗也将最高达到1400W。 从目前的进展来看,TensorWave在高性能计算领域的布局正在加速推进。AMDMI350X的引入标志着其在算力与能效比之间的探索进入新阶段。虽然1400W的功耗对于当前的硬件设计来说是一个不小的挑战,但也反映出该芯片在处理复杂任务时的强大能力。随着FP4和FP6等新型浮点格式的支持,未来在AI训练、科学计算等高负载场景中,这款芯片或将带来更显著的性能提升。不过,如何在如此高的功耗下维持稳定性和散热效率,仍是值得关注的问题。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.0077秒