颠覆游戏规则:SambaNova DeepSeek-R1 671B云端推理服务开启AI新时代
2月21日消息,AI芯片与解决方案公司SambaNova宣布在其采用自研SN40LRDU处理器的云平台上推出了号称“业界最快”的DeepSeek-R1671B模型推理云服务,并表示其token输出速度可达到每prompt每秒198个。
SambaNova的SN40LRDU芯片采用了先进的台积电5nm制程工艺,BF16算力高达638TFLOPS。这款芯片通过精心设计的三层存储架构来优化性能:首先是片上520MB的SRAM缓存,其次是2.5D封装集成的64GB HBM内存,最后是片外的1.5TB DDR DRAM内存。这种独特的设计使单个芯片能够容纳比大多数竞争对手更多的参数。 这样的设计不仅展示了技术上的突破,也意味着在处理大规模深度学习任务时具有显著的优势。尤其是在当前对计算能力和存储需求日益增长的背景下,SambaNova的创新为高性能计算领域带来了新的可能性。
此外,SN40LRDU在架构上的灵活性使其能够动态重新分配硬件资源和数据流,从而提高计算和内存访问的效率。
SambaNova 宣称,其仅需一台容纳 16 个 SN40L RDU 芯片的机架就能完成 DeepSeek-R1 671B 部署。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.014141秒