首页 > 电脑硬件
2025
03-17

联想AMD AI服务器突破创新界限,DeepSeek大模型单机部署总吞吐高达6708 token/s!

电脑硬件
jinting
围观1820次
0条评论
发布日期:2025年03月17日 11:43:33

联想AMD AI服务器突破创新界限,DeepSeek大模型单机部署总吞吐高达6708 token/s!

「AMD AI服务器再进化,DeepSeek大模型单机部署刷新记录,惊人吞吐率达6708 token/s!」

   今日,联想正式发布其首款基于AMD AI架构的大模型训练服务器——联想问天WA7785aG3。该服务器在搭载满血版DeepSeek 671B大模型时,展现出卓越的性能,极限吞吐量高达6708token/s,再次刷新了单机运行大模型的性能上限。这一成果不仅彰显了联想在AI基础设施领域的深厚积累,也体现了其快速响应的技术创新能力。在全球AI算力竞争日益激烈的背景下,联想凭借这款产品再度确立了行业的领先标准。

联想AMD AI服务器突破创新界限,DeepSeek大模型单机部署总吞吐高达6708 token/s!

   软硬协同打造业界性能新标杆

   借助联想万全异构智算平台,联想针对大模型的预训练、后训练及推理全流程进行了系统性优化。通过访存优化、显存调优、采用PCIe5.0全互联架构创新设计,以及精选SGLang框架中性能最佳的算子等手段,联想在搭载DeepSeek671B大模型的问天WA7785aG3设备上实现了高达6708token/s的实测最高吞吐量。

   在模拟问题对话场景中,当上下文序列长度为128或1K时,系统能够支持高达158的并发数,其吞吐量表现优秀,TPOT达到93毫秒,而整体端到端延迟TTFT仅为2.01秒。相比之下,在处理模拟代码生成任务时,尽管上下文序列长度增加至512或4K,系统的并发能力略有下降,但仍能维持140的并发数,TPOT略增至100毫秒,但TTFT显著提升至5.53秒。 从这些数据可以看出,该系统在不同应用场景下的适应性较强。问题对话场景中的高效性能表明它非常适合需要快速响应的实时交互任务,而代码生成场景虽然延迟有所增加,但也展示了其在复杂任务上的潜力。这说明该技术在面对更长输入时,对计算资源的需求会相应提高。未来若能进一步优化长文本处理效率,相信其在更多领域的应用前景将更加广阔。总体而言,这样的表现值得肯定,尤其是在人工智能技术日益普及的今天,这种高效稳定的性能对于推动行业进步具有重要意义。

   这一成绩表明单台联想问天WA7785aG3服务器能够满足1500人规模企业的日常需求,这是继联想问天WA7780G3服务器在单机部署满血版DeepSeek大模型时实现每秒2500token吞吐量的突破之后,再次刷新了单机部署该大模型推理性能的新高。 在我看来,这一技术突破不仅彰显了国产服务器在高性能计算领域的持续进步,也进一步证明了国产硬件与人工智能模型结合的潜力。随着企业数字化转型的加速,这种高效的计算能力无疑为企业提供了更可靠的技术支持。同时,这也为未来更大规模的应用场景打下了坚实的基础,展现了国产科技企业在推动技术创新方面的决心和实力。

   此次突破由联想中国基础设施业务群、联想研究院ICI实验室以及AMD联手打造,通过紧密合作与协同优化共同达成。尽管这一成果令人振奋,但它并不是终点,而是双方合作的新起点。联想与AMD仍在不断探索更深层次的技术调优方案,力求在性能上取得更大的飞跃。 我的看法是,这种跨领域的深度合作展现了科技企业在面对挑战时的创新能力和决心。联想和AMD的合作不仅推动了技术的进步,也为行业树立了一个良好的榜样。未来,随着更多类似的合作出现,我们有理由相信,技术创新的步伐将会更快,成果也会更加显著。希望双方能够继续保持这种开放合作的态度,为用户带来更多惊喜和价值。

   硬核配置构筑强大DeepSeek算力底座

   联想问天 WA7785a G3服务器是联想与AMD双方深度合作的智慧结晶,正是双方通力合作带来的技术创新、软硬协同能力与架构突破为DeepSeek-R1满血版大模型插上性能腾飞的翅膀。

   高性能计算平台:联想问天WA7785aG3配备了两颗AMD处理器以及八颗AMD最新一代Instinct OAM GPU,为大模型训练与推理任务提供了卓越的算力支持。海量显存配置:WA7785aG3具备超大显存容量,每块GPU的HBM3e显存容量高达192GB,整体达到1.5TB。如此庞大的显存不仅能够支持完整的模型推理,还能保留足够的KV缓存空间。同时,其显存带宽高达5.3TB/s,GPU聚合带宽达896GB/s,节点间的网络带宽更是达到3.2TB/s,这些特性为推理解码提供了极致加速效果,完美契合大模型并行计算对高带宽的需求,使其成为用户优先选择的大模型推理服务器。创新架构设计:联想问天WA7785aG3的特殊架构设计在释放算力潜力、突破带宽瓶颈方面起到了至关重要的作用。该服务器采用三重独立风道设计,分别针对CPU节点、GPU节点及交换机节点实施精准散热管理,提升了散热效率,为设备的稳定性与可靠性奠定了坚实基础。

   未来,联想将继续深化与产业链伙伴的技术合作,通过架构创新、算法优化以及硬件技术的突破,不断提升AI算力的性能极限,为不同行业提供高密度、低能耗且易于部署的算力解决方案。这一系列努力不仅能够推动AI算力朝着更加高效、普惠和可持续的方向发展,还将为中国智算产业注入新的活力,进一步夯实数字经济发展的技术底座。 我认为,联想此举意义重大。在当前人工智能快速发展的背景下,算力已成为推动技术创新和产业升级的关键要素。而联想选择从架构到硬件全面发力,既体现了其对市场需求的敏锐洞察,也展现了其作为科技领军企业的责任担当。尤其在“双碳”目标的大环境下,如何降低能耗、提升效率成为行业共同面对的课题,而联想提出的解决方案无疑为行业发展提供了新思路。同时,这也表明,只有坚持开放合作、协同创新,才能真正实现技术红利的广泛共享,让AI真正惠及更多领域和人群。这不仅是企业竞争力的体现,更是推动社会进步的重要力量。

本文固定链接: https://www.news9999.cn/arts_content-74741.html 转载请注明出处(科技快讯中文网-www.news9999.cn)
最新发布 Steam Deck OLED内存翻倍至32GB!玩家热议的改装新玩法  2025-08-11 20:46:26 雷神首款台式机箱黑武士・创世震撼登场:双色可选带屏,ATX/M-ATX全面覆盖  2025-08-11 18:53:11 华硕XG248QSG震撼登场:610Hz超神刷新率,电竞玩家狂喜!  2025-08-11 18:52:36 三星预告2026年初发布PCIe 6.0企业级固态硬盘PM1763,存储革命即将来袭  2025-08-07 11:19:18 AMD 发布 RDNA 3 入门级专业显卡 W7400,W7500 降频版引发关注  2025-08-07 10:04:57 机械革命蛟龙16 Pro潮玩版首销:R9-9955HX+RTX5060性能组合仅需6799.2元!  2025-08-04 14:29:41 微星首推 Hx10 入门平台 ITX 主板:PRO H810I WIFI 重塑迷你主机新体验  2025-08-04 14:27:04 英特尔网吧新主张:10核CPU+2K 360Hz显示器打造极致游戏体验  2025-07-29 14:58:54 64核仅4万!AMD Zen5撕裂者9000X国行价格引爆市场  2025-07-28 12:42:36 蓝白炫影登场,B570 ECLIPSE 黑色双风扇显卡重塑视觉与性能新体验  2025-07-28 11:53:40 砺算科技发布全球首款6nm自主架构GPU:性能直逼RTX 5060,国产显卡新纪元开启  2025-07-26 10:25:04 荔枝鲜煎背后的AI黑科技:英特尔锐炫Pro B60的折叠空间革命  2025-07-22 12:42:36 RTX 5090移动版狂飙250W!性能飙升20%引爆游戏革命  2025-07-21 15:28:05 TRYX展域WB处理器水冷头震撼登场:OLED曲屏+VRM风扇打造极致视觉与散热体验  2025-07-21 15:04:57 微星三款 PRO 系列 B8x0 PZ 背插主板震撼登场,双芯并进引领性能新纪元  2025-07-21 15:02:11 AMD 64核神机曝光!线程撕裂者9980X多核性能狂飙16%  2025-07-18 13:54:03 狂暴狙击,极速制胜!AOC BW2025显示器震撼亮相  2025-07-18 13:18:58 AMD Radeon AI PRO R9700 单卡震撼登场,7月23日开启销售新篇章  2025-07-18 13:12:00 微星ARGB环刃风扇登场:160mm双层扇叶,109元起开启炫酷风效新时代  2025-07-18 13:10:22 风神来袭!RX 7600 XT 16GB 显卡正式登陆中国零售市场  2025-07-17 10:49:54 博帝震撼发布!慧荣SM2508旗舰主控PV593开启PCIe 5.0高速存储新时代  2025-07-17 10:49:27 AMD Ryzen Z2 Extreme掌机处理器跑分暴增:单核多核性能全面碾压前代  2025-07-16 14:10:52 三风扇200W狂暴输出!联想来酷斗战者战7000游戏本震撼登场:2.5K 180Hz屏引领新视界  2025-07-16 11:47:05 索泰震撼发布七款Quadro MXM专业显卡:RTX 5000加持,转接卡解锁无限可能  2025-07-15 12:43:56 酷冷至尊ITX机箱NR200P V3震撼登场:显卡侧开窗设计,699元开启迷你主机新体验  2025-07-14 13:50:31
友情链接 百度权重≥5友情链接交换
文化潮流网  |  数界探索  |  文化新视界  |  深度文化说  |  智慧科技  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经
© 2015-2025 科技快讯中文网 时光记忆 版权所有 备案号:陇ICP备2025016403号-1

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.012905秒