解码未来科技,探索创新之路
近日,上海交通大学利用华为的Atlas 800TA2算力集群,成功完成了DeepSeek全系列模型的本地化部署,成为中国首个实现千亿级大模型全栈国产化部署的高校。此次部署包括DeepSeek-R1、DeepSeek-V3等关键模型,主要用于教学、科研、管理和公共服务等多个领域,标志着高校在人工智能基础设施建设方面迈入了一个新的阶段。 这一成就不仅展示了上海交通大学在技术应用和创新方面的领先地位,也为中国高等教育界树立了新的标杆。通过采用国产化的算力平台,学校能够更好地控制核心技术,提高数据安全性和自主性。同时,这也为其他高校提供了可借鉴的经验,鼓励更多教育机构探索和发展本土化的技术解决方案,推动国内人工智能产业的整体进步。
这背后,得益于昇腾先进架构带来的卓越性能以及原厂服务FAE的支持,多个DeepSeek模型得到了强大的算力支撑。针对高校场景的特殊需求,我们实现了三大技术突破。 这些技术进步不仅展示了昇腾在人工智能领域的强大实力,还反映了其对教育行业的深刻理解。通过与高校紧密合作,昇腾能够更好地满足学术研究的需求,推动科研成果的快速转化。此外,这种技术支持也为学生提供了接触最前沿技术的机会,有助于培养未来的科技人才。
通过采用�N腾Ascend核间通信优化技术,我们实现了4台Atlas800服务器支持DeepSeek-R1和DeepSeek-V3这两款千亿参数模型的推理任务,从而将硬件投入成本降低了65%。
基于华为昇腾AI原生算力平台,实现教学、科研、管理和服务等各种场景的算力灵活分配,显著提高了算力资源的使用效率。
全栈自主可控:从�N腾处理器到MindSpore框架的深度适配,使DeepSeek-V3在复杂数学推理任务中的端到端时延较传统方案实现有效缩短。
借助华为昇腾的独特优势,DeepSeek在推理效率上得到了显著提升,同时大幅降低了成本。2025年2月4日,DeepSeek-V3、DeepSeek-R1、Janus-Pro正式上线华为昇腾社区,支持一键获取DeepSeek系列模型。 这一消息无疑为人工智能领域注入了新的活力。DeepSeek与华为昇腾的合作不仅加速了模型的推理速度,还有效控制了运营成本。这不仅意味着开发者可以更加高效地部署和应用这些模型,也为广大用户提供了更为便捷和经济的选择。未来,随着更多类似合作的展开,我们有望见证人工智能技术更广泛的应用和更快的发展。
从即日起,上海交大的师生现在可以通过网页或APP申请使用“满血版”DeepSeek,完全不必担心会出现“深度思考无法进行”或者“对话提问没有回应”的情况。与此同时,上海交通大学的鲲鹏昇腾科教创新卓越中心也正致力于将DeepSeek系列模型融入课程设计和科研创新之中,共同探索在AI支持下全新的学习与科研模式。
鲲鹏昇腾科教创新卓越中心定位于依托鲲鹏昇腾技术体系的校级生态合作平台,在校企合作与产教融合方面发挥了关键作用。该中心致力于推动如DeepSeek等重要的人工智能创新成果在高校中的应用,进一步将人工智能技术融入到师生的学习、生活和科研活动中,助力他们在全球科技前沿不断探索前行。 这一举措不仅加速了人工智能技术在学校内部的普及与应用,也为学生提供了接触最前沿科技的机会,有助于培养未来的科技创新人才。同时,它也为企业与高校之间搭建了一个良好的合作桥梁,促进了理论知识与实践技能的有效结合,有望在未来几年内引领新一轮的技术革新潮流。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.00957秒