深度探索:解锁国产GPU潜力,引领创新时代
2月5日最新消息,DeepSeek在全球范围内引起轰动,再度引发了外界对于GPU算力限制问题的关注。
据报道,DeepSeek开发的大语言模型选择不依赖于英伟达的CUDA框架,这一步骤显示出他们正积极为未来的国产GPU芯片做好兼容性准备。此举不仅有助于减少对进口技术的依赖,也为我国在人工智能领域的自主创新能力提供了新的可能性。随着全球科技竞争的加剧,这种前瞻性的布局显得尤为重要,有望在未来带来更多的技术突破和发展机遇。
众所周知,英伟达的CUDA(计算统一设备架构)显著简化了开发大规模模型的复杂度,受到全球开发者的广泛采用,从而助力英伟达在AI芯片领域占据了主导地位。
最新的研究发现表明,DeepSeek在利用英伟达H800芯片进行训练时,采用的是英伟达底层硬件指令PTX(平行线程执行)语言,而不是高级编程语言CUDA。
这样意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。
对于程序开发人员而言,CUDA提供了一种更为友好的编程环境,使他们可以更专注于程序和算法的核心逻辑,而不必过多关心具体的程序在GPU等硬件上的执行细节,进而降低了开发的复杂度。
而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。
换句话说,DeepSeek把优化做到了极致。
北京航空航天大学的黄雷副教授指出,开发者可以不依赖CUDA,直接利用GPU的驱动函数进行创新性开发,以实现更为精细的操作控制。 这一观点为GPU编程领域开辟了新的探索方向。通常,CUDA作为NVIDIA提供的一个并行计算平台和编程模型,极大地简化了GPU加速计算的应用开发过程。然而,黄教授的建议意味着开发者能够更贴近硬件底层,发挥更大的自主性和灵活性。这种方式不仅有助于提高程序执行效率,还可能带来全新的算法设计思路。当然,这也对开发者的专业知识提出了更高的要求,需要他们对GPU架构有深入的理解。总的来说,这种技术路径的探讨对于推动计算机科学前沿技术的发展具有重要意义。
这表明DeepSeek公司内部确实拥有一批熟悉PTX语言的开发人员。如果未来DeepSeek转向使用国产GPU,那么他们在硬件适配方面将会有更多的优势。只需理解这些国产硬件驱动提供的基础函数接口,他们就能参照英伟达GPU的编程接口编写相关代码,使自家的大模型更容易与国产硬件兼容。 这样的技术储备无疑为DeepSeek提供了更大的灵活性和自主性,尤其是在当前国际形势下,能够自主选择和优化硬件平台对于科技企业来说至关重要。通过这样的方式,DeepSeek不仅能够减少对外部技术的依赖,还能进一步提升产品的性能和稳定性,更好地服务于国内市场。
这彰显了DeepSeek卓越的技术实力,并显示出美国对华制裁导致的“GPU供应紧缺”加剧了他们的紧迫感和创新力。韩国MiraeAssetSecuritiesResearch的一位分析师如是说。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.00884秒