新加坡挑战NVIDIA AI芯片霸主地位,美国科技界陷入地震般动荡
2月3日消息,DeepSeek大模型的表现引起了美国AI行业的广泛关注,其性能可与OpenAI的GPT-1相媲美,而训练成本却低得多,这引起了美国政府的怀疑和调查,甚至波及到新加坡的相关机构。
DeepSeek官方并未具体透露大模型训练的硬件规模,仅提到使用了少量的2048块H800 GPU,在两个月的时间里训练出了拥有6710亿参数的V3大模型,相当于消耗了约280万个GPU小时。
相比之下,Meta公司投入了16381颗H100 GPU,耗时54天成功训练出了一个包含4050亿参数的Llama3大型语言模型。这一过程消耗了约3080万颗GPU小时,这使得硬件成本显著增加,与普通计算资源相比,差距竟高达11倍。 这样的高成本投入反映了在人工智能领域,尤其是在开发超大规模语言模型方面,需要巨额的资金支持。这也说明了技术进步的背后往往伴随着高昂的经济代价。对于其他企业或研究机构而言,如何平衡成本与技术创新,成为了一个值得深思的问题。
半导体研究机构SemiAccurate提出,DeepSeek应该囤积了大约6万颗NVIDIA GPU,包括1万颗A100、1万颗H100、1万颗H800、3万颗H20,总成本超过140亿元。
其中,A100、H100始终都在美国限制对华出口只列,H800作为特供版一度合规,之后也被限制,目前只有H20是完全合规的。
欧美普遍认为,DeepSeek利用美国出口管制的漏洞,获取了大量NVIDIA的高端H100 GPU,数量可能多达5万颗。
根据NVIDIA的财报,在2022年底美国开始限制AI芯片对华出口时,新加坡贡献的收入占比仅为9%,然而目前这一比例已飙升至22%,这种情况显得颇为异常。
因此,美国白宫和FBI等机构正在调查,DeepSeek是否通过一家位于新加坡的第三方公司,获取了受管制的NVIDIA AI GPU。
同时,美国相关人士呼吁加强对新加坡的进出口监管措施,以防止受限制的产品最终流入中国。
不过,截至目前,美国政府尚未发现任何确凿证据。
NVIDIA表示,他们严格遵循相关法律法规。据了解,他们与新加坡的大部分交易涉及的货物实际上是运往其他地区,而非中国。
NVIDIA指出,与新加坡有关的收入并不代表货物发往中国,其官方文件中展示的只是客户的账单地址,而非实际发货地址。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.0088秒