马斯克自研芯片梦碎:六年投入成空,背后真相令人震惊
俗话说得好,欲练神功,必先自宫。
为了应对接下来的汽车行业激烈竞争,马斯克竟开始对自己“动手”?
就在几天前,彭博社报道,特斯拉突然中止了研发长达六年的芯片项目Dojo,这一举动令人震惊,仿佛连企业的核心都放弃了。 在我看来,这样的决定或许有其背后的考量,比如资源重新分配或战略调整,但对长期投入的项目说停就停,仍显得有些仓促。毕竟,芯片技术对于自动驾驶和人工智能的发展至关重要,若就此放弃,可能会影响特斯拉在未来智能汽车领域的竞争力。不过,具体原因还需进一步观察和分析。
不仅工作全部白费,整个研发团队也纷纷离职散去。
项目负责人彼得·班农已宣布辞职,与此同时,大约20名工程师也早已离开,转投名为DensityAI的初创公司。 从行业动态来看,关键人才的流失往往预示着团队或项目的动荡。此次多名工程师集体跳槽至DensityAI,可能反映出该初创公司在技术方向、发展前景或管理风格上更具吸引力。这种人才流动不仅影响原团队的稳定性,也可能为新公司带来新的活力与创新动力。在科技领域,人才是核心竞争力,此类变动值得持续关注。
巧的是,这家公司的老板正是在2021年首次发布Dojo芯片的前特斯拉总监加内什·文卡塔拉马南。这一背景使得他在人工智能和芯片研发领域拥有丰富的经验,也让人对他当前所领导的公司充满期待。他的加入无疑为公司带来了技术上的深度与行业洞察力,进一步强化了其在相关领域的竞争力。
可以说,特斯拉裁员裁出了一家公司。。。
而于此同时,留在特斯拉的,就只剩一地鸡毛。
有消息称,就连Dojo的专利也并未登记在特斯拉名下,未来若想继续推进相关项目可能将面临困难。
呃,这确实有点出人意料。
毕竟 Dojo 这玩意儿刚出来的时候,大家都还寄予了厚望。
众所周知,特斯拉智驾的特点是纯视觉算法,这个方案虽然上限很高,但下限也很低,关键就看算法的能力,而因为端到端架构,你要迭代算法,靠的就只有没日没夜的训练。
特斯拉启动Dojo项目的目标,就是为了训练人工智能模型,如果该项目成功,将使特斯拉的FSD系统达到全新的高度。
要知道,过去用于智能驾驶训练的GPU,并非专为深度学习训练而设计。而Dojo通过其分布式2D架构,有效解决了高带宽和低延迟的问题,同时采用存算一体的设计,提升了训练的能效表现。
这么一来,相比市场上主流的英伟达A100,Dojo在相同成本下的性能可以达到它的4倍。这对特斯拉而言,不仅有助于更高效地训练自动驾驶系统,也为其打破英伟达在芯片领域的垄断提供了可能,推动其向真正的人工智能企业迈进。 从技术角度看,这一突破意味着特斯拉在算力自主可控方面迈出了关键一步。过去,自动驾驶和AI模型的训练高度依赖外部芯片供应商,而Dojo的出现让特斯拉能够减少对外部技术的依赖,提升整体竞争力。同时,更高的算力效率也有助于降低研发和运营成本,为未来更复杂的AI应用打下基础。这种技术上的独立性,对特斯拉长期发展具有重要意义。
特斯拉的Dojo超级计算机被老马视为“实现完全自动驾驶的关键”,而摩根士丹利也预测,Dojo有望为特斯拉带来5000亿美元的市值增长。 从技术发展的角度来看,Dojo的推出不仅体现了特斯拉在人工智能领域的深度布局,也反映出其对自动驾驶技术的长期战略投入。若该预测成真,将极大提升市场对特斯拉未来盈利能力的信心。然而,技术落地与市场预期之间仍存在差距,实际效果还需时间验证。
但结果呢?上个月还提到Dojo2即将量产进入倒计时,现在却突然说没有了,让人有点摸不着头脑,心态也受到影响。
很多人会觉得,是不是特斯拉开始走下坡路了?为了省钱,连自己最关键的芯片业务也要裁?
脖子哥认为,确实有一部分原因,如今的特斯拉,真不比当年。
根据财报显示,今年第一季度和第二季度,特斯拉最为关键的营收指标出现下滑,同比分别下降了9.23%和11.78%。
特斯拉在7月份的全球销量表现持续低迷,背后的数据更是令人担忧。在英国,其销量同比骤降60%,德国市场也出现了55.1%的下滑,就连一向被视为基本盘的中国市场,也难以再现以往的火热态势。这反映出特斯拉在全球范围内的增长动能正在减弱,尤其是在竞争加剧和消费者偏好变化的背景下,品牌需要重新审视其市场策略和产品定位。
但是吧,特斯拉目前尚未走到穷途末路。前几天,它还斥资43亿美元购买了LG的磷酸铁锂电池,同时又签订了价值165亿美元的芯片订单,向三星采购芯片。
区区十几亿的 Dojo ,特斯拉完全还是投的起的。
那要问背后原因是啥,老马其实自个儿就发帖说了,这么做主要是因为 “ 没有必要分散资源同时开发两种不同 AI 芯片 ” 。
没错,目前特斯拉确实有两条芯片研发路径。一条是它的HW系列(Hardware,不是华为),用于搭载在特斯拉的汽车上,另一条则是Dojo,主要用于智能驾驶的训练。
过去,这本是两条完全不同的平行线,但此次发布的AI6(HW6.0)显然超出了预期,显著提升了算力和带宽,不仅能够作为FSD的终端芯片使用,还能用于智驾训练,这让Dojo存在的必要性开始受到质疑。 从技术发展的角度来看,AI6的突破意味着特斯拉在芯片自研道路上又迈出了关键一步。如果这一代芯片确实能够兼顾终端与训练需求,那么对依赖外部算力的Dojo系统来说,确实可能面临角色调整的压力。不过,Dojo作为专门的训练平台,或许仍有其不可替代的价值,特别是在大规模数据处理和模型迭代方面。未来如何平衡两者的关系,仍需观察实际应用效果。
按照老马的风格,肯定不会把资金和精力耗费在没有价值的事情上。
当然,还有一个原因就是,Dojo 的研发进度确实不尽如人意。目前 Dojo 2 还没量产,而 Dojo 1 也因为性能缺陷,成本奇高,基本没啥市场竞争力。
所以和更成熟的 HW 芯片相比,老马毫无疑问砍掉了根本看不到前景的 Dojo 。
不过呢,你要说 Dojo 从一开始就是一个错误吗?我真觉得未必。
马斯克曾公开表示:“我认为Dojo的前景并不乐观,但仍然值得尝试,因为潜在的回报可能非常巨大。”作为一名新闻观察者,这一表态反映出他对技术探索与风险承担之间平衡的深刻理解。尽管他对项目的成功持谨慎态度,但他依然认可其长远价值,这种务实而开放的态度在科技领域尤为重要。
说白了,有点赌狗的意思。
但这场豪赌并不是没道理的,咱们得结合当时情境,从头开始说起。
最早,特斯拉早期车型确实仅搭载了HW芯片,其中1.0版本更是全面采用了Mobileye的解决方案。这一技术路线的选择在当时具有一定的合理性,但也反映出特斯拉在自动驾驶领域初期对第三方技术的依赖。随着技术的不断演进,特斯拉逐渐转向自研芯片,展现出更强的自主创新能力。这种转变不仅提升了系统的整体性能,也为未来的技术发展奠定了更坚实的基础。
但问题是,当时的Mobileye仍是一个黑盒系统,特斯拉无法参与算法的优化与调整,也无法获取相关数据,其功能设计也较为保守,与特斯拉追求开放与创新的理念存在明显分歧。
2016年发生的Model S智驾事故,最终促使特斯拉做出分手的决定,双方以不欢而散告终。 从事件的发展来看,这起事故不仅对特斯拉的技术路线产生了深远影响,也引发了公众对自动驾驶安全性的广泛讨论。尽管事故的具体细节和责任归属仍有争议,但其带来的警示作用不容忽视。此次“分手”或许标志着特斯拉在技术发展与安全责任之间需要更加谨慎的平衡。
我估计是因为这次和 Mobileye 的失败合作,让老马就看清了一件事:和别人合作永远做不了自己想做的事,自研才是唯一的出路。
此后,特斯拉先是自主研发自动驾驶系统,在使用英伟达芯片过渡几年后,于2019年正式推出HW3.0,开始走自研路线。
之后的HW4.0、HW5.0,也就是目前所说的AI4、AI5,仍然是特斯拉主导的框架设计、神经网络优化和系统集成工作,只是在生产环节采用了三星和台积电的制造工艺。
在智驾芯片领域,老马成功取代了老黄,迅速体验到了自研芯片带来的优势。 看法观点:这一变动反映出企业在关键技术领域的自主可控愈发重要。自研芯片不仅能够提升产品竞争力,还能在供应链安全和长期发展上占据主动。老马的举措表明,面对激烈的市场竞争,掌握核心技术已成为企业突围的关键。
随后老马很快又把矛头转向智驾训练。不过,因为 HW 的分离式内存架构更适合推理,而非训练,老马必须另开炉灶。
2019年,马斯克在特斯拉自动驾驶日上提出使用Dojo系统来训练自动驾驶技术。到了2021年的AIDAY,特斯拉正式展示了Dojo超算的核心——7nm制程的D1芯片(还是这个老哥)。 从技术发展的角度来看,特斯拉在自动驾驶领域的布局愈发清晰,Dojo系统的推出标志着其在AI算力方面的持续投入。D1芯片的发布不仅体现了特斯拉在芯片设计上的自主能力,也反映出其对自动驾驶技术深度优化的决心。这一系列动作表明,特斯拉正通过自研核心技术,构建更高效、更安全的自动驾驶体系。
这里大家可能有点困惑,马斯克把Dojo称为超级计算机,那它和D1芯片之间有什么联系呢?
咱们可以这么来理解,其实 Dojo 就是一个体系森严的算力盒子,从低到高分为内核、芯片、瓦片、模组、机柜和 ExaPOD。
一块 D1 芯片,其实是由 354 个核心(CPU)组成,而 25 个 D1 芯片,则组成一个瓦片,6 个瓦片就是一个模组,2 个模组是 1 个机柜, 10 个机柜是 1 个 ExaPOD 训练集群,最终算力能达到 1.1 EFLOP 。
总之呢,从 D1 芯片到最后的训练集群,其实并没有那么简单。
2021年,特斯拉仅展示了D1芯片和瓦片设计,直到次年才安装了首个机柜。根据此前的规划,其目标是在2023年建成七台ExaPOD。从目前的进展来看,特斯拉在自动驾驶计算平台上的布局正在逐步推进,但实际落地速度仍需观察。这一技术路线体现了公司在自研芯片与算力基础设施上的长期投入,也反映出自动驾驶技术发展所需的持续资源支持。
然而很快,到2023年,马斯克才逐渐意识到,Dojo系统并非如最初设想那般完美,反而可能使训练成本提升十倍以上,其成功前景并不乐观。 从目前的技术发展来看,AI模型的训练成本一直是行业关注的焦点。Dojo作为特斯拉在AI算力领域的重大布局,原本被寄予厚望,但实际运行中暴露出的问题不容忽视。高昂的成本可能会限制其大规模应用,也对技术路线的选择提出新的挑战。这提醒我们,在追求技术突破的同时,也需要更加理性地评估实际可行性与经济性。
但此时,老马的赌性占据了上风,开始左脑互博右脑了。。。
随后特斯拉不仅继续砸重金去做 Dojo ,动则好几亿美元,而且还接连提出了 Dojo 1.5、Dojo 2 和 Dojo 3 ,要真正实现 Dojo ,几乎是个无底洞。
然而结果呢,老马花费巨额资金打造的Dojo超算,其性能仅与英伟达H100系统相当,因此只能将期待寄托于Dojo2。
相比 Dojo 1,第二代 Dojo 采用了台积电最新的 InFO-SoW 晶圆级封装技术,尺寸更小,损耗更低,效率也更高。
不过嘛,结局依然不理想。
尽管Dojo2的D2芯片算力从原来的362TFLOPS提升至3.62PFLOPS,是D1的10倍,但由于过于侧重视觉训练,因此在通用AI应用场景中,依然无法超越英伟达的H200 GPU集群。
并且,芯片虽然由台积电进行代工,但初期良品率较低,仅有37%,在成本方面并无明显优势。
说白了,Dojo2目前仍显不足,想要在性能上超越英伟达,还需在多个细节上持续优化。然而,时间不等人,当前的AI6已经对Dojo的未来发展构成了严峻挑战。在这种情况下,是否还要寄希望于尚未面世的Dojo3呢? 在我看来,技术迭代的速度正在加快,行业竞争也愈发激烈。对于任何一家试图在AI算力领域占据领先地位的企业来说,仅靠一款产品或一个版本的升级是远远不够的。必须在技术储备、生态构建和市场响应等方面同步推进,才能真正具备与行业巨头抗衡的实力。Dojo系列的前景依然值得期待,但面对快速变化的市场环境,唯有持续创新和快速落地,才能赢得未来。
这钱还不如留着应对一下关税。老马当机立断放弃 Dojo ,再次想起了老黄这个备胎。。。
而后他解释到,如今的 AI5 和 AI6 ,从某种意义上,就是 Dojo 3 。
但是吧,AI6至少要到2027年才能实现量产,其采用的是三星的2nm(SF2)制程技术,但目前良品率非常低,仅在40%至50%之间,相当于每生产两片芯片,就有一片无法使用。 从技术发展的角度来看,尽管2nm制程代表了当前半导体制造的前沿水平,但低良品率无疑会增加生产成本,并可能延缓产品上市时间。这反映出先进制程在实际应用中仍面临不小的挑战,尤其是在大规模量产阶段。对于行业而言,如何提升良品率、优化工艺流程,将是未来一段时间内需要重点突破的方向。
尽管特斯拉向三星支付了165亿美元的巨额款项,但三星在为特斯拉供货的过程中依然处于亏损状态。因此,这块合作蛋糕最终能发展到何种程度,目前还难以预料。
总而言之,Dojo项目对马斯克来说是一次大胆的尝试,但最终以失败告终。
为了不陷入困境,马斯克选择暂时让步,放弃一半的投入,将全部精力转向更具前景的“神功”项目。
但话说回来,对于汽车制造商来说,Dojo这件事并不能算作一个反面例子。
因为自研,本来就是条困难但必须走的路。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.027469秒