马斯克放话:Grok 4提前上线,xAI狂揽百亿美元,人类知识将被彻底颠覆!
马斯克旗下xAI的“重磅炸弹”Grok4被提前泄露!有开发者在xAI控制台的源代码中意外发现了两个全新模型,分别是Grok4和Grok4Code。 这一消息无疑引发了广泛关注。尽管目前尚不清楚这些模型的具体性能和应用场景,但其出现本身就显示出xAI在人工智能领域的持续投入与技术推进。对于开发者和用户而言,这既是机遇也是挑战,意味着未来可能会有更多基于这些模型的创新应用涌现。同时,这也提醒相关企业,在技术开发过程中需更加注重信息安全,避免关键信息过早外泄。
与此同时,xAI刚刚完成了一轮100亿美元(约716亿人民币)的融资,这一数额再次凸显了市场对其技术潜力和未来发展方向的高度认可。此次融资不仅为公司提供了充足的资金支持,也反映出全球资本对人工智能领域持续投入的坚定信心。在当前科技竞争日益激烈的背景下,这样的资金注入无疑将加速xAI在前沿技术上的探索与布局。
更有趣的是,xAI决定跳过原定于5月发布的Grok3.5版本,直接推出Grok4。
团队内部将这种做法称为“极限迭代”——不是不更新,一旦更新就会进行大幅调整。
这很符合马斯克一贯的风格,就像当年特斯拉绕过传统汽车厂商的渐进式改良,直接迈入纯电车时代一样。 在我看来,这种做法体现了马斯克对技术趋势的敏锐判断和敢于突破常规的勇气。他不满足于循序渐进,而是选择以颠覆性的方式推动行业变革,这种思维方式在科技与商业领域都具有重要的借鉴意义。
Grok4被定位为“最新且最强大的旗舰模型”,官方表示其在自然语言处理、数学能力以及推理方面表现出色,性能卓越,被视为全面且理想的首选模型。
Grok 4 目前支持文本模态,视觉、图像生成和其他功能即将推出,将包含函数调用、结构化输出和深度思考功能。
Grok4的上下文窗口为13万个token,相较于许多前沿模型来说稍显有限,这可能反映出xAI在设计时更注重推理速度和实时响应能力,而非单纯追求处理长文本的能力。 从技术发展的角度来看,这种选择或许是为了在实际应用场景中提供更高效的用户体验,特别是在需要快速响应的场景下,如实时对话或即时决策支持。尽管长文本处理能力在某些领域仍有其重要性,但当前AI的发展趋势也显示出对效率与实用性的高度重视。
另一份资料显示,它在数据提取、代码生成、文本摘要等企业应用场景中表现出色,并具备金融、医疗、法律和科学领域的专业知识。
Grok4Code是一款专为编程设计的垂直模型,可直接集成到Cursor等代码编辑器中使用。
从中可以看出,xAI 争夺开发者市场的意图明显。
但马斯克的抱负远不止于此,他提出了一项听起来极具“马斯克风格”的宏伟计划:
利用Grok4的推理能力对全球知识体系进行全面梳理,补充其中的空白部分,修正已知的错误信息,随后基于这一“纯净版”知识库重新训练人工智能系统。
只不过这个缺失是他认为的缺失,错误是他认为的错误。
实际上,马斯克此前已小范围进行了相关测试。5月份,Grok在回答各类不相关问题时,会随机提及“南非发生白人种族灭绝”的说法,并且承认自己被要求接受这一并不存在的虚假事件。
马斯克在南非出生并长大,他过去曾表达过对南非社会变迁的一些看法,其中包括认为南非发生了“白人种族灭绝”的观点。这一说法引发了广泛讨论,也反映出他对自身成长环境的复杂情感。尽管这种表述存在争议,但它也揭示了个人经历与政治、社会议题之间可能产生的深刻联系。对于公众人物而言,其言论往往具有较大的影响力,因此在表达时更需谨慎,以避免引发不必要的误解或对立。
几天后,xAI称,凌晨发生的一次“未经授权的更改”导致AI聊天机器人对某些话题产生了特定回应,这违反了xAI的相关政策。
Cohere联合创始人Nick Frosst曾表达担忧,认为Grok4可能会成为“马斯克观点的放大器”。这一说法引发了外界对AI模型在传播特定立场时可能产生的影响的关注。尽管技术本身是中立的,但其训练数据和设计方向往往会影响最终输出的内容。因此,如何在技术发展与价值观引导之间取得平衡,仍是当前AI领域需要持续思考的问题。
也有网友表示,自己会通过收藏纸质书籍来保留人类知识的原始形态,以此对抗人工智能的“修正”。
退一万步说,即使技术角度马斯克的构想也存在一些问题。
谷歌DeepMind的研究人员VPOriolVinyals指出,如果在训练数据中删除所有错误,模型可能会丧失检测和修复新错误的能力。 这一观点提醒我们,在人工智能的训练过程中,完全剔除错误信息可能并非最优选择。适当的错误数据有助于模型学习如何应对不确定性与复杂性,从而提升其泛化能力和鲁棒性。因此,在构建训练数据时,应更加注重平衡与多样性,而非一味追求“完美”。
无论对错,马斯克所从事的项目都是具有重大意义的大工程,没有充足的资金支持是难以实现的。
xAI再度获得100亿美元融资,距离其完成60亿美元的C轮融资、估值达到500亿美元仅过去六个多月。
目前尚不清楚本轮融资后 xAI 的具体估值,此前 xAI 与 X 合并后估值高达 1130 亿美元。
此次融资的参与者包括 Valor Equity Partners 、Vy Capital 、 Andreessen Horowitz 、红杉资本、富达管理与研究公司、Kingdom Holding Co.等,采用了”股 + 债”的组合,股权和债务各占 50 亿美元。
有了这笔钱,马斯克可以放心大胆地烧算力了。
说到算力,xAI在田纳西州孟菲斯建成的超级计算中心“Colossus”已部署了20万块GPU。
但这还不够,他们还计划建设一个配备100万块GPU的新设施。这一举措显示出相关方在算力资源上的持续投入,反映出人工智能等前沿技术对高性能计算的强烈依赖。随着AI模型规模不断扩大,对算力的需求也在呈指数级增长,这样的基础设施布局或将为未来的技术突破奠定基础。
SemiAnalysis 分析指出,这种千兆瓦级耗电量的数据中心给电网带来了前所未有的压力。
AI 训练工作负载不仅规模巨大,而且负载曲线也非常独特,会在几分之一秒内从满负荷突然变成几乎空闲。
传统的电网架构并未预见到这种情况,最严重时可能引发大范围的电力中断。
Meta在Llama3技术报告中提到,电力波动曾对模型训练过程造成影响,带来了一些训练错误的挑战。当时,他们仅使用了24000块H100显卡进行训练。这一情况反映出大规模AI训练不仅依赖于强大的算力,同时也面临基础设施稳定性方面的考验。即便在顶尖科技公司内部,电力供应的稳定性依然是不可忽视的技术挑战之一。
目前的解决办法是通过虚拟工作负载让系统空转,以平滑功耗波动,但这种方法的缺点是每年造成的能源浪费高达数千万美元。这种做法虽然在一定程度上缓解了电力需求的突变,但显然是一种低效且不经济的应对方式。如何在保障系统稳定运行的同时减少不必要的能源消耗,已成为亟待解决的问题。
马斯克对此也有考虑,他引入了特斯拉的Megapack储能系统,以配合超算中心的运行。
同时,特斯拉正积极与多家电力公司和公共事业运营商展开合作,努力推动其解决方案成为行业标准。
参考链接:
[1]https://www.testingcatalog.com/xai-prepares-grok-4-and-grok-4-code-for-upcoming-launch/
[2]https://semianalysis.com/2025/06/25/ai-training-load-fluctuations-at-gigawatt-scale-risk-of-power-grid-blackout/
本文来自微信公众号:量子位(ID:QbitAI),作者:梦晨
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.007667秒