首页 > 企业动态
2025
03-12

《慢思考之力:九章云极联合团队大模型推理技术突破发布》

企业动态
jinting
围观970次
0条评论
发布日期:2025年03月12日 18:36:35

《慢思考之力:九章云极联合团队大模型推理技术突破发布》

颠覆未来!九章云极大模型推理技术重磅出击

   近日,九章云极DataCanvas公司与中国人民大学STILL项目团队、北京智源研究院合作,在大模型慢思考推理技术方面取得了一系列重要进展。他们初步复现了类R1推理模型,并全面开源了该模型的实现细节及训练技巧。在此基础上,研究团队创新性地提出了使用代码工具来提升模型推理性能的方法,在AIME数学推理测试中表现优于DeepSeek-R1模型。这些研究成果已整理成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,并在预印版论文网站arXiv上公开发布。 这一系列成果不仅展示了中国在人工智能领域的重要突破,也为其他研究者提供了宝贵的参考材料。通过开源模型实现细节和训练技巧,可以加速整个学术界和工业界的研究进程。此外,引入代码工具来增强模型推理性能的方法,为未来的大规模语言模型发展开辟了新的路径。这表明中国在大模型研究领域的实力和创新能力正在不断提升。

《慢思考之力:九章云极联合团队大模型推理技术突破发布》

   九章云极DataCanvas联合研究团队近日公开了复现DeepSeek-R1全参数微调的开源方案,并推出了一款新的强化学习训练模型STILL-3-Tool-32B。该方案全面开放了从模型训练到推理部署的全流程工程代码,同时分享了经过实践验证的技术经验和调优策略,为开发者提供了可以直接部署的大规模模型训练框架。研究结果表明,该模型在AIME2024基准测试中的准确率达到81.70%(采样),超过了DeepSeek-R1的满血版表现。这一成果已在GitHub社区中详细介绍,并提供了相关的开源链接。

《慢思考之力:九章云极联合团队大模型推理技术突破发布》

   STILL-3-Tool-32B模型是九章云极DataCanvas联合团队在长链复杂推理模型训练框架上的又一重要创新实践。研究表明,在已达到性能巅峰的蒸馏模型上,采用这种强化学习训练方法同样能够显著提升AIME2024的准确率。这一研究成果将极大推动正在运行的大规模模型的回复长度和推理准确性。针对语言推理可能存在的精确性不足问题,STILL-3-Tool-32B模型引入了外部工具以增强AI模型的复杂推理能力。在AIME2024测试中,该模型取得了81.70%的准确率(采样),以15.56%的优势超越其基础训练模型,与OpenAIo3-mini持平,并且优于o1和DeepSeek-R1在同一场景下的表现。

   自DeepSeek-R1技术报告发布以来,开源模型复现依然面临代码不完整和超参数调整等普遍难题。九章云极DataCanvas联合团队通过深度整合AI基础设施实现了突破。研究同时公开了该模型在DataCanvasAlayaNeW智能计算操作系统上的完整训练日志、奖励函数代码及容器化部署方案。研究表明,在AlayaNeW中使用on-policy学习策略是成功的核心要素,这种方法对DeepSeek背后基于规则的强化学习进行了微调,并深入探索了相关超参数配置和训练技巧。

   值得注意的是,DeepSeek和蒸馏模型在推理时无法调用外部代码工具,这正是复现过程中的关键挑战。研究表明,AlayaNeW智算操作系统在开源工具链与基础模型的适配、算法与算力的协同、逻辑推理及多步决策等复杂的任务框架上展现出显著的优势,这或将促进AI技术的进一步进步。

    

本文固定链接: https://www.news9999.cn/arts_content-70241.html 转载请注明出处(科技快讯中文网-www.news9999.cn)
最新发布 城市骑士焕新登场:饿了么淘宝闪购升级保障计划,制服换装引关注  2025-08-17 20:12:42 九识智能携手江苏联通打造5G+智慧物流新未来  2025-08-17 20:06:38 扎克伯格2024安保费破2700万,竟超六位科技大佬总和?  2025-08-17 19:55:09 城市骑士正式上线!饿了么×淘宝闪购升级骑手形象,开启全新服务时代  2025-08-17 19:54:01 小米德国首家官方旗舰店即将开业,掀起海外布局新高潮  2025-08-17 19:49:31 腾讯股价创四年新高,市值首破7000亿美元  2025-08-14 07:07:40 马斯克断舍离:自研芯片梦碎,六年白干背后真相曝光  2025-08-14 07:05:16 广汽埃安拟控股华望,华为合作再掀新篇章  2025-08-11 20:25:45 微软17亿美元买粪埋地?AI节能新招引热议  2025-08-11 20:01:41 蚂蚁集团否认参与稀土人民币稳定币项目,中国稀土集团回应未有相关计划  2025-08-11 19:50:52 董宇辉离开一年后,东方甄选股价狂飙200%:谁真正改变了谁?  2025-08-11 19:38:34 全球首条无FMM第8.6代AMOLED产线封顶,维信诺引领柔性显示新纪元  2025-08-11 19:36:08 京东夏日音享计划燃情落幕,Live音乐引爆线下狂欢现场  2025-08-11 19:22:22 三星半导体拟斥资500亿美元!特斯拉苹果订单引爆美国投资热潮  2025-08-11 18:41:54 震骨价出炉!京东养车50亿补贴全网征名引发热议  2025-08-11 18:38:51 蚂蚁集团回应稀土人民币稳定币传闻:警惕虚假信息陷阱  2025-08-11 18:37:22 掌控未来交易:Exness快速出金重塑自主权新纪元  2025-08-07 11:53:52 余承东发布享界S9T:草原上跳起蒙古舞的科技新篇  2025-08-07 11:23:20 中国船舶联手中国重工,全球最大船企重磅合体  2025-08-07 10:41:50 库克豪赌美国制造:苹果砸6000亿重塑全球产业链  2025-08-07 10:11:54 打白条买火车票成真,京东支付正式入驻12306  2025-08-07 09:54:53 夜行先锋:Aurora自动驾驶卡车开启高效夜间运输新时代  2025-08-04 15:37:08 电竞新势力崛起:完美世界携手英伟达、英特尔等巨头共创未来  2025-08-04 14:59:04 美团、饿了么、京东联手喊反内卷,行业:非拒竞争,执行难在哪?  2025-08-04 14:54:14 网易云音乐重磅布局播客领域,罗大佑樊登等大咖强势入驻  2025-08-04 14:42:10
友情链接 百度权重≥5友情链接交换
文化潮流网  |  数界探索  |  文化新视界  |  深度文化说  |  智慧科技  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经
© 2015-2025 科技快讯中文网 时光记忆 版权所有 备案号:陇ICP备2025016403号-1

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.011343秒