首页 > 科技资讯
2025
02-06

研究人员低成本打造出超越OpenAI的推理模型

科技资讯
jinting
围观1689次
0条评论
发布日期:2025年02月06日 09:09:07

研究人员低成本打造出超越OpenAI的推理模型

低成本之力,智能推理超越OpenAI

   2月6日消息,上周五发布的一份研究报告显示,斯坦福大学和华盛顿大学的人工智能研究团队仅以不到50美元(约364元人民币)的低成本云计算费用,便成功训练出一个具有“推理”能力的人工智能模型。这一成果不仅展示了人工智能技术在学术领域的迅猛发展,也预示着未来人工智能的应用门槛可能大幅降低。低成本高效能的模型训练方式将为更多科研机构和个人提供探索人工智能潜力的机会,从而推动整个领域的发展。

   该模型名为s1,在数学和编程能力测试中的表现与OpenAI的o1和DeepSeek的r1等顶级推理模型相当。目前,s1模型以及其训练所用的数据和代码已经通过GitHub平台实现了开源。 这种开放共享的做法无疑是一个重要的里程碑。它不仅展示了人工智能领域内竞争日益激烈,也体现了技术进步如何逐步打破壁垒,推动整个行业的共同成长。开源不仅能够促进技术的传播,还能加速创新的步伐,让更多研究者和开发者受益。对于那些希望在人工智能领域有所作为的人来说,这无疑是一个振奋人心的消息。

   S1团队声称他们利用“蒸馏”技术开发出了这款人工智能模型,这种技术的核心在于让模型通过学习另一个AI模型的回答,进而掌握其“推理”能力。据透露,S1模型是从谷歌的Gemini2.0 Flash Thinking Experimental推理模型中提炼而来的。同样地,上个月,加州大学伯克利分校的研究人员也采用了类似的蒸馏方法,以大约450美元的成本成功构建了一个推理模型。 这一系列进展展示了人工智能领域内技术进步的速度之快,以及学术界与产业界的紧密合作对推动创新的重要性。同时,这也提示我们,随着这类技术越来越容易被复制和再造,如何保护知识产权和确保技术的伦理使用将成为未来关注的重点。此外,低成本创建高性能模型的能力意味着更多机构和个人能够参与到这场技术革命中,这无疑为技术的普及和应用带来了新的机遇。

   类似S1模型的出现也引发了关于人工智能模型商品化的问题——如果有人能够以相对较低的成本复制一个价值数百万美元的模型,那么大型科技公司的“护城河”究竟在哪里呢? 在这个问题背后,我们不得不思考技术巨头们如何维持其市场优势。一方面,这些公司可能通过不断迭代和优化模型来保持领先。另一方面,它们还可以利用数据积累的优势,因为即使算法可以被复制,但数据的广度与深度却难以被轻易超越。此外,法律手段如专利保护和版权法也是重要的壁垒。 总而言之,虽然复制模型的技术门槛在降低,但这些公司依然有多种方式维护自身的竞争优势。这也提醒我们,在追求技术创新的同时,也需要关注数据安全和知识产权保护。

   不出所料,大型人工智能实验室对此表示不满,譬如OpenAI曾指控DeepSeek非法获取其API数据用于模型蒸馏。

   S1的研究团队致力于探索如何以最简洁的方式实现强大的推理能力和“测试时扩展”。这一目标与OpenAI的O1项目中的某些创新不谋而合。他们希望通过优化算法和架构设计,使人工智能模型能够在有限的时间内进行更深入的思考,从而提高解决问题的能力。这种研究不仅有助于推动人工智能技术的发展,还可能对其他相关领域产生深远影响。例如,在医疗诊断或复杂决策制定方面,这样的技术进步能够显著提升工作效率和准确性。然而,与此同时,我们也需要关注技术进步所带来的伦理和社会问题,确保这些强大的工具能够被负责任地使用。

   s1的论文指出,可以通过一种名为监督微调(SFT)的技术,利用相对较小的数据集来提炼推理模型。在SFT过程中,人工智能模型会被明确指导以模仿数据集中的特定行为。与DeepSeek用于训练其R1模型的大型强化学习方法相比,SFT显得更为经济高效。

   谷歌在其GoogleAIStudio平台上免费提供Gemini2.0FlashThinkingExperimental模型的访问权限,但每天设有使用限制。不过,根据其使用条款,禁止对模型进行逆向工程以开发与谷歌自身人工智能产品相竞争的服务。

   S1是中国人工智能实验室Qwen推出的一款小型且现成的免费人工智能模型。为了训练S1,研究团队特别构建了一个包含1000个精选问题及其对应答案的数据集。此外,他们还利用了谷歌Gemini2.0 Flash Thinking Experimental提供的解析,以展示每个答案背后的推理过程。这一创新方法不仅为AI模型的训练提供了新的视角,也展示了如何通过精细的数据集和先进的辅助工具来提升模型的表现力和准确性。这种方法可能为未来的AI研究开辟新的道路,特别是在理解和生成复杂人类思维过程方面。

   研究人员称,在使用16个Nvidia H100 GPU进行训练后(耗时不到30分钟),模型s1在一些人工智能基准测试中表现出色。参与该项目的斯坦福大学研究员Niklas Muennighoff告诉TechCrunch,目前租赁这些计算资源的成本大约为20美元。

   研究人员采用了一种巧妙的方法,使S1系统在检查其工作时能够延长“思考”时间:他们让它进行“等待”。研究结果显示,在S1的推理过程中加入“等待”这个词,可以帮助模型得出更为准确的结果。

本文固定链接: https://www.news9999.cn/arts_content-38226.html 转载请注明出处(科技快讯中文网-www.news9999.cn)
最新发布 Modelers理事会迎新势力,共启开源AI生态新篇章  2025-07-28 12:26:19 灵宝CASBOT 02与W1人形机器人震撼登场:33自由度+智能语音交互引领未来智造新潮流  2025-07-28 12:12:04 华为Mate 60系列震撼升级!HarmonyOS 5.1首发,人像精修功能引爆视觉革命  2025-07-28 12:01:03 1.2mm极窄四边框来袭:魅族22挑战全球最窄白面板新纪录  2025-07-28 11:49:59 OPPO Find X9 Pro 震撼曝光:7000mAh巨能电池+6.78英寸2.5D直屏来袭  2025-07-28 11:49:22 无人机驰援暴雨灾区,6小时重建通信生命线  2025-07-28 11:44:47 微软重磅更新!Win11 24H2优化升级,WinRE功能全面革新  2025-07-27 10:50:37 焕新社区开源平台上线,244个行业垂类模型齐聚赋能AI发展  2025-07-27 10:45:01 讯飞星火 X1 颠覆认知!国产算力新标杆直追 OpenAI 最新技术  2025-07-26 11:34:06 男子坠崖五日获救:无人机空投担架惊现救援奇迹  2025-07-26 10:40:14 Y2K38危机来袭:32位Win10陷困境,Debian 13率先迎战时间难题  2025-07-26 10:37:21 阿里云发布 Qwen-MT:92 种语言秒变通译,每百万 tokens 仅需 2 元  2025-07-25 09:22:15 苹果Apple Store前海店即将启幕,8月16日盛大开业  2025-07-25 08:42:04 小米推出家用直流充电桩,功率突破7kW引行业关注  2025-07-25 07:50:07 苹果推出创意壁纸定制工具,一键生成适配全系设备的专属Logo壁纸  2025-07-25 07:43:37 苹果AirPods 4与Pro 2公测来袭,iOS 26新功能引爆无线耳机革命  2025-07-25 07:34:44 华为携手贵州射电天文台,AI赋能未来天文新纪元  2025-07-24 07:13:09 索尼解锁 PS5 手柄黑科技:四设备无缝切换,游戏体验再升级  2025-07-24 06:55:50 三大运营商将精简套餐提升资费透明度,微信语音转文字功能灰度测试,京东布局七鲜小厨新生态  2025-07-23 08:16:15 阿里云通义千问 Qwen3-Coder 开源:480B 参数+256K 上下文,性能直逼 Claude Sonnet4  2025-07-23 08:07:04 荣耀高管罗巍否认一英寸、一镜双目配置:硬核设计观引争议,三年超越计划曝光  2025-07-23 07:48:59 欧盟或批准苹果App Store新规,避免每日5000万欧元罚金  2025-07-23 07:48:15 影石Insta360首曝无人机专利图:360°全景拍摄+模块化革命  2025-07-23 07:29:47 三星S25 FE重磅升级:前置影像革新,LTPO屏幕更省电续航更强  2025-07-23 07:28:36 麒麟9系直屏旗舰!华为Pura 80标准版震撼预售,性能与颜值双爆表  2025-07-23 07:12:10
友情链接 百度权重≥5友情链接交换
文化潮流网  |  数界探索  |  文化新视界  |  深度文化说  |  智慧科技  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经
© 2015-2025 科技快讯中文网 时光记忆 版权所有 备案号:陇ICP备2025016403号-1

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.009994秒