首页 > 科技资讯
2024
12-21

开启 AI 推理新时代:OpenAI 卷动推理 AI 模型引领 AGI 革新

科技资讯
jinting
围观1488次
0条评论
发布日期:2024年12月21日 07:09:12

开启 AI 推理新时代:OpenAI 卷动推理 AI 模型引领 AGI 革新

开启智能推理新纪元:OpenAI 卷动推理 AI 模型助力人工智能革新

科技快讯中文网

   12月21日,"12天OpenAI"活动圆满结束,OpenAI的o3系列大模型作为压轴亮相,官方表示在特定应用场景下,其推理能力已经非常接近通用人工智能(AGI)。

   最新的AI模型为何命名为o3,而不叫o2?OpenAI公司首席执行官山姆・阿尔特曼(Sam Altman)在今天的直播活动中解释,这是为了避免与英国电信运营商O2之间的商标纠纷。

   o3是o1推理模型的升级版本,提供了完整版和精简版(o3-mini)。精简版主要是为特定任务进行了优化调整。

   近日,OpenAI公司宣布将逐步开放其新模型o3和o3-mini的访问权限。从即日起,公司将首先邀请安全研究人员注册并测试预览版o3-mini模型。据计划,未来还将推出o3的预览版本。 这种逐步开放的策略显示了OpenAI在确保技术安全性和稳定性方面的审慎态度。通过先让安全研究人员进行测试,可以有效地发现潜在的安全漏洞和技术问题,从而为后续更广泛的用户开放打下坚实的基础。这一做法不仅有助于提升产品的整体质量,也为广大用户最终能够安全、稳定地使用这些新技术提供了保障。

   现在,感兴趣的朋友可以提交申请:https://openai.com/index/early-access-for-safety-testing/。

   阿尔特曼并未公布 o3 模型的具体开放日期,仅透露 2025 年 1 月底推出 o3-mini,后续再推出 o3。

   OpenAIo3模型与主流AI模型的一个显著区别在于其能够进行事实核查,从而有效避免一些常见的模型陷阱。然而,这一过程会带来一定的响应延迟,通常从几秒到几分钟不等。这种设计虽然有助于提高信息的准确性,但在快节奏的信息传播环境中可能会面临挑战。尤其是在紧急新闻或实时讨论中,这样的延迟可能会对用户体验造成一定影响。不过,长远来看,这种机制对于确保信息的真实性和可靠性具有重要意义,值得进一步探索和优化。

   o3 系列模型的另一个亮点是使用“私人思想链”(private chain of thought)进行“思考”,它可以在响应前暂停,考虑相关提示并解释其推理过程,最终总结出最准确的答案。

   O3 的一大亮点是它能够调整推理时间,提供低、中、高三种计算级别供用户选择。这样的设计让用户可以根据实际需求来平衡任务执行的速度与设备的能耗。计算级别越高,O3 在处理任务时的表现就越出色。不过,值得注意的是,尽管高计算级别的设置可以带来更高效的性能,但同时也可能会增加电力消耗和设备发热的情况。因此,在选择适合自己的计算级别时,用户需要权衡这些因素,以获得最佳的使用体验。这不仅体现了技术的进步,也反映了技术在提升用户体验方面的细致考量。

   AGI的全称是Artificial General Intelligence,通常翻译为通用人工智能,指的是AI能够执行任何人类能够完成的任务。根据OpenAI公司的定义,AGI是指那些在最具经济效益的工作中超越人类并具有高度自主性的系统。

   OpenAI公司正在全力向AGI(通用人工智能)目标进发,除了加强其在人工智能领域的领导地位外,这一举动在投资界也具有特殊的意义。

   根据 OpenAI 与密切合作伙伴和投资者微软的交易条款,一旦 OpenAI 达到 AGI,公司就不再有义务向微软提供其最先进的技术(即符合 OpenAI 的 AGI 定义的技术)。

   而 o3 是 OpenAI 是迈向该目标的重要一步,在 ARC-AGI 基准测试中,o3 在高计算设置下获得了 87.5% 的分数,在低计算设置下得分为 75.7%,性能是 o1 的三倍。

   ARC-AGI联合创始人FrançoisChollet指出,确实,高性能计算设备的成本非常高,每次任务的费用可能需要数千美元。

   援引该媒体报道,在其他基准测试中,o3 表现出色:

   在 SWE-Bench Verified 编程任务基准测试中,o3 比 o1 高出 22.8 个百分点;

   在 Codeforces 编程技能测试中,o3 获得了 2727 的评分;

   在 2024 年美国数学邀请赛中,o3 得分 96.7%;

   在 GPQA Diamond 研究生水平生物、物理和化学测试中,o3 得分 87.7%;

   在EpochAI的FrontierMath基准测试中,o3解决了25.2%的问题(其他模型均不超过2%),再次刷新了记录。

   这些结果源自OpenAI的内部评测,还需等待外部客户的基准测试结果以进一步确认。

   o3的发布标志着OpenAI在通用人工智能领域迈出了重要一步。尽管o3的表现令人印象深刻,但我们必须正视其潜在的风险。OpenAI已经表明了他们对模型安全的承诺,并计划与其他机构合作,以建立更加完善的基准测试体系。 在这个快速发展的技术时代,我们见证了人工智能领域的巨大进步,但同时也面临着前所未有的挑战。o3作为最新成果,无疑将推动相关技术向前发展,但其可能带来的伦理和社会问题也不容忽视。确保这些强大的工具能够安全、负责任地使用,是每一个利益相关者共同的责任。只有这样,我们才能充分利用人工智能的潜力,同时最大限度地减少其负面影响。

本文固定链接: https://www.news9999.cn/arts_content-8920.html 转载请注明出处(科技快讯中文网-www.news9999.cn)
最新发布 360携手常州打造智能网联新高地 周鸿祎亲临见证签约并观战苏超  2025-08-17 21:17:57 17.5米巨龙穿江!济南黄岗路黄河隧道震撼贯通  2025-08-17 21:03:18 AG600批产第二架机首飞成功,国产大飞机再添新成员  2025-08-17 21:01:04 鸿蒙崛起!央视发声:自主系统才是破局关键  2025-08-17 20:44:44 Intel 10A工艺将启航:2028年迎战1nm极限  2025-08-17 20:39:09 赛场上机器人‘罢工’,程序员‘躺平’:赛后瞬间暴露科技人的疲惫日常  2025-08-17 20:21:51 宇树科技G1再破纪录!人形机器人100米障碍赛狂飙33.71秒夺金  2025-08-17 20:09:35 具身天工 Ultra 创百米新纪元,人形机器人首夺飞人桂冠  2025-08-17 20:06:35 人形未来,北京启航——第二届世界人形机器人运动会8月震撼登场  2025-08-17 20:06:07 高配手机成主流,京东818手机节补贴来袭!  2025-08-17 20:05:32 鸿蒙启航2025:青春力量点燃未来科技之光  2025-08-17 20:04:08 5G-A赋能苏超黄金时刻,开启观赛新体验  2025-08-17 19:58:41 央视曝光充电宝黑市回流;小鹏P7鹏翼门首现线下;沈海高速惊现禁用辅助驾驶警示牌  2025-08-17 19:58:39 腾讯:未雨绸缪,囤积充足GPU芯片应对潜在挑战  2025-08-17 19:48:42 F-15D战机滑行突发奇险,后座飞行员意外腾空弹射惊呆众人  2025-08-17 19:47:59 中国队力克德国,问鼎2025世界人形机器人足球巅峰之战  2025-08-17 19:46:44 天玑9400强势来袭,联发科2024年登顶中国高端芯片三成市场  2025-08-14 07:10:28 苹果 iPad 维修政策大变革:首推到店维修,收费透明化引关注  2025-08-14 06:51:20 全球首台相控阵CT亮相!成像清晰度媲美解剖,国产科技再破纪录  2025-08-14 06:51:18 腾讯视频VIP月费或涨至38元?官方回应来了  2025-08-11 20:58:16 苹果独占六成市场,高端手机战场再掀波澜  2025-08-11 20:18:42 美国禁令新变招:AI芯片出口附15%抽成条款  2025-08-11 20:16:17 英伟达H20利润15%将流入美国,中国或可反制要求对等回馈  2025-08-11 20:06:49 未来家庭新成员登场!镜识科技携三款智能机器狗震撼亮相2025世界机器人博览会  2025-08-11 20:04:13 AI裁员潮来袭!毕业生失业率飙升,这些岗位首当其冲  2025-08-11 19:57:56
友情链接 百度权重≥5友情链接交换
文化潮流网  |  数界探索  |  文化新视界  |  深度文化说  |  智慧科技  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经
© 2015-2025 科技快讯中文网 时光记忆 版权所有 备案号:陇ICP备2025016403号-1

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.009286秒