开启 AI 推理新时代：OpenAI 卷动推理 AI 模型引领 AGI 革新-科技快讯中文网

2024

12-21

开启 AI 推理新时代：OpenAI 卷动推理 AI 模型引领 AGI 革新

科技资讯

jinting

围观1488次

0条评论

发布日期：2024年12月21日 07:09:12

开启 AI 推理新时代：OpenAI 卷动推理 AI 模型引领 AGI 革新

开启智能推理新纪元：OpenAI 卷动推理 AI 模型助力人工智能革新

科技快讯中文网

　　 12月21日，"12天OpenAI"活动圆满结束，OpenAI的o3系列大模型作为压轴亮相，官方表示在特定应用场景下，其推理能力已经非常接近通用人工智能（AGI）。

　　最新的AI模型为何命名为o3，而不叫o2？OpenAI公司首席执行官山姆・阿尔特曼（Sam Altman）在今天的直播活动中解释，这是为了避免与英国电信运营商O2之间的商标纠纷。

　　 o3是o1推理模型的升级版本，提供了完整版和精简版（o3-mini）。精简版主要是为特定任务进行了优化调整。

　　近日，OpenAI公司宣布将逐步开放其新模型o3和o3-mini的访问权限。从即日起，公司将首先邀请安全研究人员注册并测试预览版o3-mini模型。据计划，未来还将推出o3的预览版本。这种逐步开放的策略显示了OpenAI在确保技术安全性和稳定性方面的审慎态度。通过先让安全研究人员进行测试，可以有效地发现潜在的安全漏洞和技术问题，从而为后续更广泛的用户开放打下坚实的基础。这一做法不仅有助于提升产品的整体质量，也为广大用户最终能够安全、稳定地使用这些新技术提供了保障。

　　现在，感兴趣的朋友可以提交申请：https://openai.com/index/early-access-for-safety-testing/。

　　阿尔特曼并未公布 o3 模型的具体开放日期，仅透露 2025 年 1 月底推出 o3-mini，后续再推出 o3。

　　 OpenAIo3模型与主流AI模型的一个显著区别在于其能够进行事实核查，从而有效避免一些常见的模型陷阱。然而，这一过程会带来一定的响应延迟，通常从几秒到几分钟不等。这种设计虽然有助于提高信息的准确性，但在快节奏的信息传播环境中可能会面临挑战。尤其是在紧急新闻或实时讨论中，这样的延迟可能会对用户体验造成一定影响。不过，长远来看，这种机制对于确保信息的真实性和可靠性具有重要意义，值得进一步探索和优化。

　　 o3 系列模型的另一个亮点是使用“私人思想链”（private chain of thought）进行“思考”，它可以在响应前暂停，考虑相关提示并解释其推理过程，最终总结出最准确的答案。

　　 O3 的一大亮点是它能够调整推理时间，提供低、中、高三种计算级别供用户选择。这样的设计让用户可以根据实际需求来平衡任务执行的速度与设备的能耗。计算级别越高，O3 在处理任务时的表现就越出色。不过，值得注意的是，尽管高计算级别的设置可以带来更高效的性能，但同时也可能会增加电力消耗和设备发热的情况。因此，在选择适合自己的计算级别时，用户需要权衡这些因素，以获得最佳的使用体验。这不仅体现了技术的进步，也反映了技术在提升用户体验方面的细致考量。

　　 AGI的全称是Artificial General Intelligence，通常翻译为通用人工智能，指的是AI能够执行任何人类能够完成的任务。根据OpenAI公司的定义，AGI是指那些在最具经济效益的工作中超越人类并具有高度自主性的系统。

　　 OpenAI公司正在全力向AGI（通用人工智能）目标进发，除了加强其在人工智能领域的领导地位外，这一举动在投资界也具有特殊的意义。

　　根据 OpenAI 与密切合作伙伴和投资者微软的交易条款，一旦 OpenAI 达到 AGI，公司就不再有义务向微软提供其最先进的技术（即符合 OpenAI 的 AGI 定义的技术）。

　　而 o3 是 OpenAI 是迈向该目标的重要一步，在 ARC-AGI 基准测试中，o3 在高计算设置下获得了 87.5% 的分数，在低计算设置下得分为 75.7%，性能是 o1 的三倍。

　　 ARC-AGI联合创始人FrançoisChollet指出，确实，高性能计算设备的成本非常高，每次任务的费用可能需要数千美元。

　　援引该媒体报道，在其他基准测试中，o3 表现出色：

　　在 SWE-Bench Verified 编程任务基准测试中，o3 比 o1 高出 22.8 个百分点；

　　在 Codeforces 编程技能测试中，o3 获得了 2727 的评分；

　　在 2024 年美国数学邀请赛中，o3 得分 96.7%；

　　在 GPQA Diamond 研究生水平生物、物理和化学测试中，o3 得分 87.7%；

　　在EpochAI的FrontierMath基准测试中，o3解决了25.2%的问题（其他模型均不超过2%），再次刷新了记录。

　　这些结果源自OpenAI的内部评测，还需等待外部客户的基准测试结果以进一步确认。

　　 o3的发布标志着OpenAI在通用人工智能领域迈出了重要一步。尽管o3的表现令人印象深刻，但我们必须正视其潜在的风险。OpenAI已经表明了他们对模型安全的承诺，并计划与其他机构合作，以建立更加完善的基准测试体系。在这个快速发展的技术时代，我们见证了人工智能领域的巨大进步，但同时也面临着前所未有的挑战。o3作为最新成果，无疑将推动相关技术向前发展，但其可能带来的伦理和社会问题也不容忽视。确保这些强大的工具能够安全、负责任地使用，是每一个利益相关者共同的责任。只有这样，我们才能充分利用人工智能的潜力，同时最大限度地减少其负面影响。

首页 > 科技资讯

2024

12-21