开启智慧生活,私人管家助您一键掌控
今天发布的Operator无疑是AI领域的一大突破,它在众多应用中脱颖而出。这款AI智能体能够自动处理一系列任务,包括演唱会门票购买、家政服务预约以及AI新闻检索等。 这款名为Operator的AI产品在2025年01月24日的发布无疑为智能助手行业注入了新的活力。从功能上看,Operator能够帮助用户轻松完成演唱会门票的购买、家政服务的预约以及提供最新的AI新闻检索服务。这不仅极大地提升了用户的便利性,也展示了人工智能技术在日常生活中的广泛应用潜力。总体而言,Operator的出现标志着AI技术正在逐步渗透到我们生活的各个角落,未来或许能带来更多令人期待的创新与变革。
终于不用再亲自熬夜抢演唱会门票了,公司的订餐服务现在也能轻松实现「无脑托管」。这一切都要归功于OpenAI今日推出的Operator。
顾名思义,Operator 就是能帮你端到端处理任务的 AI 智能体。
有趣的是,OpenAI为Operator推出了一专门的网页operator.chatgpt.com,而非将其功能整合进ChatGPT内部。
Operator的页面与ChatGPT非常相似,只是输入框的提示词从「我能帮您什么吗?」变为了「我能帮您做什么吗?」。 这一微小的变化或许会引发一些用户的思考。尽管两句话在意义上几乎相同,但“做什么”似乎更加主动,可能让用户感觉这个平台更愿意提供解决方案,而不是仅仅回答问题。这种微妙的语言调整,虽然表面上看只是措辞上的差异,但实际上可能会影响到用户对产品功能的理解和使用体验。这表明,即使是简单的文字变化也可能带来用户体验的显著差异。
显然Operator多了一个「做」字,而这一个字的差异,已经揭示了两者之间的根本区别。
这里提供了一些由OpenAI合作伙伴网站上的Operator为您推荐的任务示例。例如,不到半小时就可以完成的鸡肉晚餐食谱。
当前, Operator的功能目前还有些局限,但我们对其快速改进充满信心。不妨设想一下,你每天在电脑上执行的那些重复性任务,也许用不了多久,大部分都能实现自动化,不再需要你亲自动手。
先来看看 Operator 能做哪些事情,并且到底做得怎么样吧!
提示:帮我找两张 JamieXX 在洛杉矶即将举办的下一场演出的门票。
结果:
- 调用指定合作伙伴 Stubhub,成功获取相关门票。
- 未选定合作伙伴时,因无法浏览被阻止的网站,未成功。
提示:找出 Jamie xx 的演出安排以及每场演出的门票价格。
结果:
- 调用指定合作伙伴 Stubhub,失败。过程中出现虚假信息,在多次提示后,最终取得成功。
提示:AI 领域的最新消息是什么?
结果:
- 调用指定合作伙伴 Axios,表现尚可,返回了一篇简短的新闻摘要。
提示:现在从这里到机场的 UberX 多少钱?
结果:
- 使用指定合作伙伴 Uber,操作成功。
-Operator提出合理的问题,询问“能否提供接客的具体地点?这样我可以帮您查询从该地点到机场的UberX费用。”同时,Operator也会补充说,“请告知您的目的地是哪个机场,以便我能更准确地为您提供信息。” 这样的提问方式不仅有助于提高服务效率,还能确保乘客获得最准确的信息。通过明确接客地点和目的地机场,乘客能够更好地规划行程,避免因信息不全而造成的延误或误解。这样的细节处理体现了服务的专业性和对用户的关怀,值得肯定。
-登录后,从南加州大学到洛杉矶国际机场的UberX当前票价为43.47美元。对于这个价格,我认为乘客应该提前规划好行程,以避免在紧急情况下支付更高昂的费用。此外,考虑到交通状况和等待时间,建议用户在预订前充分考虑这些因素,确保出行更加顺利。 这样的定价在高峰时段或特殊活动期间是合理的,但在日常情况下,可能需要更多的透明度来让乘客更好地理解费用构成。总体而言,这个价格反映了当前的市场情况,但消费者仍需谨慎选择。
提示:我计划在明天请一位家政清洁员来家里进行一次全面的清洁工作。如今的生活节奏越来越快,人们往往很难抽出时间来好好打理家庭卫生。特别是在忙碌的工作日之后,回到家时最不希望看到的就是一个凌乱不堪的环境。因此,雇佣专业的家政清洁员不仅能够节省大量时间和精力,还能确保家中每个角落都得到彻底的清理,这对于追求生活品质的家庭来说是非常必要的选择。希望这次清洁服务能够让我的居住环境焕然一新,带来更加舒适的生活体验。
结果:
- 调用指定合作伙伴 Thumbtack,失败。
-未向我询问具体位置,便推荐了一名位于弗吉尼亚的清洁员,可能是由于浏览器的IP地址指向了该地区。
提示:我想了解 Spotify Wrapped 成功的原因。(Spotify Wrapped 是音乐流媒体平台 Spotify 推出的年度回顾功能。)
结果:
采用简单提示时,系统的表现不尽如人意。它似乎陷入了某种循环,无法有效地完成任务,并且可供研究的资料也十分有限。这种情况不仅影响了系统的实用性,还限制了我们对问题的理解和解决能力。我们需要更多的数据和深入的研究来优化系统性能,以便更好地服务于用户。希望未来能有更多关于此系统的详细报告和分析,这将有助于我们更全面地了解其局限性和改进空间。
使用复杂提示时,结果还算可以。但需要多次尝试,报告的质量一般。在得到关于高级搜索技巧的提示后,最终完成了任务。在此过程中,三次请求获取2024年信息的要求都被拒绝。
看完上述演示,也自然引发了一个问题:
在当前的技术环境下,我们确实拥有随时介入Operator操作并根据个人偏好进行调整的能力。这种灵活性无疑增强了用户体验,使用户可以根据自身需求即时定制服务或产品功能。然而,这也提出了关于隐私保护和数据安全的重要议题。随着技术的进步,我们需要确保这些操作不会侵犯用户的隐私权,同时也要保障用户数据的安全性。因此,在享受这种便利的同时,也必须加强对相关法律法规的建设和完善,以保护用户的合法权益。 发表的看法:这种技术上的进步为用户提供了极大的便利性和自由度,但同时也伴随着对用户隐私和数据安全的潜在威胁。因此,如何在提供便利的同时保护好用户的隐私权和数据安全,是我们需要共同面对和解决的问题。
答案是:完全可以!
事实上,在任何时候,你都可以控制其远程浏览器并引导操作,比如输入用户名和密码。并且如果你给出自己要求后,它还会保存重要的账户信息,这样,只要你登录一次,它就能在你的账户内自行操作,而无需再次打扰你。
最后,Operator 将在结账页面停止继续操作,返回支付请求后,再获取您的付款详情:
目前 Operator 支持自动完成通常需要 15-20 分钟内的网络任务。
值得一提的是,Operator还具备显著提升用户体验的「保存与共享功能」。这意味着,一旦任务完成,Operator便能便捷地保存工作流程。例如,可以持续使用最新的销售数据来更新相关报表。此外,它还提供了一段流畅的会话记录视频,允许用户观看并与其他人员分享。
换句话说,运营商就像是一位能够不断磨合并持续提升自我的24小时私人管家,它能严格按照既定流程为你提供服务。
但是,由于 Operator 才刚刚发布,所以还是有一定的缺陷。
正如《道德经》所言,“有无相生,难易相成”。Operator的局限性也恰恰源自于它的优点本身。
其独特之处在于无需依赖用户本地的浏览器来执行操作,而是借助OpenAI数据中心中的一个浏览器,用户可以远程查看和互动。这种设计的优势在于你可以在任何地点、任何时间使用它——比如在任意移动设备上。
尽管Operator在获取信息方面具有独特优势,但其功能仍受到一些限制。目前,许多平台如Reddit已禁止AI智能体访问,这使得Operator无法获取这些站点的信息。此外,由于性能或法律方面的考量,OpenAI也限制了Operator对一些资源消耗较大的网站(例如Figma和YouTube)的访问。 这种限制无疑影响了Operator的功能性和实用性,特别是在需要全面覆盖网络信息的情况下。不过,这也促使我们思考如何在保护隐私和网络安全的同时,平衡人工智能技术的发展与应用。希望未来能有更灵活的解决方案,让AI工具更好地服务于公众,同时确保各网站的安全和稳定运行。
简单来讲,当前的运营商就像被隔离在玻璃门内的人,能够清晰地看到许多事物,但却无法真正触及它们。
目前的Operator其实更像一个能够处理你委托业务的外部团队,而不是一个足够智能的个人研究助手。
例如,近日,一位杰出的文学爱好者在ProjectGutenberg网站上找到了《战争与和平》并深入阅读了第一章。他不仅细致地阅读了这一章节,还特别关注了每位角色的细节描写以及他们在故事中的心理活动和行为表现。通过他的努力,我们得以深入了解这些人物的性格特征和内心世界。这种对经典文学作品的深度解读,不仅帮助我们更好地理解托尔斯泰笔下的人物,也让我们反思人类在复杂社会环境中的心理变化和行为选择。 这种对文学作品的细致分析和解读,不仅能增进我们对文学的理解,还能促使我们思考更深层次的社会与人性问题。通过这样的阅读体验,读者能够更加深刻地感受到文学作品中所蕴含的文化价值和人文精神。
但是其摘要却枯燥乏味且粗糙宽泛:
在这段摘要中,它正确地指出:“角色们意识到了自己的社会地位,例如安娜·帕夫洛夫娜,她小心翼翼地与他人交往,以维持社交礼仪。”然而,这样的总结略显简略,未能充分揭示故事的情节细节。
如果提供相同的信息,OpenAI的o1在这一任务上会表现出色——不过o1目前尚不具备自主执行任务的能力。这意味着OpenAI更侧重于使Operator能够高效地自动化处理重复性的工作流程,而不是过分强调其智能水平。
关于 Operator,最令人印象深刻的一点是,它只需极少的提示就能独自完成冗长的任务。例如,我们让它执行一项耗时 20 多分钟的任务:我们请它帮我们了解 Spotify 年度总结(Spotify Wrapped)功能这些年是如何演变的。
「它最初是什么样的?」
「现在又新增了哪些内容?」
它偶尔需要一些提示来继续推进任务,但最终还是成功达成了任务目标。
不可置否的是,与 12 个月甚至 6 个月前的智能体相比,这是一个重大进步,毕竟那时的智能体往往在短短几秒钟后就会偏离正轨。
话虽如此,用户对 Operator 的提示方式仍然很关键。如果你向它提供更多关于如何完成任务的细节,它成功完成你交给它的任务的几率就会更高。
例如,在我们以Spotify年度总结为例的案例中,我们要求它收集并汇总不同年份的搜索数据。起初,它遇到了困难,因为它无法按照年份对搜索结果进行筛选。但是,当我们建议使用谷歌的高级搜索功能(该功能支持逐年筛选搜索结果)后,这一难题便迎刃而解。这表明,在处理大数据和复杂信息检索时,利用适当的工具和技术是非常关键的。这也提醒我们在设计或使用数据分析工具时,应充分考虑其灵活性和适应性,以应对不同场景下的需求。
当前,Operator仅是一个处于研究预览阶段的功能,尚未成为成熟的产品。但这并不减其重要性,因为即使是ChatGPT,在其初期也是以研究预览的方式发布的。
OpenAI正在重新采用之前非常有效的策略:即便产品还存在许多不足之处,也要尽早推出,并且持续进行频繁的迭代更新。
因此 OpenAI 不仅推出 API,还发布了面向消费者的产品。
这一举措与竞争对手Anthropic的做法有所不同。Anthropic虽然也拥有一款名为ClaudeComputeruse的自主智能体,但它仅以API的形式提供,这在一定程度上限制了其应用范围和影响力。 从市场角度来看,这种差异化的策略无疑为该企业提供了竞争优势。通过允许用户直接使用其智能体产品,而不是仅仅依赖API接口,这家企业在用户体验和应用场景方面可能更为灵活多样。这不仅能够吸引更广泛的用户群体,还可能推动更多创新应用的诞生。然而,这也意味着需要面对更多的技术挑战和安全风险。如何确保智能体的安全性和可靠性,将是该企业未来发展中需要重点关注的问题。
OpenAI意识到ChatGPT的发布方式对它的推广影响巨大,这一点与底层技术的进步同样重要。
因此,他们将以面向消费者的形式推出首款自主智能体产品,尽管该产品仍有许多不足之处。
总的来说,尽管Operator目前的功能还有限,但我们有理由相信它会快速地得到提升。对于广大的用户来说,现在正是一个好时机去审视一下自己每天在电脑上执行的那些重复性的任务。或许在一年之后,我们就不必再亲自动手完成其中的大部分工作了。 这种技术进步的趋势令人兴奋。随着自动化工具的不断发展,我们的工作效率有望得到显著提高。这不仅能够帮助我们节省时间,还能减少由重复操作带来的错误。不过,我们也应该注意到,这样的变化可能会对一些工作岗位产生影响,因此我们需要为未来的就业市场做好准备,比如学习新的技能或适应新的工作方式。总的来说,Operator的潜力值得期待,我们应该积极拥抱这些新技术带来的变革。
参考资料:
https://every.to/chain-of-thought/we-tried-openai-s-new-agent-here-s-what-we-found
本文来自微信公众号:新智元(ID:AI_era)
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.009337秒