首页 > 科技资讯
2025
02-13

AI的胡说八道:如何应对?研究人员呼吁AI勇于承认我不知道

科技资讯
jinting
围观1381次
0条评论
发布日期:2025年02月13日 07:29:13

AI的胡说八道:如何应对?研究人员呼吁AI勇于承认我不知道

AI:面对不知道时,谦虚求教,共同探索未知领域

   2月13日消息,《华尔街日报》于当地时间11日发表了一篇文章,讨论了目前“AI幻觉”现象及其可能的解决方法。该报记者BenFritz向多款全球顶尖的AI聊天机器人提问“你的配偶是谁”,得到的回答令人困惑:一个他不认识的作家、一位来自爱荷华州的陌生女士,还有一位网球运动博主。

   根据报道,尽管AI在解决复杂数学问题和模拟人类交流方面表现出色,但在基本事实上却常常出错。它们会杜撰法律案例,混淆电影和书籍的细节,甚至“虚构”出不存在的配偶。

   注:上述错误通常被称为“幻觉”,因为像ChatGPT和Gemini这样的AI系统在生成错误答案时也常常显得非常自信。 这种现象揭示了人工智能技术的一个重要局限性:尽管这些模型在处理大量数据和生成复杂文本方面表现出色,但它们依然可能产生不准确甚至完全错误的信息。这不仅对技术开发者提出了更高的要求,也提醒用户在依赖AI生成的内容时要保持警惕,进行必要的核实。此外,这也促使我们思考如何进一步完善算法,以减少这类“幻觉”现象的发生,从而提高AI系统的可靠性和可信度。

   曾在IBM、微软实习的德国Hasso Plattner研究所博士生Roi Cohen提到,探索人机交互的新方法已成为当下AI研究中最炙手可热的方向之一。 这一趋势表明,科技界越来越重视如何让机器更好地理解和适应人类的需求,而不仅仅是提升算法的精度或处理速度。这不仅要求研究人员具备深厚的理论知识,还需要他们拥有跨学科的视野,以便在设计和开发过程中充分考虑用户体验。随着技术的发展,未来的人机交互方式可能会更加自然流畅,这无疑将极大地推动人工智能在日常生活中的应用与普及。

   AI的工作原理在于预测文本序列中下一个最可能出现的单词,这个过程在本质上可以看作是一种高级形式的猜测。AI系统倾向于以一种十分自信且确定的方式提供答案,即使是在存在不确定性的情况下。这种行为模式类似于学生在面对多项选择题时,凭借概率猜测出可能的答案;或者像是在社交场合中,人们为了维持对话流畅性而做出的即兴回应。尽管AI能够生成看似合理的回答,但其背后的实际运作机制仍然是基于概率统计和模式识别,而非真正意义上的理解或推理。因此,当使用AI生成内容时,我们应当保持一定的批判性思维,了解其局限性,并意识到AI的回答并不总是百分之百准确或具有深度的理解。

   西班牙瓦伦西亚人工智能研究所的教授JoséHernández-Orallo表示,“AI之所以会出现幻觉,主要是因为如果不进行任何猜测,它就根本无法给出正确的答案。”

   为了解决这一难题,研究人员正在探索“检索增强生成”技术,旨在让AI在回答问题时能够首先从互联网或文档库中获取最新的信息,而非仅仅依赖于现有的训练数据。这种技术有望使AI的回答更加准确和及时,特别是在涉及快速变化的信息领域,如科技、医疗和政策更新等。通过结合外部信息源,AI系统不仅能提供更为全面的答案,还能有效减少因过时数据导致的错误。这一进展不仅提升了AI的应用价值,也为未来的技术发展指明了新的方向。

   在去年12月的NeurIPS人工智能研究会议上,Cohen与同校博士生KonstantinDobler提出了一项简单而新颖的观点:让AI系统也能掌握表达“我不知道”的能力。 当前时间为2025年2月。

   报道指出,当前 AI 的训练数据几乎不包含“我不知道”这样的表述,因此它们天生不会谦逊。Cohen 和 Dobler 通过调整 AI 训练过程,使其在可能出错时,至少一部分情况下会选择回答“我不知道”,从而提高整体准确性。

   不过,如何权衡这一策略依然是一项挑战。有时,AI会表示“我不清楚”,然而答案可能早已包含在其训练数据之中。

   即便如此,对于那些依赖 AI 提供精准信息的领域,适当的“谦虚”可能更有价值。“关键是让 AI 具备实用性,而不是一味追求智能。”Dobler 说道。

   尽管人工智能技术日益强大,但美国公众对它的信任度却在降低。根据皮尤研究中心的数据,2023年有52%的美国人对人工智能表示担忧,相比之下,2021年的这一比例仅为37%。

本文固定链接: https://www.news9999.cn/arts_content-44107.html 转载请注明出处(科技快讯中文网-www.news9999.cn)
最新发布 华为携手贵州射电天文台,AI赋能未来天文新纪元  2025-07-24 07:13:09 索尼解锁 PS5 手柄黑科技:四设备无缝切换,游戏体验再升级  2025-07-24 06:55:50 三大运营商将精简套餐提升资费透明度,微信语音转文字功能灰度测试,京东布局七鲜小厨新生态  2025-07-23 08:16:15 阿里云通义千问 Qwen3-Coder 开源:480B 参数+256K 上下文,性能直逼 Claude Sonnet4  2025-07-23 08:07:04 荣耀高管罗巍否认一英寸、一镜双目配置:硬核设计观引争议,三年超越计划曝光  2025-07-23 07:48:59 欧盟或批准苹果App Store新规,避免每日5000万欧元罚金  2025-07-23 07:48:15 影石Insta360首曝无人机专利图:360°全景拍摄+模块化革命  2025-07-23 07:29:47 三星S25 FE重磅升级:前置影像革新,LTPO屏幕更省电续航更强  2025-07-23 07:28:36 麒麟9系直屏旗舰!华为Pura 80标准版震撼预售,性能与颜值双爆表  2025-07-23 07:12:10 苹果 watchOS 26 开发者预览版 Beta 4 正式发布,智能手表系统再迎重大升级  2025-07-23 06:43:47 国内首台能干会玩的人形机器人来了!星动纪元发布星动L7引爆未来科技  2025-07-22 14:18:46 macOS 15.6 RC震撼登场:全新功能引爆科技圈  2025-07-22 12:18:07 苹果 macOS 15.6 RC 更新现小插曲:26 Tahoe 测试版悄然推送,界面大变身  2025-07-22 12:17:34 超耐用折叠新标杆!三星Galaxy Z Flip7首获欧盟能效认证  2025-07-22 12:17:15 AC-Cache亮相PPOPP,腾讯云GooseFS与厦门大学共创存储新范式  2025-07-22 12:15:03 英伟达联发科AI PC芯片遇阻:设计调整与微软系统进度成关键阻力  2025-07-22 12:14:43 奥尼4K摄像机引爆P&I2025,直播涨粉新革命来袭  2025-07-22 12:14:11 2999元入手!苹果11英寸iPad A16国补后仅2197元,限时优惠太香了  2025-07-22 12:12:47 荣耀 X70 首销三日登顶全品牌销量榜首,引爆市场热潮  2025-07-22 12:09:06 三星新一代可折叠OLED震撼登场:坚固性狂飙2.5倍,未来触手可及  2025-07-22 11:59:41 长江存储2026年或成NAND市场新势力,国产产能占比将突破15%  2025-07-22 11:47:49 小米昆仑N3伪装车首曝,或将于2025年底震撼登场  2025-07-21 15:56:21 华硕战杀24震撼登场:949元解锁23.8英寸240Hz超感视觉新体验  2025-07-21 15:45:14 三成车主拒付车联网费用,智能汽车烧钱路在何方?  2025-07-21 15:43:30 因系统故障,阿拉斯加航空突发全面停飞  2025-07-21 15:38:35
友情链接 百度权重≥5友情链接交换
文化潮流网  |  数界探索  |  文化新视界  |  深度文化说  |  智慧科技  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经
© 2015-2025 科技快讯中文网 时光记忆 版权所有 备案号:陇ICP备2025016403号-1

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.008558秒