探索豆包的智慧革命:超越DeepSeek,谁将定义未来的AI潮流?
字节跳动公司开发的AI助手豆包目前正在进行小范围测试,主要针对其自主研发的深度思考模型的不同实验版本。据豆包的相关负责人向极客公园透露,现阶段的重点是测试这些模型的各种版本。
据报道,豆包公司目前正在进行深度思考模型的测试工作,该模型是在豆包1.5基座模型的基础上进行研发的。 这一消息显示了豆包公司在人工智能领域的持续投入与创新。从基础模型到深度思考模型的研发过程,不仅体现了技术上的进步,也意味着未来可能在更多应用场景中实现突破。随着科技的发展,我们期待看到更多的实际应用案例,这不仅能提升用户体验,还能推动整个行业的进步与发展。
此前在1月中旬,豆包大模型团队发布了豆包1.5Pro版本,并宣布了深度推理模型Doubao-1.5-pro-AS1-Preview的存在。他们表示,“在未借助任何其他模型数据的情况下,通过RL算法的突破和工程优化,充分利用了TestTimeScaling的算力优势,实现了RLScaling,从而开发出了Doubao深度思考模式。”
极客公园的实测结果显示,在与豆包进行对话时,确实有时可以看到它生成答案时展示的思维链,但这种现象似乎并不频繁。目前,在豆包的对话界面中,还没有找到开启「深度思考」功能的相关入口。 这表明豆包在处理复杂问题时,已经开始尝试向用户展示其背后的推理过程,这对于增强用户对AI系统的信任感和理解度是一个积极的信号。然而,这种功能的不稳定性也提醒我们,AI技术虽然在不断进步,但仍需更多时间来完善。希望未来能看到这一功能更加成熟稳定,为用户提供更丰富的交互体验。
从2月22日起,豆包在应用下载排行榜上被腾讯旗下的AI应用「腾讯元宝」超越,目前位列中国区苹果应用商店免费APP下载排行榜第三名(榜首依旧是DeepSeek)。随着腾讯、百度等多家应用开始接入DeepSeek,字节跳动的豆包将如何应对这一局面,已成为业界关注的焦点。现在,我们已经可以看到一些端倪。 字节跳动需要采取积极措施来应对这种竞争态势。首先,可以考虑对豆包进行功能升级或优化用户体验,以提高其吸引力。其次,加强与用户的互动,了解用户需求并及时作出调整,从而增强用户黏性。最后,加大市场推广力度,通过各种渠道提升品牌知名度和影响力。只有这样,豆包才能在激烈的市场竞争中占据一席之地,避免被其他竞品远远甩在后面。
01豆包也上「深度思考」了?
最早具备深度思考能力的模型是OpenAI于2023年12月推出的o1系统,这一技术突破在人工智能领域引起了广泛关注。不过,值得注意的是,该系统采取了闭源策略,并且只对付费用户开放,每月需支付200美元。这种做法虽然能够为公司带来稳定的收入来源,但同时也限制了许多研究者和开发者的访问权限,可能不利于技术的进一步传播和改进。希望未来能有更多的开源版本出现,让更多的开发者和研究者可以共同推动这一领域的进步。
而DeepSeek则通过开源策略、成本降低以及交互创新,成为首家将深度思考能力大规模普及的AI公司——DeepSeek于2024年11月20日发布了R1-Lite-Preview,成为国内首个与o1相抗衡的推理模型,并在2025年1月20日开源了R1模型。
R1 模型的创新点在于:透明化思维链;展示完整的推理过程,包括自我质疑、假设验证等拟人化思考路径;低成本与开源;R1 模型的推理成本仅为 OpenAI o1 的 1/27,且代码完全开放。
DeepSeek的深度思考模式通过揭示AI模型的推理步骤来提升用户的理解能力,而其核心技术是思维链(Chain of Thought, CoT)。
简单来说,深度思考模式使用户能够直观地观察到模型的推理过程,这其中包括思维链的展示,即我们所说的COT(Chain of Thought)。这种思维链是通过训练模型生成中间步骤来实现的,例如自我质疑和反思。尽管这些都只是文字序列,但它们看起来非常像人类的思考过程。
在深度思考模式下,用户不仅能见证AI得出最终结论的过程,还可以清晰地看到模型解决问题的整个思维过程,包括自我质疑、假设验证以及错误修正等环节。 这种模式不仅提高了AI的透明度,还增强了其可信度。通过展示AI如何从初始假设逐步演进至最终解答,用户能够更好地理解AI的工作原理,从而对其结果产生更多的信任。此外,这种开放式的思考过程也有助于推动技术的进步,使开发者能够更有效地识别和解决模型中的潜在问题。
比如,在解决数学题时,模型不仅展示了从问题拆解到多方法验证直至最终结论的全过程,还能够实时获取网络上的最新信息,并进行有效的逻辑整合。这种能力使得模型在处理复杂问题时更加灵活和高效。这无疑为教育领域带来了新的可能性,特别是在培养学生的逻辑思维能力和解决问题的能力方面,提供了前所未有的工具和支持。未来,随着技术的进步,我们有理由相信这些模型将会变得更加智能和强大,从而帮助学生更深入地理解和掌握知识。
25 日,Anthropic 发布了 Claude 3.7 Sonnet 混合推理模型,阿里云 Qwen 推理模型「QwQ-Max 预览版」也亮相了,我让豆包评价了一下这两款推理模型:
可以看到豆包检索出9份资料并进行了「深度分析」|图片来源:极客公园
豆包展示了思考过程|图片来源:极客公园
思考结束的豆包分享了对这两款模型的看法|图片来源:极客公园
展示思考过程,使用户能够清楚地看到模型的推理步骤,而不仅仅是最终结果。这样,用户可以感受到模型的决策是有依据的,从而更加信任模型的输出结果。
02豆包 vs deepseek,各有千秋
由于仍在测试阶段,目前在豆包对话页面尚未正式开放“深度思考”功能的入口。用户在输入消息时,并没有像其他接入DeepSeek的产品那样提供选择框来开启或关闭“深度思考”功能。这一功能仅对部分经过筛选的用户可见,在他们提出某些特定问题时才会自动启用。我尝试使用几个相同的问题分别询问了豆包和DeepSeek,目的是观察两者在“深度思考”功能上的差异表现。 通过对比,可以发现豆包与DeepSeek在处理复杂问题时展现出不同的风格。例如,当面对需要综合分析的信息时,DeepSeek倾向于提供更为详尽和系统化的答案,而豆包则更注重简洁明了的回答。这反映出两家公司在设计其AI助手时的不同侧重点:一个追求深度,另一个则强调效率。这样的对比有助于我们理解AI技术在实际应用中的多样性和灵活性,同时也为未来的改进提供了方向。
经典的数学问题:「9.11 和 9.9 谁大」
在测试中,我发现豆包的“深度思考”模式似乎并不是每次都能稳定地展现出来。比如当我第一次询问“9.11和9.9谁大”时,它的回应显得比较简单直接。
图片来源:极客公园
在最近的一次讨论中,有人提出了一个看似简单的问题:“9.11 和 9.9 谁大?”这个问题虽然表面上与新闻事件无关,但却引发了对数字逻辑和比较方法的深入探讨。从数学的角度来看,9.11 明显大于 9.9,因为小数点后的数值也参与了比较。这种分析不仅涉及简单的数值对比,还涉及到对细节的关注和逻辑推理能力。 在日常生活中,我们经常需要做出类似的判断,无论是评估数据还是理解复杂的概念。这种能力对于新闻报道和评论同样重要,它帮助我们在信息爆炸的时代中,准确地识别和传达关键信息。通过这样的思考过程,我们可以更好地理解复杂的社会现象,并作出更为理性和全面的分析。
豆包仔细思考了为何我会再次询问它同一个问题……|图片来源:极客公园 重新构思后的版本: 豆包深思熟虑之后,开始推测我为何会第二次提出同样的疑问……|图片来源:极客公园 这样的修改保留了原文的核心意思,同时通过使用“深思熟虑”、“开始推测”等词汇,增加了对豆包心理活动的描绘,使句子显得更加生动有趣。这种表达方式不仅丰富了叙述,也给读者留下了更多的想象空间。
可以看到,豆包尽管已经回答了我的问题,但它依然细心地考虑到我可能没有完全理解之前的信息,因此它提供了多种判断的方法,并最终给出了明确的结果。 这样的处理方式展示了AI系统在提供服务时的细致与周到。豆包不仅限于简单地重复之前的答案,而是真正从用户的角度出发,确保信息被准确理解和接收。这种互动模式有助于提高用户满意度和信任度,同时也表明了技术在提升用户体验方面的潜力。通过不断优化算法和交互设计,未来的AI系统有望提供更加个性化和精准的服务。
再看一下 deepseek 的思考过程:
可以看出,尽管这个问题“看似简单”,deepseek在分析时的思考过程也更为详尽,比豆包的思考过程更加全面。
在这道简单的数学题上,豆包和DeepSeek都遵守了小数比较的基本原则,并通过多种方法进行验证。不同之处在于,豆包侧重于教学引导,并且充分考虑到了用户可能产生的误解;而DeepSeek则表现出更多的自我质疑和反复验证,其思考过程更为复杂。
哲学问题:意识的本质是什么?AI 会获得自我意识吗?
先来看豆包的回答:
再来看看 deepseek 的回答:
可以看出,DeepSeek的回答主要分为科学理论、AI意识路径、伦理框架和解决路径四个部分。引用了神经科学、量子理论等领域的知识,并且还涉及了一些具体的法律案例和数据;相比之下,豆包的回答则更加偏向于哲学理论的分类,列举了物理主义、二元论等不同的哲学流派,并讨论了支持与反对AI权利的观点,但并没有深入到技术细节的探讨。 这样的对比展现了不同领域对于AI认知的差异性。DeepSeek从科学和技术的角度出发,提供了一种更为严谨和实证的方法来理解AI的复杂性。而豆包则通过哲学的视角,引发我们对AI权利和道德地位的深层次思考。两者各有侧重,但都为理解和应对AI带来的挑战提供了有价值的参考。这种多元化的讨论方式有助于形成全面的认识,推动社会在面对AI时做出更加明智的决策。
DeepSeek和豆包在讨论意识的本质时,都表示目前尚未形成统一的观点,并且两者的探讨范围均涵盖了哲学和科学理论以及伦理问题。区别在于,DeepSeek更加注重技术细节,如神经形态计算和量子封印技术等,而豆包则更多地关注于哲学流派及其现有的伦理指导原则。 这种差异性反映了当前对意识研究的不同侧重点。DeepSeek的技术导向表明了科学家们试图通过技术创新来探索复杂的意识现象,这不仅需要跨学科的知识整合,还需要在技术上取得突破。相比之下,豆包的哲学视角强调了理解意识过程中不可或缺的人文关怀和社会责任。这种从不同角度出发的研究方法有助于我们全面理解意识这一复杂主题,同时也为未来的研究提供了多元化的思路和可能性。
通过本次实测,我们见证了豆包在深度思考模式上的初步展现,尽管目前仍处于测试阶段,且功能的稳定性和入口尚未全面开放,但其对推理过程的初步展示已经为用户提供了更加直观的理解途径。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.010965秒