AI巨头DeepsSeek崭露头角:探秘其背后的秘密
仅在登顶中国和美国区苹果应用商店后的24小时内,外界对DeepSeek的态度便发生了显著变化。短短两天内,这家备受全球关注的中国AI新秀正承受着来自硅谷和华盛顿前所未有的压力。 DeepSeek的迅速崛起及其技术革新引起了国际社会的高度关注,但同时也引发了诸多质疑与担忧。面对国内外的种种压力,DeepSeek需要展现出更加透明的姿态,并积极回应各界关切,以维护其在全球市场的信誉和发展前景。只有这样,才能在未来的竞争中站稳脚跟,继续引领行业创新。
1月28日,SamAltman最近在社交媒体上表示,他对DeepSeek的R1模型印象非常深刻,并认为它是一项“令人印象深刻”的技术成果。与此同时,美国总统也称赞DeepSeek为“很积极的技术成果”。然而,就在这些赞誉之后的第二天,OpenAI突然转变态度,指责DeepSeek未经许可使用其专有技术进行“蒸馏”。 这一系列事件引发了广泛的关注与讨论。一方面,DeepSeek的技术得到了行业内外的高度认可,这表明该公司的研发实力确实不容小觑。另一方面,OpenAI的指控则让整个事件变得复杂起来,这也反映了当前人工智能领域内关于技术共享与知识产权保护之间存在的矛盾。如何平衡创新与合规,将是未来行业发展的重要课题。
美国多位官员也表达了对这一指控的支持,包括特朗普的人工智能顾问大卫·萨克斯(David Sacks)和特朗普提名的美国商务部长霍华德·卢特尼克(Howard Lutnick)。他们指出,“DeepSeek借助‘盗取’的美国技术和高端半导体,在极低的成本下打造出了强大的人工智能模型。”卢特尼克在当天表示。
特朗普的人工智能顾问大卫·萨克斯(David Sacks)指控 DeepSeek | 图片来源:X
而白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)表示,美国官员正在评估DeepSeek对美国国家安全的影响。几周前,美国商务部工业与安全局(BIS)刚刚将智谱添加到出口管制实体清单(Entity List),智谱成为了“AI六小龙”中首家被列入该清单的大型模型公司。
1月20日,DeepSeek发布了R1推理模型,在多项逻辑任务(包括数学和编程)上表现优异,与OpenAI的o1模型不相上下,甚至超越了ChatGPT的所有版本。然而,值得注意的是,R1模型的运行成本仅相当于OpenAI费用的大约2%。这一突破性进展不仅展示了技术上的巨大进步,也引发了关于人工智能未来发展方向的新思考。低成本高效率的人工智能解决方案可能会推动更多领域的创新应用,同时也可能对现有的商业模式造成冲击。如何平衡技术创新与商业利益,将是未来讨论的重要议题。
这严重打击了国外科技巨头的股价,微软、英伟达、甲骨文和谷歌母公司Alphabet等与人工智能相关的科技股大幅下跌,总市值蒸发近1万亿美元。美国监管机构对DeepSeek的态度也因此发生了转变。
在OpenAI发出指控的次日,另一家美国科技公司Anthropic则直接提议阻止DeepSeek等中国企业的技术进步。1月30日,Anthropic首席执行官达里奥·阿莫迪发文呼吁美国政府加大对中国的芯片限制,以确保先进通用智能(AGI)技术仅在美国诞生。
这也引发了政府的回应。同日,据国外媒体透露,美国正考虑对向中国出售的芯片实施进一步限制,这其中可能包括H20芯片,正如Dario所提议的那样。
两天之内,美国科技巨头和监管机构对DeepSeek的态度从最初的赞赏转为打压,这反映出他们对其“科技霸权”地位受到威胁的深层次担忧。随着DeepSeek等中国科技公司在前沿技术领域的崛起,美国方面也开始扩大技术封锁的范围,从计算能力到更广泛的模型等领域均有所涉及。当前的事件可能仅仅是一个开始。
或许,历史将证明封闭和封锁并非维持优势的有效手段,甚至反而可能催生出如 DeepSeek 的巨大创新。开放与合作才代表未来。
在这一未来实现之前,以DeepSeek为代表的中国科技企业或许需要寻找到长期的解决方案。
一、“蒸馏”不等于“窃取”
此次 DeepSeek 的大模型“蒸馏”争议,起源于 OpenAI 的最大投资方微软。
1月29日,外媒报道,微软的安全团队发现,DeepSeek的相关人员可能通过OpenAI的应用程序编程接口(API)未经授权获取了大量数据。微软已经将这一情况通报给了OpenAI。
当日,OpenAI 向外媒透露,它发现了 DeepSeek 使用“蒸馏”技术相关的证据。所谓的“蒸馏”,指通过对更大、更强模型的学习,让小型模型能够在特定任务上以更低的成本取得类似效果。相当于“徒弟”学“师傅”。
针对这种指控,DeepSeek 并未做出回应。
谈到大模型的“蒸馏”技术,并不意味着这是在窃取知识产权,而是一种行业内的常见做法。无论是中国的AI实验室还是美国的同行,许多机构都会利用OpenAI等领先公司提供的高质量数据进行模型训练。“这意味着新的模型能够免费获取到经过大量人类反馈优化后的成果。我个人认为,这种做法其实促进了整个行业的进步与发展。” 这一现象反映出当前AI领域内资源共享的重要性与普遍性。尽管如此,如何在促进技术创新的同时保护好各家公司和研究机构的知识产权,依然是一个需要业界共同探讨的重要课题。
大模型的“蒸馏”过程 | 图片来源:CSDN
RitwikGupta指出,一个核心争议在于,当用户利用数据来构建自己的模型并服务于自身目的时,这一行为本身便引发了讨论。 在我看来,这个问题触及了数据所有权和使用权的核心。随着技术的进步,越来越多的用户开始利用数据来创造价值,但与此同时,这也带来了对隐私保护和数据安全性的新挑战。如何在鼓励创新与保障个人权益之间找到平衡点,是我们当前亟需解决的重要课题。
OpenAI的服务条款明确指出,用户不得“利用其生成的内容来开发与OpenAI相竞争的模型”。这一规定无疑为那些希望借助OpenAI技术进行创新的企业和个人设下了一道红线。尽管如此,它也引发了关于技术创新与版权保护之间界限的讨论。如何在保障公司研发投资的同时,促进技术的开放与共享,将是未来政策制定者需要仔细考量的问题。 这种做法一方面确保了OpenAI能够持续投入资源于研究与开发,以维持其技术领先地位;另一方面,也可能限制了一些潜在的竞争者的发展空间。因此,找到一个平衡点,既能保护知识产权,又能鼓励健康的市场竞争,对于整个行业来说都是至关重要的。
“与OpenAI竞争的模型”这一定义确实具有一定的解释空间。比如,DeepSeek-R1是一个开源模型,向公众开放使用,并非用于商业用途,因此可能不符合这一定义中的某些标准。 在我看来,这种界定方式有助于明确不同模型的发展方向和应用领域。开源项目如DeepSeek-R1虽然在技术上与顶尖的商业模型竞争,但它们的主要目标是促进知识共享和技术进步,而不是直接参与商业市场的竞争。这不仅为研究者和开发者提供了宝贵的资源,也为整个行业带来了更多的创新可能性。
OpenAI近期的动作显示出其正在加速封闭自身的技术出口,甚至对其技术实力的释放也变得更为谨慎。这表明OpenAI正在更加极端地执行“闭源”策略。根据其官方声明,中国及其他公司一直试图“蒸馏”美国领先AI公司的模型。为保护自身的知识产权,OpenAI计划采取一系列反制措施,在发布模型时会更加审慎地选择包含哪些前沿功能。 这样的举措无疑会引起业界的广泛关注。一方面,这可能有助于OpenAI更好地保护其核心技术不被竞争对手轻易模仿,从而维持其在全球AI领域的领先地位。另一方面,这也可能减缓全球AI技术的整体进步速度,限制了其他公司和研究机构从中受益的机会。在当前全球化的背景下,如何平衡技术创新与知识产权保护,仍然是一个需要深入探讨的问题。
这不仅体现了公司的意愿,也反映了国家的意愿。OpenAI表示,未来与美国政府保持紧密合作极为关键,这样可以更有效地保护最先进的模型,避免对手和竞争对手获取美国的技术。
1 月 28 日,谷歌前首席执行官兼董事长 Eric Schmidt 联合撰写了一篇文章,文章名为《中国的开源人工智能会终结美国在该领域的霸权吗》。Schmidt 表示,DeepSeek 崛起之后,目前全球 AI 领域的权力格局似乎正在围绕两个关键轴转移:一是中美之间的竞争,二是封闭与开源模式的较量。
二、闭源和开源的互补
这是一个颇具戏剧性的时刻:中国科技公司从过去全球开源的受益者,逐渐变成了开源的反哺者,甚至引领者——从巨头阿里巴巴、初创公司 Minimax、再到此次爆火的 DeepSeek 等,均通过开源向全球开发者免费开放 AI 模型、反哺全球科技生态。
尽管大部分美国主流科技企业(除Meta外)仍然选择闭源策略,并对技术细节实施更为严格的保密措施。 这种持续的闭源态度表明,这些公司在面对激烈的市场竞争时,依然选择通过保护自身的核心技术和知识产权来维持竞争优势。然而,这也引发了一些关于创新速度和技术共享价值的讨论,尤其是在当前强调开放协作的时代背景下。
海外网友甚至调侃 OpenAI 为“CloseAI”。
与此相对的是,DeepSeek 这样的科技公司,通过开源以及与 AMD、华为等厂商的紧密合作,成为了真正“Open”的 AI 公司。当全球无数开发者得以在本地设备上部署运行 R1 模型、并由此衍生出各种应用场景用法,DeepSeek 因此获得了全球开发者的支持、为现在的“爆红出圈”打下了基础。
这证明了开放,才是 AGI 时代最核心的竞争力之一。
尽管OpenAI声称他们在此之前也发现了DeepSeek的研究成果,但作为首个实现开源的公司,DeepSeek依然赢得了来自世界各地最多用户的赞誉和支持。 这一现象反映了当前科技领域的一个重要趋势:开源精神正在推动技术创新和应用的加速发展。DeepSeek能够在众多竞争者中脱颖而出,不仅彰显了其技术实力,也体现了开源模式的巨大潜力。开源不仅能促进知识共享,还能够激发更多的创新思维和合作机会,这对于整个行业的进步有着不可忽视的作用。
将自己的经历和所走的道路分享出来,让他人能够避免不必要的弯路,更快地找到最佳路径,这就是开源的意义所在。
更重要的是,开源被证明拥有不输于闭源的价值。
此前,由美国构建的闭源模型(如 OpenAI 的 o3 和 Anthropic 的 Claude 3 Opus)一直被视为行业标杆。而开源模型(尤其是中国的开源模型)通常被认为落后几个月。然而,DeepSeek 的 R1 和多模态模型 Janus Pro 彻底改变了这一认知。
当开源模型能在性能上追平闭源对手,这可能会颠覆整个人工智能行业的生态。其低成本优势必吸引更多开发者,最终可能在这场技术角逐中获胜。
使用容器 App 等方式,已经可以实现完全在手机端侧运行 DeepSeek R1 模型 | 图片来源:X
在海外的社交媒体上常见这样的观点:在AGI时代,凭借开源和合作的优势,中国有可能与美国一同率先达到AI领域的下一个重要阶段。
Eric Schmidt 在文章中呼吁,美国已经拥有世界上最好的闭源模型,为了保持竞争力,还必须支持一个充满活力的开源生态系统的发展。“开源和闭源竞争很可能会找到一种自然的平衡,为不同用户带来一系列不同的产品和价格点。”他说。
OpenAI(以及一众 AI 大厂)和 Deepseek(以及期待更多 AI 新锐)的理想状态,更应该是一幅太极图:闭源对开源、充裕对短缺、外扩对内修、大力对灵巧……看似相克,实则相生。
只有两者互补、而非对立,才有利于人类通向 AGI 之路。因为后者会带来对抗,而前者则能形成合力。
三、开放,才是未来
在对 DeepSeek 的赞誉之后,大洋彼岸的科技巨头与政府迅速转变态度,核心是在政策层面加速“封锁”。
1月29日,在DeepSeek“蒸馏”指控之后,白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)表示,美国政府官员正在对DeepSeek可能带来的美国国家安全影响进行评估。
30 日,Anthropic 的 CEO Dario Amodei 直接发文呼吁美国政府加强对中国的芯片管制。他认为 DeepSeek 的成功并未降低美国芯片算力的价值,相反在通往 AGI 的道路上,未来仍需要数百万块芯片、数百亿美元(至少)。只有继续加强出口管制,才能保证美国的技术单极“霸权”。
同日,据外媒报道,消息人士透露,美国正考虑对向中国出售芯片实施进一步限制。报道指出,这些限制可能会影响到英伟达公司的H20芯片。此前,由于该芯片的训练效率较低,一直被允许出口。消息人士表示,关于是否实施这些限制措施的最终决定可能不会很快出台。
自1月28日起,DeepSeek公司开始遭受来自美国IP地址的持续网络攻击,包括DDoS攻击和密码破解等多种形式。据网络安全公司奇安信的专家表示,这种攻击在两天后突然暴增百倍。这种情况不仅暴露了DeepSeek在网络安全方面的脆弱性,也引发了对跨国网络攻击频发的担忧。 这种攻击模式显示了黑客手段的多样性和攻击强度的不可预测性,对任何企业的安全防御体系都是一种严峻考验。尤其是对于技术公司而言,如何有效应对这类大规模、高强度的网络攻击,成为了一个亟待解决的问题。此外,跨国网络攻击的频繁发生,也凸显出全球网络安全合作的重要性,只有加强国际合作,才能更有效地应对这些挑战。
1月28日,深度求索(DeepSeek)官网表明,其在线服务近期遭遇了大规模的恶意攻击。
这些事件背后折射出的深层事实是:DeepSeek等中国科技公司的崛起,已经对国外科技巨头构成了巨大冲击,并动摇了美国长期以来的“科技霸权”。面对这种变化,美国似乎倾向于延续过去的技术限制和封锁手段,以维持其主导地位,从而试图阻止这一进程。 这一现象引发了广泛讨论。一方面,美国试图通过技术封锁来抑制竞争对手的发展,这不仅无助于全球科技的进步,还可能导致国际科技合作的破裂。另一方面,中国科技公司的崛起为全球科技创新注入了新的活力,促进了技术多样性和市场竞争力。如何在竞争与合作之间找到平衡,将是未来国际科技关系中的一个重要课题。
如果说之前主要限制的是算力,那么现在则是同时限制算力和模型。
但历史可能会展现出,企图借助技术封锁来保持优势的策略最终将难以奏效。正如曾经对算力的限制那样,这种封锁不仅无法遏制创新的脚步,反而会激发像DeepSeek这样重大突破的诞生。
或许在迈向 AGI 的征程中,开放,才是真正的核心竞争力。
更何况,如今开源模型的特点不仅在于它们能在高性能主机上运行,还在于其自带的“跨越封锁”属性。比如,DeepSeekR1这样的模型不仅可以在线上运行,而且已经有开发者成功实现了将蒸馏后的1.5B大小的DeepSeekR1在iPhone上进行完全离线端侧运行。这表明该模型几乎不可能被彻底封锁。 这一现象突显了开源技术在促进信息自由流动方面的潜力。随着技术的发展,我们看到越来越多的工具和服务能够不受地理位置或网络限制的影响,从而确保了知识和技术的广泛传播。这种能力不仅增强了个人用户的自主权,也使得创新和知识分享更加便捷和安全。
“美国的竞争优势长久以来依赖于开放科学,以及产业、学术界和政府的协同合作。我们应该重新探索开放科学的潜力,使其再度成为推动美国人工智能发展的引擎。” Eric Schmidt表示。
科技从业者的普遍观点是,硅谷科技公司应该追求科技“领导力”而非“霸权”。因为后者必然引发抵抗,产生离心力,难以长期维持。而前者能促进合作,凝聚向心力,推动人类科技进步。硅谷当前确实拥有科技“领导力”,但若一味追求“霸权”地位,反而可能失去这一核心优势,最终作茧自缚被更多具有创新思想的创业者反超。
开放,才是真正的未来,DeepSeek 就是最好的代表。
免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系648751016@qq.com
页面执行时间0.008532秒