一场DeepSeek风暴,揭开中美AI竞逐新叙事

钛度号
创新无法被阻碍

文 | 硅基研究室,作者 | Judy

一家来自中国杭州、成立不到两年的初创企业DeepSeek,以前所未有的速度触及了全球大模型界敏锐的神经。

风险投资机构a16z创始人安德森将DeepSeek最新的推理模型R1描述为「人工智能的斯普特尼克时刻」,斯普特尼克是苏联在1957年先于美国发射的人造卫星,英伟达高级研究科学家Jim Fan则认为“Deepseek作为一家非美国公司真正践行着 OpenAI最初的使命”。

DeepSeek还引发了华尔街的震动,从股市到科技巨头的财报电话会上,分析师迫切想知道DeepSeek所带来的影响。据「硅基研究室」不完全统计,DeepSeek 在本周至少九次在财报电话会议上被提及,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)承认DeepSeek「确实有一些创新」,Meta创始人扎克伯格则在电话会上将这家中国公司视为新的竞争对手。

事实上,作为中国大模型玩家,DeepSeek的出圈并非是孤例。2024年至今,「神秘的东方力量」已经在硅谷AI圈多次受到关注。正如AI领域泰斗吴恩达所言:

“DeepSeek的创新表明,中美在生成式AI领域的差距正在迅速缩小,在某些领域中国已现领先迹象。”

本文主要论述三个核心趋势:

1、反击OpenAI,「中国AI复仇者联盟」已经崛起

2、AI领域的「中国式创新」有三大核心关键词

3、2025,中美AI竞逐或迎来新叙事

一、反击OpenAI,「中国AI复仇者联盟」正在崛起

在全球目光聚焦DeepSeek的出圈背后,事实上,过去一段时间内,在追赶和反击OpenAI这件事上,从大厂到创业公司,在多个技术领域里,「中国AI复仇者联盟」已经在崛起。 

比如在多模态领域的文生视频上,去年2月,OpenAI发布Sora,但推动AI视频真正落地的却来自中国科技大厂——快手的可灵,可灵甚至在内测期就引发海外用户集体跪求「中国账号」;语音方面,字节跳动豆包的实时语音功能就曾以惊人的拟人效果,实现了GPT-4o想要追求语音助手「Her」的效果。 

在更关键的大模型「幻觉」问题上,以百度为主的中国公司更是贡献出明显优于OpenAI的更优解决方案,以RAG(Retrieval-Augmented Generation检索增强生成)技术为例,如今已成为主流大模型提升性能的共识。但实际上,早在2023年3月,百度发布文心一言时,就已提到了RAG是百度大模型的特色,而两年过去,百度特色已成为行业追逐更优模型效果的共识。 

实测文心一言和OpenAI也可能清晰地看到中国AI的能力跃升。我们以热门春节档电影为话题,分别问了文心一言和chatGPT两个问题:在“做藕粉的过程中,出现了哪些让哪吒感觉不适的操作?”和“在徐克的射雕电影中,黄蓉给欧阳锋的九阴真经,是用什么语言写的?”实测结果可以发现,文心一言都给出了详细正确的解答,但chatGPT即便在联网下也并未给出正确或详细的解答。 

图说:相同问题下,chatGPT(右)回答错误或不详细 ,文心一言(左)给出正确和详细解答

这背后其实是百度针对RAG构建了一整套「理解-检索-生成」的协同优化技术,百度CTO王海峰曾拆解过这一技术实现过程。所谓的「理解」就是拆解知识点,充分理解用户的需求;「检索」则是先找到最合适的信息,然后进行搜索排序优化,并将搜索返回的异构信息统一表示,再送给大模型;而「生成」则是会综合不同来源的信息做出判断,并基于大模型逻辑推理能力,解决信息冲突等问题,最终生成准确率高、时效性好且高质量的答案。 

从构建更低成本的模型,到RAG、多模态、语音交互等多个技术领域的追赶超越,无论是DeepSeek此类创企,还是百度等科技大厂,可以肯定的是,在全球大模型竞逐中,「中国AI复仇者联盟」已经上桌了。 

二、AI领域的「中国式创新」

墙内开花墙外也香,一系列中国AI玩家出圈背后,其实是AI领域「中国式创新」的复现。 

我们可以将「中国式创新」总结为三个关键词:应用优先、形态丰富、务实优先。

一是应用优先。百度创始人李彦宏曾说:“模型本身不产生直接价值,只有在模型之上开发各种各样应用,在各种场景找到所谓的‘PMF’,才能真正产生价值。 ”这种「应用优先」的认知也随着中国大模型玩家的洗牌和分化逐步成为关键共识。在广阔的应用土壤中,中国AI更容易发现用户实际需求、迅速迭代,找到OpenAI们不容易看到的创新落脚点。 

二是形态丰富。对比海外大模型应用层的表现,随着中国AI的应用形态的不断丰富和能力迭代,跨越从「能用到好用」的鸿沟。 「AI产品榜」此前曾发布一份关于《2024全球AI产品付费用户规模》的榜单,其中微软Copilot以5574万付费用户规模位列全球第一,而中国AI产品百度文库以4000万规模位列全球第二,第三、第四为Canva和ChatGPT,而百度文库的付费用户规模是它们的2-4倍。 

图源:AI产品榜 

与免费用户不同,付费用户是愿意为企业成本买单的真用户,而以百度文库为代表的中国AI的上榜也印证了在中国AI的真价值。 

三是务实优先。以OpenAI为代表的海外大模型企业擅长用「暴力美学」追求AGI,但中国AI企业在「有限资源」下,追求的是一条务实主义的路。

中国创企中DeepSeek就是务实的典型代表,R1它通过混合专家模型(MoE)、多头潜在注意力极致(MLA)、多令牌预测(MTP)、长链式推理(CoT)等多种技术组合,且只进行了RL训练,在数据精度、底层通信上做优化,最终实现了模型训练高效率和低API成本。 

李彦宏也曾对比国内和海外生态,他提到,“很多美国同行,他们做法是当做一个science,有一个AGI终极目标,就想尽各种办法解决它”,但中国公司也有AGI梦想,但不同的是,中国AI是边做边解决问题,“我更多希望尽早接触场景及接触应用,在这个过程当中大家遇到的最多的问题,就是我们优先解决的问题。” 

更多的投入并不代表就有更多的创新,百度和DeepSeek的诸多实践成果其实都是中国技术公司工程能力优势的体现。 

三、2025,中美AI竞逐或迎来新叙事

2023年,当OpenAI携chatGPT横空出世时,一位谷歌研究员曾发布一句流传网络的预测:“谷歌没有护城河,OpenAI也没有。” 

如今随着中国AI的崛起,这句话的含金量仍在上升。梁文锋也曾说过:“技术没有什么秘密,但重置需要时间和成本。” 

而在今天,随着大模型竞逐正式进入第三年,中国AI一面专注模型迭代,一面聚焦成本效率优化,亲手打破了「中国AI只跟随、无创新」的质疑。

创新的落脚点可以是多方面的,中国的科技公司们已经在走这条路:一方面我们可以利用有限资源的极致高效利用,绕开「算力暴力美学」,实现弯道超车;另一面,丰富的实体产业应用场景和高质量的数据,都利于中国AI公司更务实的探索,通过让AI落地千行百业,实现真正的「平权」,这将是中国公司的机会。 

一位大模型产业人士认为,DeepSeek的出圈的最大意义在于,让外界看到了中国AI的爆发能力,以及中国正在加速缩短与美国AI的差距,速度比人们想象中要更快。 

新的中美大模型竞逐还在继续,OpenAI深夜推出o3-mini新模型已印证了这一点,但「DeepSeek风暴」也只是中国AI崛起的开始,CNBC的Jim Cramer就猜测百度是否会成为下一个吸引市场关注的中国科技巨头。他在X上提出了这个问题,“首先是DeepSeek,然后是BABA,接下来可能是百度?”据「硅基研究室」了解,春节过后,百度或将推出文心模型的新版本。

图源:X 

一切迹象都在表明,2025年,AI领域的「中国式创新」也将会发挥更大的作用,中国的AI的创新价值,也在加速被世界重估。

伟大无法被计划,真正的创新也不会因「出口管制」而停止,2025,不妨给中国AI多一点信心。 

本文系作者 硅基研究室 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App