原生支持DeepSeek,国内70%部署企业基于昇腾快速上线

DeepSeek火爆之后,大模型呈现“技术摸高+工程创新”并行发展趋势,算力需求仍将持续增长。

图片系AI生成

图片系AI生成

“服务器繁忙,请稍后再试。”这才是DeepSeek爆火之后输出最多的答案。

DeepSeek凭借算法优化显著降低了模型训练成本,如MoE架构、动态路由算法等,同时开源策略加速了大模型在垂直领域的渗透,由此带来了采用率的指数级增长,数据显示,DeepSeek的全球日活用户从34.7万飙升至1.19亿,仅用了一个月。

如何解决DeepSeek带来的算力焦虑,成了算力行业厂商的必答题,截至目前,包括昇腾、天数智芯、摩尔线程、壁仞科技、燧原科技、沐曦、海光等企业均已宣布适配DeepSeek。

据钛媒体App了解,国产芯片厂商的适配只是初级状态,达到了可用的程度,要想从更底层适配DeepSeek的算法,需要在FP8混合精度、多场景功耗平衡、软硬协同深度优化等方面持续投入。

DeepSeek导致算力分化:技术摸高与工程创新并行

业界专家表示,DeepSeek火爆之后,大模型呈现“技术摸高+工程创新”并行发展趋势,算力需求仍将持续增长。

技术摸高方面,头部企业坚定投入预训练基础模型创新,追逐Scaling Law,加速探索AGI。他们关注高效、稳定、开放的底座,极致性能、稳定可靠的AI集群,以及深度开放的平台和生态。

例如,Meta的AI投资从400亿美元增加到650亿美元,谷歌从525亿美元增加到750亿美元。同时,模型演进和技术迭代也在加速,如千问发布旗舰版模型Qwen 2.5 - Max,Google发布Gemini 2.0系列。

工程创新方面,新的范式降低了后训练和蒸馏的门槛,引发新一波的“百模千态”。企业关注便捷、易用、性价比的平台,兼顾成本与性能的蒸馏/微调方案,以及便捷的部署和敏捷业务上线。

在企业端(To B),各企业以冲刺方式接入DeepSeek获取流量。自R1发布后的20天内,国内外已有160多家企业集体接入DeepSeek。

在消费端(To C),用户呈爆炸式增长,超级APP快速出现,加速了LLM的全面普及。DeepSeek以现象级表现提升了社会对LLM的认知,促进了新商业模式的成型,实现了商业正循环。

因此,大模型算力也需要支撑同时支撑两方面的需求演进,具体来看,首先是,模型结构优化,用相同硬件支持更大的模型,提升模型的规模和性能。

其次是计算通信优化,提升算力利用率,缩短训练时间,让企业能够更高效地完成复杂的AI任务。

还有后训练优化,让企业无需大量标注数据,降低数据成本,同时通过强化学习等技术提升模型性能。

在推理优化层面,需要支持一次预测多个token,成倍提升推理效率,为企业提供更高效、更快速的AI应用体验。

据悉,绝大多数AI玩家需要依靠能够充分发挥有效算力的算力底座及完整的解决方案,实现高效训练和推理。稳定可靠的算力平台能够降低试错成本,让企业聚焦模型工程优化。

昇腾原生支持DeepSeek

钛媒体App获悉,DeepSeek发布V3之后,华为内部就启动了相关分析以及技术适配,并且发现,DeepSeek的技术路线和昇腾产品十分匹配。

例如MoE的架构,华为此前预判MoE是大模型的未来,到了R1发布,DeepSeek相当于“撸代码”的方式做强化学习,昇腾预研的开发强化学习套件,能够大幅简化强化学习过程。

据了解,昇腾是业界首个适配完成DeepSeek核心算法,支持DeepSeek全系模型预训练及微调的芯片平台,昇腾超节点支持DeepSeek全系模型预训练及微调,支持DualPipe、跨节点All2All等DeepSeek核心优化技术,超大带宽通信域更适合DeepSeek的流水线并行算法及冗余专家等能力。

同时,昇腾是业界唯一从预训练到微调全流程适配DeepSeek的AI训练平台,随着行业模型训练从SFT微调走向强化学习训练方式,昇腾提供DeepSeek R1模型及强化学习算法,结合提示工程及数据采样,可生成大量高质量合成数据。

昇腾联合伙伴/客户,推出了一体机、云服务、硬件+开源社区等产品形态,帮助企业快速部署,已覆盖互联网、金融、运营商、政务、教育等多个行业。其中,昇腾DS一体机超大系统吞吐,超高多用户并发,30+软硬件伙伴选择昇腾推出一体机方案。

据了解,目前各行业已有80多家客户/伙伴已基于昇腾快速适配/上线DeepSeek系列模型并对外提供服务,20多家企业适配测试中(预计两周内全部上线)。据一位接近昇腾的业内专家表示:“总体来说,国内70%的企业都基于昇腾快速上线。”(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2025-03-23 22:46

香港财政司司长陈茂波:香港正通过构建“耐心资本”生态支持科创发展

2025-03-23 22:22

高通总裁安蒙谈DeepSeek:人工智能模型正在变得更小、更有能力

2025-03-23 21:52

香港财政司司长陈茂波:稳步深化互联互通,积极开拓中东等地区的新资金来源

2025-03-23 21:25

上海贝岭:部分高管拟合计减持不超13.4万股公司股份

2025-03-23 21:19

富佳股份:股东拟减持不超6.57万股公司股份

2025-03-23 20:59

亚光股份:股东拟减持不超1%公司股份

2025-03-23 20:51

中国贸促会会长会见苹果公司CEO库克

2025-03-23 20:49

四川眉山市市场监督管理局:对千禾味业产品抽查23批次,均符合国家标准

2025-03-23 20:27

马克·古尔曼:苹果公司致力于为手表添加摄像头

2025-03-23 20:10

3月23日新闻联播速览22条

2025-03-23 19:54

海利生物:股东拟减持不超2%公司股份

2025-03-23 19:46

自由现金流主题基金申报数量已达36只

2025-03-23 19:46

小米在日本开设首家门店

2025-03-23 19:04

和达科技:股东拟减持不超1%公司股份

2025-03-23 18:57

美国参议员现身中国发展高层论坛

2025-03-23 18:15

朱民:从中国国内产业链延伸的全球产业链开始初步展现,稳定全球产业链

2025-03-23 17:55

蔡昉:农村养老难需靠尽快缩小城乡基本公共服务差别等措施来解决

2025-03-23 17:27

本周新增爱购控股1家境外上市备案企业

2025-03-23 17:27

本周新增名瑞智能、胜华波电器等4家上市辅导备案企业

2025-03-23 17:17

中国工商银行行长刘珺:金融机构需从资金中介向综合服务提供商转变

扫描下载App