钛媒体App 2月7日消息,
中信建投研报称,1)DeepSeek在保持模型优异性能指标的同时大幅降低训练和推理成本。DeepSeek-V3使用2048块H800GPU完成了6710亿参数的训练,训练成本为557.6万美元,DeepSeek-R1模型的每百万输出tokens为16元,均显著低于同等水平的模型成本。利用DeepSeek模型生成的数据样本实现小参数量的模型蒸馏,提升模型性能。2)高性能、轻量化、低成本的模型能力将显著推动端侧AI产业发展。端侧硬件设备是将大模型能力进行实物化输出落地的关键环节,近日OpenAI的CEO Sam Altman在接受媒体采访时也透露OpenAI将开发可替代手机的生成式AI专用终端。国内物联网模组厂商在端侧AI领域具备先发优势,并积极进行产业布局。
根据《网络安全法》实名制要求,请绑定手机号后发表评论