阿里发布开源模型QwQ-32B:性能比肩DeepSeek-R1满血版,消费级显卡可跑 | 钛快讯

创新场景
千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。

3月6日凌晨,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。

据悉,千问QwQ-32B是阿里探索推理模型的最新成果。在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,应证了大规模强化学习可显著提高模型性能。

在一系列权威基准测试中,千问QwQ-32B 模型表现出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求,非常适合快速响应或对数据安全要求高的应用场景,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中,进一步打造高度定制化的 AI 解决方案。

此外,千问QwQ-32B模型中还集成了与智能体 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

目前,千问QwQ-32B已在魔搭社区、HuggingFace及GitHub等平台基于宽松的Apache2.0协议开源,所有人都可免费下载模型进行本地部署,或者通过阿里云百炼平台直接调用模型API服务。对于云端部署需求,用户可通过阿里云PAI平台完成快速部署,并进行模型微调、评测和应用搭建;或是选择容器服务 ACK 搭配阿里云 GPU 算力(如GPU 云服务器、容器计算服务ACS 等 ),实现模型容器化部署和高效推理。

从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,开源囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等「全模态」,覆盖从0.5B到110B等参数「全尺寸」,截至目前,海内外AI开源社区中千问Qwen的衍生模型数量突破10万,超越美国Llama系列模型,成为全球最大的开源模型族群。(本文首发于钛媒体APP,作者|张帅,编辑|盖虹达)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

13:11

脑机接口概念股异动拉升,爱朋医疗午后涨超10%

13:05

部分稀土股回调,广晟有色跌超2%

13:00

香港科技大学已取录两位哈佛转校生

12:59

悦达起亚5月销量达22075辆,同比增长15.7%

12:38

摩根士丹利策略师预计未来6-12个月中国股票将吸引更多资金流入

12:33

大连市:27项具体举措提振消费

12:20

香港《稳定币条例》将于8月1日生效

12:17

天问二号探测器在轨状态如何?圆形柔性太阳翼展开图片来了

12:08

特斯拉美股夜盘持续反弹,股价重上300美元关口

12:07

胜蓝股份:向不特定对象发行可转债申请获审核通过

12:04

港股午评:恒生指数跌0.21%,恒生科技指数跌0.59%,蔚来跌超5%

11:45

股东读长文批比亚迪存在营销等短板,王传福:确实存在不足,会改进

11:42

新疆铁路今年货运发送量突破1亿吨

11:42

市场监管总局(国家反垄断局)发布《中国反垄断执法年度报告(2024)》

11:38

A股午评:创业板指半日跌0.48%,新消费、创新药概念股回调

11:25

北京市委副书记、市长殷勇:北京将加快建设具有全球影响力的人工智能创新策源地和产业高地

11:22

北京公积金新政:抵押房屋可正常评估

11:20

日本东电股东要求前高管赔偿超13万亿日元,二审裁决股东败诉

11:17

北京:探索培育二锅头新消费场景,推动红星、牛栏山工业旅游基地升级国际文化交流驿站

11:15

中国进出口银行前5个月投放对外贸易领域贷款4600亿元

扫描下载App