阿里巴巴,股价暴涨!最新成果公布:“用5%的力”,性能比肩满血DeepSeek-R1
3月6日,阿里通义千问大模型团队宣布,正式推出最新的推理模型QwQ-32B。
阿里巴巴称,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美,但二者在参数量上相差将近20倍。
据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。
在数学推理、编程能力和通用能力的一系列基准测试中,通义千问大模型团队将QwQ-32B与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较,结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。
据介绍,在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习。在初始阶段,特别针对数学和编程任务进行了强化学习训练。与依赖传统的奖励模型不同,通义千问大模型团队通过校验生成答案的正确性来为数学问题提供反馈,并通过代码执行服务器评估生成的代码是否成功通过测试用例来提供代码的反馈。
业内人士分析,QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。
值得注意的是,尽管DeepSeek-R1拥有6710亿的巨型参数量,但由于DeepSeek创新性地使用了MoE(混合专家模型)架构以及MLA(多头潜在注意力机制)的方法,每次推理仅激活370亿参数(占总量的5.5%)。这使得DeepSeek-R1虽然整体很大,但实际干活时只需要动用一小部分力量,能够做到节省资源,高效完成任务。
阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。
目前,阿里已采用宽松的Apache2.0协议,将QwQ-32B模型向全球开源,所有人都可免费下载及商用,也可以通过阿里云百炼平台直接调用模型API服务。同时,用户也可通过通义APP免费体验最新的QwQ-32B模型。
3月6日早盘,阿里巴巴集团(09988.HK)港股大幅高开涨超6%,截至收盘涨超8%。
3月5日晚,阿里巴巴美股大涨超8%。
此前,2月25日,阿里通义Qwen发布基于旗舰模型Qwen2.5-Max构建的推理模型QwQ-Max-Preview预览版,支持联网搜索,会和DeepSeek以及Kimi的推理模型一样展现思考过程.
长江证券研报指出,近期,阿里在AI领域持续发力,践行了其AI驱动战略,随着其后续投入的逐步提升,相关成果有望加速迭代,相关成果或将惠及相关产业链,加速AI应用落地,进而进一步带动算力需求的爆发。同时,随着阿里在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入,或将引领中国AI产业加速发展。
标签: 阿里巴巴
绍兴SEO网站排名优化软件教程,全方位提升网站流量与排名攻略,绍兴SEO优化实战指南,网站排名提升与流量倍增策略
下一篇深入解析宿迁SEO网站排名优化软件教程,助你快速提升网站流量!,宿迁SEO网站排名优化软件攻略,高效提升网站流量的实战教程
相关文章
-
阿里巴巴、百度开始采用自研芯片训练AI模型详细阅读
《The Information》杂志周四援引四名直接知情人士的消息报道,中国的阿里巴巴和百度已开始使用自主设计的芯片训练其 AI 模型,部分替代...
2025-09-12 17 阿里巴巴
-
周五热门中概股多数上涨,台积电涨3.50%,阿里巴巴涨3.57%详细阅读
上涨股当中(按市值从高到低),台积电涨3.50%,阿里巴巴涨3.57%,拼多多涨0.66%,网易涨0.84%,京东涨1.73%,中华电信涨0.43...
2025-09-06 12 阿里巴巴
-
周三热门中概股多数上涨 阿里巴巴涨3.26%,理想汽车跌5.43%详细阅读
周三热门中概股多数上涨,纳斯达克中国金龙指数(HXC)收高0.93%。 上涨股当中(按市值从高到低),阿里巴巴涨3.26%,拼多多涨1.17%...
2025-08-07 22 阿里巴巴
-
周五热门中概股多数下跌 台积电跌2.66%,阿里巴巴跌2.95%详细阅读
周五热门中概股多数下跌,纳斯达克中国金龙指数(HXC)收跌1.82%。 上涨股当中(按市值从高到低),中华电信涨0.76%,日月光半导体涨5....
2025-08-02 15 阿里巴巴
-
直击WAIC | 阿里巴巴发布首款自研AI眼镜“哇哦Quark Glasses”详细阅读
专题:2025世界人工智能大会 新浪科技讯 7月26日下午消息,2025世界人工智能大会(WAIC 2025)于7月26-28日在上海举办,大会以...
2025-07-27 19 阿里巴巴
-
阿里文章网站,探索阿里巴巴背后的故事与商业智慧,解码阿里,揭秘阿里巴巴的商业传奇与智慧详细阅读
《阿里文章网站》深入挖掘阿里巴巴发展历程及商业策略,揭秘其背后的故事与智慧,为读者呈现一个真实、立体的阿里形象。...
2025-07-08 23 阿里巴巴