DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

作者:news 发表时间:2025-08-12
脑机接口商业化起航:三地公布医疗服务价格 多个股年内股价翻倍后续反转 脑机接口商业化起航:三地公布医疗服务价格 多个股年内股价翻倍 华明装备2025年中报点评:25Q2业绩符合预期,海外市场增速亮眼【民生电新】 第五家外资独资险企诞生!史带财险战略“瘦身”砍掉七省分公司 7月铁路货运有所改善,但多项指标为前景蒙上阴影 富国银行首席股票策略师克里斯・哈维离职后续来了 知名风险投资家力挺英特尔CEO陈立武 谴责特朗普“拙劣霸凌”专家已经证实 拟主动终止上市!这只保险概念股退市渐近 特朗普宣布华盛顿特区进入公共安全紧急状态 脑机接口商业化起航:三地公布医疗服务价格 多个股年内股价翻倍官方通报 普惠型涉农贷款投放保持较快增长 利率水平继续保持下降趋势官方通报来了 拥有全国首家建筑风洞实验室,港珠澳大桥检测商今日上市是真的? Oklo(OKLO.US)Q2每股亏损逊于预期 与核燃料技术公司Lightbridge(LTBR.US)建立战略合作关系这么做真的好么? 暴跌31%!AI软件热门股C3.aiCEO健康问题、灾难性业绩引爆担忧 视频|人工PK智能!周鸿祎脚踢智能机器人最新报道 资本市场多元化退市渠道进一步畅通 今年已有5家公司宣布主动退市实测是真的 暴跌31%!AI软件热门股C3.aiCEO健康问题、灾难性业绩引爆担忧记者时时跟进 国泰海通获易方达基金增持54.86万股 每股作价约17.14港元官方处理结果 英特尔就与美国总统特朗普会面发表声明 “油”医生治不了“电”病人?宁德时代能否终结“只换不修”魔咒? 五粮液入局啤酒?多家酒企跨界背后:年轻化布局新尝试秒懂 预定利率下调引发人身险产品批量停售 力推分红险产品转型是真的? 龙国铁塔获摩根大通增持约879.96万股 每股作价约11.19港元秒懂 上海电气回购400万股 金额3318万元是真的吗? 个人消费贷款财政贴息政策来了:哪些消费适用?能补贴多少? 上海电气回购400万股 金额3318万元 青海省投三江水电公司多措并举筑牢迎峰度夏保电防线 重磅!财政部等三部门官宣:对符合条件的个人消费贷款给予财政贴息!年贴息比例为1个百分点 涉及这18家银行秒懂 事关这些贷款!财政部等九部门联合印发→又一个里程碑 虚增收入成本近200亿!*ST高鸿(000851)严重财务造假,或被强制退市官方处理结果 重磅!财政部等三部门官宣:对符合条件的个人消费贷款给予财政贴息!年贴息比例为1个百分点 涉及这18家银行 2025年中信用趋势|钢铁:利润或有所修复,财务杠杆仍高位承压学习了 金融监管总局联合龙国人民银行、龙国证监会召开 金融消费者和投资者保护监管联络员会议 青海省投三江水电公司多措并举筑牢迎峰度夏保电防线

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

本站

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

本站

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

本站

相关文章