当所有人都沉浸在马年除夕的团圆喜庆中时,阿里云兑现承诺,甩出一记 “硬核新春祝福”。
2 月 16 日晚间时分,全新一代大模型千问 Qwen3.5-Plus 正式发布并全面开源。这不仅让春节的国产大模型赛道战火升级,更以登顶全球最强开源模型的实力,向全球 AI 与科技巨头递上了一封底气十足的 “战书”,标志着国产大模型在硬核生产力指标上,实现了对全球顶级闭源模型的关键反超。
这一次看似简单的版本更新,实为底层架构的全面革新。千问 Qwen3.5-Plus 交出的成绩单,堪称是惊艳:
总参数量达 3970 亿,却在阿里独创架构优化下,仅激活 170 亿参数,性能直接超越万亿参数的 Qwen3-Max 模型。
更为难得的是,性能飙升的同时,成本与部署门槛大幅降低:部署显存占用降低 60%,最大推理吞吐量提升至 19 倍,API 价格更是低至每百万 Token 0.8 元,仅为谷歌 Gemini 3 Pro 的 1/18。极致的 “性能 - 成本” 比,让 AI 技术真正走向普惠,为千行百业的规模化落地扫清了成本障碍。
这份实力的背后,是原生多模态的技术突破。不同于行业内不少拼接组装的多模态模型,Qwen3.5-Plus 在视觉和文本混合 token 上完成预训练,还大幅新增中英文、STEM 及推理数据,让模型掌握了更密集的逻辑与世界知识,真正实现 “以小博大”—— 以不到 40% 的参数量,拿下超万亿参数基座模型的顶尖性能。
在全球权威基准评估中,这款模型更是在未来生产力核心领域全面超车:BFCL V4 Agent 工具使用 72.9 分击败 Gemini 3 Pro 和 GPT-5.2,SWE-bench Verified Agent 代码生成 76.4 分超越 Gemini 3 Pro,Video-MME 视频推理 87.5 分优于 GPT-5.2,ERQA 具身智能推理 67.5 分大幅领先全球顶级模型。
阿里巴巴Qwen的官方X账号在公告中发布了性能图表,将Qwen-3.5与GPT-5.2、Claude Opus 4.5和谷歌的Gemini 3 Pro进行了比较。
在衡量研究生水平推理能力的GPQA钻石级测试中,Qwen-3.5得分88.7分,在所有LLM模型中排名第三。在评估指令执行准确性的IFBench测试中,Qwen-3.5得分76.5分,优于所有其他模型。.
结果表明,在多语言和基于代理的工作负载方面,阿里巴巴的模型与 Gemini、GPT 系列系统和 Claude 模型等专有竞争对手的模型相比,差距非常小。
此前,中国国产大模型略显滞后的编程能力,也在这次实现了关键追赶。用户只需一张手绘草图,模型就能直接生成可用前端代码;支持长达 2 小时视频直接输入,既能读懂剧情,又能拆解代码逻辑,让视觉编程成为人人可用的便捷生产力工具。
性能跃升的背后,是阿里对 Transformer 经典架构的重构式创新。
Qwen3.5-Plus 融合了线性注意力机制与稀疏混合专家(MoE)架构,更核心的是应用了千问团队自研的门控技术 —— 这项斩获 2025 全球 AI 顶会 NeurIPS 最佳论文的前沿技术,被阿里成功实现工程化落地,正是这一技术,支撑起 3970 亿总参数仅激活 170 亿的超高模型效率,为 “全球最强开源模型” 奠定了坚实底层基础。
如今全球已正式进入 “多智能体(Multi-Agent)” 时代,智能体能力的强弱直接决定 AI 赛道的竞争格局。而 Qwen3.5-Plus 在 Agent、具身智能、AIGC 等核心领域的强劲表现,精准卡住了行业发展的关键身位,也让国产大模型在全球多智能体竞争中占据了先发优势。
如果说技术创新是内核,那么开源生态与软硬一体化,就是阿里云让大模型走向产业的核心抓手。
过去两年,阿里云大模型从跟跑者跻身全球第一梯队,千问更是成为全球最大的开源模型家族:开源模型数量超 400 个,衍生模型突破 20 万个,下载量超 10 亿次,远超美国 Llama 系列,积累了从全球顶尖机构到千行百业企业的深厚用户基础。
与美国市场 AI 应用集中在 SaaS 软件和 AI 编程不同,中国的 AI 落地深度绑定实体产业,而千问正是中国企业级应用最多的大模型:例如汽车企业用它打造智驾与智能座舱,金融业构建风控系统,牧原、新希望等农业巨头开发 “兽医大模型”,中药企业加速药物研发,摄像头、传统家电更是将其多模态交互作为标配;微博、小红书打造域内模型,2023 年后诞生的 AIGC、智能硬件企业 100% 拥抱千问。
针对这一趋势,阿里云明确提出 “拿下市场增量 80%” 的目标,而支撑这一目标的,正是 “模型 + 芯片 + 云基础设施” 的软硬一体化战略。作为全球少数具备全方位能力的企业,阿里让三者深度耦合,实现了 1+1+1>3 的协同效应:算力调度实现万卡乃至数十万卡异构调度,故障恢复时间大幅缩短;打通大数据与知识管理体系,实现数据一体化;自研真武芯片针对 MoE 架构优化,大幅提升推理效率;将 3 万多款云产品 API 转化为 MCP,让大模型直接具备运维与服务能力。
根据沙利文数据显示,千问在中国企业级大模型调用市场位居第一,成为阿里云新增需求的核心驱动力;Omdia 数据显示,2025 年上半年中国 AI 云市场规模 223 亿元,阿里云占比 35.8%,超过第二到第四名总和,同年阿里云在中国云市场份额从 33% 提升至 36%,领先优势持续扩大。
另外一家全球知名IT研究与咨询机构Gartner在2025年“GenAI技术创新指南”中将阿里云在GenAI云基础设施、工程与模型等多个维度列入“Emerging Leaders(新兴领导者)”象限,意味着其产品成熟度与市场影响力已进入全球主流竞争区间。
纵观全球AI产业,Google与阿里是少数能在模型、平台、算力三条线同时给出体系答案的代表性玩家。
千问 Qwen3.5-Plus 的开源,远不止是一款大语言模型的发布,更是国产大模型发展的里程碑。它打破了 “参数堆得越大,模型越强” 的行业误区,证明了技术创新才是核心竞争力;它以极致性价比,让制造、电子电气、新能源、农业等中国支柱产业,拥有了大规模落地 AI 的可能;它的开源策略,让全球开发者共享技术成果,为 AI 生态孕育了全新的创新土壤。
如今,AI Agent (AI代理/AI智能体)正以惊人速度进化,大模型正从单纯的对话框,走向驱动产业变革的核心引擎,一个由智能体驱动的 AI 新时代正在加速到来。而阿里云的这次 “除夕炸场”,不仅让国产大模型在全球竞争中站稳了脚跟,更让中国产业有了承接这场 AI 变革的底气与能力。
从跟跑到并跑,再到如今的局部领跑,国产大模型的发展,正以硬核创新书写着属于中国的 AI 答案。而千问 Qwen3.5-Plus 的开源,只是一个开始,未来的 AI 赛道,中国科技企业正以更开放、更创新的姿态,奔赴下一场星辰大海~
作者:凌何
本篇文章为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。
请扫描二维码,使用微信支付哦。