导读:32岁,全球排名前列的开源大模型技术掌舵人,说了声bye就挥手走了。为什么?
2026年3月2日,阿里千问发布了Qwen3.5小尺寸模型系列。
埃隆・马斯克在X上为@Alibaba_Qwen点了赞,并评价道:“令人惊叹的智能密度”。
阿里千问的技术负责人林俊旸回复并感谢了马斯克的关注。
然而在3月4日凌晨,林俊旸在该平台发了新帖,表示将离开千问。
"me stepping down. bye my beloved qwen."(我要退出了,再见心爱的千问)
不到一天的时间,从发布全球瞩目的大语言模型,到转身离场。原因为何?这位林俊旸又是个什么样的人物?
一个语言学学生的意外路线
这位1993年出生的90后技术男,从一开始不走寻常路。
他本科主修的是计算机科学,偏偏在硕士阶段“拐了个弯”,一头扎进北京大学外国语学院,专攻语言学及应用语言学。身边同学都调侃他“放着硬核代码不写,去啃语言学专著”,可是只有林俊旸自己知道,这份“跨界”埋下的,是未来颠覆人工智能界的种子。
硕士期间,他就玩起了“语言+技术”的跨界实验——把抽象的语言理论,转化为可计算的框架,还悄悄申请了国家发明专利。那时候的他,不像个埋首书斋的研究生,更像个“拆家式研究者”:一边啃《语言学纲要》,一边敲代码调试模型,把注意力机制和文本分类结合,硬生生走出了一条“别人没走过的路”。
更有趣的是,为了测试模型对方言的理解能力,他还拉着宿舍来自五湖四海的同学,录制各种方言话术喂给模型,甚至把家乡的方言谚语改编成测试样本,一度被同学调侃“把实验室变成了方言交流会”。这段跨界积累不仅为他后续研发奠定基础,更让他在语言学与AI结合领域初露锋芒,相关研究成果也为他后来在顶级学术会议发表论文埋下伏笔。
没想到,这份看似“不务正业”的积累,后来成了他破解多模态难题的关键“密钥”。
若说M6是他的“成名作”,那OFA模型就是他“统一思维”的第一次爆发。
2022年,已经升任项目主管的林俊旸,主导研发了通用统一多模态预训练模型OFA。在此之前,不同的AI任务需要不同的“输出头”,图像分类要接分类器,图像描述要接解码器,麻烦又低效。林俊旸的思路很简单:把所有任务都统一成“序列到序列”的生成问题,新任务只需设计指令,不用修改模型结构。
这个看似简单的改动,直接颠覆了多模态模型的研发范式。OFA发表后,被引用超700次,后来GPT-4V、Gemini等国际顶尖多模态模型,都借鉴了这种“统一生成”的理念。
与此同时,林俊旸在自然语言处理与多模态表示学习领域持续深耕,在NeurIPS、ICML、ACL等全球AI顶级会议发表多篇高质量论文,其研究成果被业内广泛引用,成为多模态领域的重要参考。
而林俊旸也凭借这份战绩,正式被任命为通义千问系列大模型的技术负责人,那年他才29岁,成为阿里最年轻的核心技术掌舵人之一,更凭借突出的技术能力,逐步跻身国内AI新生代标杆行列。
有意思的是,升职当天,他却带着团队去吃了顿路边摊,还自嘲“以前是敲代码的打工人,现在是带一群打工人敲代码的‘头头’”。
成为Qwen技术负责人后,林俊旸的“疯狂”更上一层楼。
2023年,当大多数公司还在“藏着掖着”,只开源小参数模型时,他拍板决定:Qwen从0.5B到72B,全尺寸开源,全部采用Apache 2.0协议,支持CPU/GPU多平台部署。这个“All-in开源”的决策,在当时引起了不小的争议——有人说他“把核心技术白白送人”,可林俊旸看得更远:“开源不是让利,是让更多开发者一起完善模型,中国AI要想走出去,必须打开大门。”
事实证明,他赌对了。
Qwen-7B一经开源,就凭借超强的中文能力碾压同期模型,在C-Eval中文评测中得分63.5,远超LLaMA2-7B的32.5分,成为中文开源模型的标杆;Qwen-72B更厉害,拿下LMSYS chatbot Arena人工评测开源榜首,让海外开发者第一次意识到“中国开源模型能和闭源模型掰手腕”。
在他的主导下,Qwen系列模型全球累计下载量突破6亿次,稳居全球开源大模型第一阵营,他也成功推动构建起中文社区最大的开源模型生态体系。更有意思的是,有海外开发者用Qwen模型写中文古诗,还特意@林俊旸,他不仅认真回复,还调皮地用模型和对方“对诗”,一来一回间,圈粉无数,也让Qwen的“中文基因”被更多人熟知。此外,他首创多模态Agent框架,大幅增强了模型的视觉与语音理解能力,进一步拓宽了Qwen模型的应用边界。
研发路上,林俊旸也有过“翻车时刻”。2024年,Qwen项目代码被GitHub误标下架,一时间开源社区炸开了锅,不少开发者担心模型无法继续使用。就在大家慌乱之际,林俊旸第一时间公开回应,冷静梳理问题、协调沟通,很快就解决了下架危机,用沉稳稳住了整个社区的信心。而这样的“小插曲”,反而让更多人记住了这个既专业又靠谱的年轻负责人。
他的“反差感”还不止于此。在清华大学主办的AGI-Next前沿峰会上,面对一群清华出身的同行,他一上台就开起了玩笑:“这里都是清华的,就我一个是北大的。”一句话化解了现场的严肃氛围,也让大家看到了这位技术大佬幽默接地气的一面。工作中,他是说一不二的技术决策者,带领团队攻克一个又一个难题;私下里,他更像个“技术宅男”,埋首代码、钻研论文,甚至在社交平台分享自己的研究心得,毫无架子。更可爱的是,他偶尔会在朋友圈晒自己养的猫,配文“猫主子监督我改代码,改不完不准睡觉”,反差感拉满。
2025年,林俊旸带领团队迎来新的巅峰——推出旗舰模型Qwen3-Max,参数规模超万亿,采用36T预训练数据,在GPQA等权威评测中超越GPT-5、Claude Opus 4,跻身全球前三。
这一年,32岁的他晋升为阿里史上最年轻的P10技术专家,成为业内公认的“90后AI大牛”,与月之暗面创始人杨植麟、腾讯首席AI科学家姚顺雨、清华大学教授唐杰并称为业内“基模四杰”,成为中国AI新生代的核心代表。
他在社交平台上感慨,团队为此花费了近一年时间,攻克了三大核心难题:让强化学习框架支撑长时序推理,平衡跨领域数据分布避免模型“偏科”,强化多语言能力服务全球开发者。
与此同时,他还组建机器人与具身智能研究团队,推动多模态智能体向现实世界应用延伸,进一步完善了Qwen的技术生态。而鲜为人知的是,为了测试模型的长文本处理能力,他曾让模型完整生成一本短篇科幻小说,还和团队打赌“模型写的故事能打动普通人”,最后真的把小说匿名发到网络,收获了不少好评。
就在所有人都以为他会继续带着Qwen冲刺更高峰时,2026年3月4日,林俊旸在X平台发了一句简短的话:“me stepping down. bye my beloved qwen。”
但是,千问的核心贡献者Chen Cheng在X上说了一句话:“离开似乎不是林俊旸自己的选择。”
在卸任前两天,林俊旸还带领团队完成了Qwen3.5系列4款小尺寸模型的开源发布,这4款模型采用原生多模态训练和最新架构,可适配移动设备、IoT边缘设备等多种场景,凭借出色的端侧推理性能,再次获得马斯克“令人印象深刻的智能密度”的点赞,这也成为他以千问负责人身份完成的最后一次公开产品发布。
他的卸任没有长篇大论,没有煽情告别,却在全球AI圈掀起了轩然大波——团队成员有人同步离职,开源社区有人感慨“一个时代的结束”,Hugging Face亚太生态负责人更是用“巨大损失”来形容他的离开。
还有人提道,阿里不是第一次干这种事了,在林之前,周畅是通义千问(Qwen)团队的灵魂人物和技术负责人,他在 2024 年 7-8 月左右离职加入了字节跳动,这件事当时在圈内也引起了不小的轰动。
林俊旸在卸任后他第一条动态,没有聊未来规划,反而晒了一张自己去爬山的照片,配文“终于能好好喘口气,不用再被代码追着跑了”。
没人知道他下一步要去哪里,但所有人都记得,这个从北大语言学跨界而来的年轻人,用7年时间,完成了从普通算法工程师到全球知名AI技术负责人的蜕变;他用“统一思维”,打破了AI领域的诸多壁垒,主导研发的M6、OFA、Qwen等一系列模型,均达到全球领先水平,其中Qwen系列成为中国AI走向世界的一张名片;他深耕学术与产业结合,在顶级会议发表多篇论文,推动开源生态建设,让中国开源模型在全球舞台上拥有了话语权。
他更以32岁的年纪成为阿里最年轻的P10,跻身“基模四杰”,成为90后AI从业者的标杆,用实力证明了跨界创新的力量。
林俊旸的故事,不是“天才的一帆风顺”,而是“跨界者的勇敢探索”。他个人没有被专业边界束缚,没有被行业规则局限,用语言学的细腻解读AI,用计算机的严谨实现创新,在AI浪潮中走出了一条属于自己的路。
或许,他的卸任不是结束,而是另一段探索的开始——毕竟,对于一个敢想敢干、始终对前沿充满好奇的人来说,AI的世界,还有太多未知等着他去解锁。
就像他在中关村AI顶级对话中所说的那样:
“AI的关键赌注在于主动性,需要正确的方向指引。”
而林俊旸等人带走的东西——经验、直觉、踩过的坑,不管去了哪儿,都会放大作用。人换个环境,能力不会消失,只是换了个地方生长。
32岁,AI在手,说走就走。
作者:开工的大雄
本篇文章为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 微信公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。
请扫描二维码,使用微信支付哦。