17611538698
info@21cto.com

OpenAI 联合创始人 Andrej Karpathy 加入 Anthropic,旨在利用人工智能技术大幅提升 Claude 的预训练能力

动态 0 17 12小时前

导读:Karpathy 将组建一支新团队,利用 Claude 本身来加速前沿模型开发中最昂贵的阶段。

OpenAI 联合创始人 Andrej Karpathy 加入 Anthropic,旨在利用人工智能技术大幅提升 Claude 的预训练能力。

OpenAI 的联合创始人之一、全球最知名的 AI 研究员 Andrej Karpathy是在本周一宣布加入 Anthropic。对于 Claude 的开发商 Anthropic 而言,此举无疑是一次重要的人才引进,助力其在大型语言模型开发领域保持领先地位。

图片

Karpathy 将加入由 Nick Joseph 领导的Anthropic 预训练团队,他将在那里组建一个全新的团队,专注于一个引人注目的递归目标:利用 Claude 本身来加速预训练研究。预训练是构建像 Claude 这样的系统时成本最高的环节,也是计算密集型的阶段,它赋予前沿模型核心知识和能力。找到更快、更高效的方法,可能会重塑整个人工智能行业的经济格局。

在一篇浏览量高达1360万次的X帖子中,Karpathy 这样写道,他相信“未来几年在大语言模型(LLM)前沿领域的发展将具有特别重要的意义”。他还补充说,他仍然“对教育充满热情”,并计划在适当的时候重拾这项工作。

此次聘用标志着Karpathy 职业生涯的圆满结束,他的职业生涯几乎涵盖了现代人工智能的每一个重大转折点。Karpathy 在斯坦福大学师从ImageNet背后的计算机科学家李飞飞,获得博士学位,研究方向为深度学习和计算机视觉。2015年,他与其他11位创始人 共同创立了OpenAI  ,并在该公司从事深度学习研究。2017年,他离开OpenAI,加入特斯拉担任人工智能总监。

在特斯拉,Karpathy 领导着全自动驾驶和自动驾驶辅助系统的计算机视觉团队,这两个项目是这家电动汽车制造商实现自动驾驶汽车宏伟目标的基础。他于2022年7月离职,之后重返OpenAI工作约一年,随后于2024年再次离开,创立了Eureka Labs,一家将 人工智能助手应用于教育领域的初创公司。目前,Eureka Labs的工作已经暂停,Karpathy 全力投入Anthropic的研发。

时机颇为耐人寻味。Anthropic 已成为顶尖技术人才的聚集地,而其主要竞争对手 OpenAI 却正经历着一系列高管离职潮。过去两年,OpenAI 已流失十几位高级管理人员和研究人员,其中包括首席技术官 Mira Murati、强化学习先驱 John Schulman,以及最近在 2026 年 4 月同一天离职的三位高管。

对 Anthropic 而言,成功签下 Karpathy 表明,随着公司研发和商业运营规模的扩大,它有能力吸引最顶尖的人才。这家由首席执行官 Dario Amodei 领导的公司,估值约为 8000 亿美元,已引起投资者的广泛关注,据报道,该公司正在考虑首次公开募股(IPO),最早可能在 2026 年底进行。

Karpathy 的新角色也凸显了前沿人工智能领域的一个更广泛趋势:利用现有模型来改进下一代模型。如果 Claude 能够显著加快自身的预训练流程,这将标志着递归式自我改进的实际应用,而这正是人工智能安全领域长期以来密切关注的能力之一。这一前景究竟会令观察者感到兴奋还是不安,可能取决于他们对 Anthropic 自成立以来所秉持的安全至上的企业文化的信任程度。

目前看来,Karpathy 似乎正处于他最想待的地方:回到技术实验室,在前沿领域构建模型。

“因为凡有的,还要加给他,叫他有余;没有的,连他所有的也要夺过来。”


——《马太福音》25章29节

评论

我要赞赏作者

请扫描二维码,使用微信支付哦。

分享到微信