Meta AI 首席执行官 LeCun：不要从事LLM工作

场长

动态 0 2423 2024-05-31 11:31:03

在近日巴黎举行的初创企业年度技术大会VivaTech上，有着“人工智能业鲁迅”之称的Meta AI的首席执行官Yann LeCun建议希望在AI生态系统中工作的学生不要从事LLM（大型语言模型或称“法学硕士”）方面的工作。

“如果你是对构建下一代AI系统感兴趣的学生，请不要从事LLM方面的工作。这是大公司的事情，你们无法对此有所贡献，”LeCun在会议上表示。

他还说，人们应该开发能够克服大型语言模型局限性的下一代AI系统。

远离LLM

有趣的是，关于LLM（大型语言模型）替代品的讨论已经持续了一段时间。最近，Devika的年轻创始人Mufeed VH（Devika是Devin的替代品）谈到了人们应该如何远离Transformer模型并开始构建新的架构。

“每个人都在做同样的事情，但如果我们专注于不同的架构，比如RMKV（一种RNN架构），那将是非常好的，”Mufeed说，他接着解释了这种特定架构的无限上下文窗口和推理能力。

他还认为，通过这种方法，甚至有可能构建出与GPT-4一样令人印象深刻的东西。

但是，LLM 仍在不断进步

尽管LeCun反对一股脑全部研究LLM，但Transformer训练模型仍在不断发展。AI/ML顾问Dan Hou谈到了GPT-4o，并强调了其训练模型。

当文本被认为是所有复杂模型的基础时，GPT-4o被设计用来原生地理解视频和音频。这影响了未来版本可以训练的数据量。

“AI能变得多聪明？有了原生的多模态架构，我猜测答案是非常、非常好，”Hou说。

此外，Sam Altman在最近的一次采访中也谈到了数据将不再是问题，从而解决了训练LLM的担忧。可以试想，如果数据问题能够得以解决，LLM的尺度定律将继续存在。

作者：万能的大雄
参考：
https://analyticsindiamag.com/yann-lecun-advices-students-getting-into-ai-space-to-not-work-on-llms/

本篇文章为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 微信公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

06月24日

Meta AI 首席执行官 LeCun：不要从事LLM工作