17611538698
webmaster@21cto.com

翁丽莲:持续学习的力量

技术人生 6 3014 2023-03-10 01:24:15

背景

根据 OpenAI 官网显示,为 ChatGPT 项目做出贡献的人员共 87 人。从性别分布看,ChatGPT 团队中有女性 9 人,占总数的 10%;男性共 78 人,占 90%。

该 9 位女性成员中,有 2 位是华人,有曾就读于北京大学与香港大学的翁丽莲(Lilian ),以及 Steph Lin。

图片

“名校”和“年轻”是她们身上显著的标签。而整个ChatGPT 团队未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。

本文是 OpenAI 技术团队采访翁丽莲(Lilian )的实录,希望对大家有启示。

图片

翁丽莲(Lilian )

Lilian 其人

Lilian 目前在 OpenAI Robotics 团队工作。她的日常工作包括写代码、试验新想法、阅读论文、破解硬件以及与团队的 ShadowHand 机器人一起协同工作。

Lilian 有一个自己的机器学习技术博客,她认为最好的学习方法是向其他人清楚地解释一个技术新概念。

Lilian 认为通用人工智能 (AGI) 应该在最具经济价值的工作中胜过人类。

她期待看到 AGI 以以下这些方式帮助人类社会:

  1. 完全自动化或显著减少重复性和非创新性任务的人力。换句话说,AGI 应该能极大地提高人类的生产力。

  2. 极大地加快发现新的科学突破,包括但不限于通过提供额外的分析和信息来促进人类决策过程。

  3. 有效、高效和安全地理解物理世界,并与之互动。


在 OpenAI 工作过的项目中,你最引以为豪的是什么?


在 OpenAI 的头两年半年里,我在机器人团队工作,我提出了一个“登月”的想法:我们想做一只像人一样的机器人手来解魔方。


这次经历是一次非常激动人心、充满挑战。我们通过深度强化学习 (RL)、疯狂数量的领域随机化以及没有真实世界的训练数据,顺利解决了这一挑战。


从模拟和 RL 训练到视觉感知和硬件固件,我们合作得如此紧密和有凝聚力。这是一个了不起的实验,在那段时间里,我经常想起史蒂夫·乔布斯的现实扭曲力场:当你如此坚信某件事并坚持不懈地推动它时,你就能以某种方式让不可能成为可能。


从 2021 年初开始,我开始领导应用人工智能研究团队。管理团队提出了一系列不同的挑战,需要改变工作方式。


我为 Applied AI 中与语言模型安全相关的几个项目感到特别的自豪:

  1. 我们设计并构建了一组评估数据和任务,以评估预训练语言模型生成仇恨、色情或暴力内容的趋势。

  2. 我们创建了一个详细的分类法并构建了一个强大的分类器来检测不需要的内容以及内容不合适的原因。

  3. 我们正在研究各种技术,以降低模型生成不安全输出的可能性。

随着 Applied AI 团队正在实践部署尖端 AI 技术(例如大型预训练语言模型)的最佳方式,我们看到了它们对现实世界任务的强大和有用。正如我们的团队章程中所强调的,我们意识到安全部署这些技术的重要性。

图片

当前的深度学习模型并不完美——它们接受了人类创造的大量数据(例如在互联网上、策划的和文学上的数据)的训练,并且不可避免地吸收了人类社会长期存在的许多缺陷和偏见。

比如让DALL·E去演一个护士,它只会生成女性角色,或者一个教授,它只会生成白人。该模型会捕获到现实世界统计数据中的偏差或我们训练数据中的偏差。

我有动力设计一种方法来减轻这种社会偏见,也在评估这种方法的效率。我们与团队一起设计了一个管道来减少这种偏差,以及一个运行人在环境中的工作流程。

减少社会偏见不是一个容易的问题,因为它出现在我们生活的许多方面,有时很难注意到。但我很高兴DALL·E团队非常认真地对待这个问题,并在很早的阶段就采取了行动。我们现在所拥有的只是一个开始,我们会不断进步。

我很自豪能在这个领域工作,也很高兴看到我们如何一步步让现代人工智能变得更安全、更好。

不同主题或领域的想法,往往能激发出新的想法,拓宽潜在的解决方案空间。


你如何将个人经历和价值观应用到在 OpenAI 的日常工作中?


我相信学习的力量,学习永远不会太晚。


维护我的个人博客是保持这种好奇心并定期了解深度学习社区新进展的好方法。我还鼓励我的团队持续学习,无论是与他们当前的项目相关还是无关。不同主题或领域的想法往往能激发出新的想法,拓宽潜在的解决方案空间。


我也坚信团队合作。如果每个人都发挥出自己最大的优势,我们会得到大于1+1 >2 的结果。 


同时,我们可能会经常遇到“脏”工作,我个人非常愿意承担这些任务,因为只要是最大的障碍或该任务可以为项目增加最大的价值,没有什么应该被认为是“肮脏的”或“微不足道的”。


我鼓励我周围的人也这样做,成为团队合作者,并共同努力以提高团队生产力。


告诉我们你为什么写博客!你为什么开始它?你希望它能激发什么样的灵感?


这一切都始于一套个人学习笔记。


我并没有很早就进入深度学习领域,现在我仍然认为自己是一个“新手”。


最开始时,当我开始深入研究这么多论文时,我对不是设计算法来解决问题而是训练模型来学习算法来解决问题的概念感到惊讶。我读得越多,我就越好奇。


实际上,组织我读过的所有论文和学到的新概念变得非常困难。所以我决定开一个博客来记录和整理我的学习笔记。我还相信,学习某些东西的最好方法是确保你能正确、清楚地把知识传授给别人,写作帮助我到达那里。


我没想到它会在机器社区流行起来,但每当我收到一封封感谢邮件或当面被告知他们从阅读我的博客中学到了很多东西时,我感到非常荣幸和感激。自 2017 年我开始写博客以来已经快 6 年了,我会尽可能地坚持下去。


你认为人工智能在我们的社会中解决的最紧迫的挑战之一是什么?

近年来,人工智能社区取得了如此大的进步。硬件、模型架构和数据的进步使训练大的模型成为可能。

因此,我们不断看到越来越大的能力。

我相信我们正走在 AGI 的正确轨道上,但扩展并不是唯一的方法。在我看来,目前最紧迫的挑战是对齐和安全。在某种程度上,它们可能是关于可控性或可操纵性的类似问题。

首先,即使我们已经拥有了一个极其强大的人工智能系统,如果我们不能有效地传达我们的目标并确保模型与自己想要的一致,就不可能创造出我们需要的价值。

当前最强大的模型是从大量数据中学习,数据集不可避免地捕捉到现实世界中不完美的缺陷和偏见。在这方面,未对齐的模型存在安全问题,因为它们不知道应该避免什么。

我相信我们正走在 AGI 的正确轨道上,但扩展并不是唯一的方法。目前最紧迫的挑战是同步和安全。

你在 OpenAI 的职业生涯中收到的最好建议是什么?


这不是某人给我的特定建议,而是基于我目前在 OpenAI 的经验。就是说,你要有大局观。


我们正在创造新事物,我们应该有雄心壮志,勇敢,并有足够的毅力继续努力。


你在哪里寻找灵感?


图书。我通常阅读深度学习领域以外很多的书籍,并从各种领域中获得灵感;例如,一个作家50年坚持不懈,一个外科医生完全注重细节,一个企业家有“疯狂的想法”是多么重要。


此外还有我身边的人。我很荣幸能与 OpenAI 的一大群才华横溢的同事一起工作。每个人都有闪闪发光、鼓舞人心或令人尊敬的东西,我喜欢向他们学习。


作者高朋

参考:

https://openai.com/blog/the-power-of-continuous-learning

评论