17611538698
webmaster@21cto.com

Siri 联合创始人:我对AI和人机交互的看法

资讯 0 900 2022-08-09 11:03:18


图片


语音助手 Siri 的联合创始人、现任三星战略与创新中心首席技术官兼高级副总裁 Luc Julia 解释了为什么人机交互引起了他的兴趣,讨论了 Siri 后端是如何在 Apple 构建以及分享他对人工智能未来的愿景。


玩个人电脑


所以,当我还是个孩子的时候,最先开始玩电子产品,然后在大约 15 岁的时候电脑出现了。我开始玩电脑——当时的第一台电脑,个人电脑——PC。而且你知道,我开始后也再没有停止。当时只有 BASIC 语言可用,但我用的是汇编语言,用它编程。


人机交互


后来有趣的发现,计算机是否可以与人类对话,或者人类是否可以与计算机对话。所以我当时做了所谓的HCI——人机交互。比如做一些信号处理,因为当你想让电脑和你说话的时候,你需要让电脑去抓,抓取信号理解信号。


语音识别和手势识别以及一切识别都是我的专长。然后,它后来变成了人工智能,因为当你开始理解信号时,这就是人工智能。


我在法国攻读博士学位,后来在麻省理工学院和斯坦福大学做博士后。实验室里的一些人决定是时候创建一家公司,因为技术看起来已经足够好了。所以 SRI [斯坦福研究所] 是一个衍生工厂!


我后来开始研究所谓的多模态,它基本上是试图将所有模态放在一起,以便为计算机创建消息。语音是最简单的一种,因为当时在计算机中安装麦克风比摄像头更容易。


但这些并不意味着识别语音很容易,因为即使在今天,语音识别也很棘手——不是对单词的识别,而是对意义的识别,这就是所谓的“自然语言”。


互联网作为游乐场


在 SRI,我们进行了一些应用研究,比团队中的其他任何人都更实用。我们推出了 CHIC [计算机人机交互中心]——它是一个应用实验室,我们在那里创造了一堆产品。


在 2000 年,1999 年,我认为它已经足够好了,现在可以进入现实世界来创造开始。


1999 年那是互联网的早期时期,用真人测试产品更容易,因为你只需要把它放到互联网上让人们和机器一起玩。


Siri的诞生


回到 1997 年,那是互联网的开端。是的——全球互联网,对吧?


所以它开始发展起来了,当时还没有谷歌,真的没有办法在互联网上找到东西。我们认为看看你是否可以使用语音找到一些东西是个好主意。这就是个人助手的想法——它帮助我们找到正确的信息。


我花了很长时间研究——直到 2007 年,该产品才准备就绪,当时 Adam Cheyer 创建了它的公司 Siri。他们围绕这个语音助手创建了一个产品。iPhone 也是在 2007 年推出的,所以很自然地用它说话,因为这部新手机里有一个很好的麦克风,


为 Siri 构建后端


Cheyer 找我回来,意思是我们共同培育自己的孩子。


后来这家公司的 Siri 拥有大约 150,000 名用户——150,000 名用户!


我的意思是,你基本上可以用家用服务器做到这一点,所以没关系。后来开始与 Apple 合作,我们知道将拥有 3 亿用户——比 15 万用户显示要困难一些。


因此,挑战在于确保系统具有可用性可可扩展性,并且我们能够提供必要的性能。因为当用户拥有语音识别器时,还需要能够始终为TA提供良好的响应时间。


我有机会负责 Siri 方面的一切——一切的价值。当然我们只看到接口部分,语音接口,但是服务器是很多的,后端也很多。


这是一个非常复杂的系统,有一个庞大的后端。iTunes 基本上“只是”存储,我们也需要大量的计算能力来运行 Siri。我们从头开始构建完整的后端。


从物理构建它——购买服务器,购买实际的数据中心本身——意味着到处都是挑战。看看 Siri,它有大约 17 项服务。当用户查看 Apple 的 Siri 时,它有大约有 5 项服务,当然我们希望添加越来越多的服务。


图片


在惠普引入敏捷开发方法


当我去 HP [Hewlett-Packard] 时,大公司的资源是丰富的。第一天,他们给了我 250 人,250 名工程师,这大约是我过去的 10 倍。


所以它的管理是和初创公司不同的。再说一遍,这是在 2010 年,10 年前的 2010 年,一家大公司里我们所说的敏捷方法是不存在,它使用的就是瀑布方法研发,这意味着您提前六个月的计划——这是很多人不希望在现代软件中发生的事情。


我在那里向高层介绍的东西之一就是敏捷,所以有 250 人不习惯它是一个挑战,但这是一个非常有趣的挑战。我们还开发了一款与惠普不同的新产品。惠普非常擅长打印机之类的,但它不知道连接的打印机可能是什么。因此,我们创建了现在称为 ePrint 的第一台联网打印机,第一年我们实际上售出了大约 8000 万台。


在巴黎开设三星人工智能实验室


今天有一个叫 SmartThings 的东西,三星几年前收购的,它也有后端。


后端基本上是允许存在云的东西——即物联网云。物联网云允许用户连接三星设备以及一些其它非三星设备。这是一个非常异构的环境,所以需要确保所有设备都可以相互通信。我们为此工作了 5 年。


另外,我想在巴黎这里开个分布,于是我们在 2018 年 6 月开设了三星的 AI 实验室。我相信法国工程师品质非常好。


法国有很多初创企业,尤其是现在的巴黎。当我还是学生的时候,放学后工程师们都直接为大公司工作。


我最近听说那些工程学院的 60% 学生现在想创业或为初创公司工作。所以有一个更加动态的环境,这也意味着这些人会看到一些东西——他们愿意,我不会说更有能力,但他们会接触到更多的东西。所以他们在我们提出的项目方面会更加灵活,这就是我喜欢法国工程师的原因。


人工智能的生态成本


AI 其实也很容易,因为你可以在一堆 CPU 和 GPU 或任何 PU 上扔去大量数据,你就可以得到一些结果。


你可以尝试,你可能失败,然后再试一次,实际上你会使用大量资源,特别是在存储方面,你正在使用的数据,还是在计算能力方面,因为你会进行不同的试验。


我注意到很多并没有真正关注,还有那些 CPU 和内存资源,它们在数据中心是看不见的,你自己感觉不到它们。我的意思是,有时候当你身边有自己的电脑时,你会意识到它们确实在工作,它们创造了一种温暖的环境,所以你会意识到它们。


但是当你使用 AWS 或 Microsoft Azure 或其他任何云时,你不会注意到这一点。


所以我说AI太容易了,而且你没有意识到你实际使用了多少能量来帮你正在做的事情,所以在某些时候,你需要——我们需要——清醒过来。


这就是为什么我总是试图解释需要非常小心,我希望人们会变得更加小心。我坦率地说,因为越来越多地鼓励我们使用这些资源,但需要实施一些法律法规。


人工智能的未来


早在 90 年代,我们谈论的第一个助手是语音助手,但现在我们将得到一个全能助手。


这将是一堆助手,因为不会是一个通用的人工智能。我不相信这会发生,现在只是按照今天的方式使用数学,而每个领域都会产生一堆助手。


所以我们将看到医疗领域的助理,我们将看到交通领域的助理。我们将到处看到人工智能。比如在医学领域——你知道 DNA 是非常非常有趣的东西。所以我们将看到 DNA 被解码,它可以用来通过机器学习帮助修复问题,通过深度学习,通过很多数据。这是很多有趣的统计数据。所以当然所有领域都会看到越来越多的AI助手。


有些人正在考虑其他事情——比如正在考虑用量子计算来做物理学。


而我们正在考虑用生物计算来做生物学。


所以现实情况是,这些事情仍处于早期阶段。量子计算也许不那么早,但它仍然非常非常年轻。而使用生物学计算,我们将无处可去。


如果我们相信,有朝一日,我们将创造出与人类自己的智力相近的东西,那就是某些人所说的一般智力,它不会通过数学来实现。


我不认为它会与物理有关,因为量子实际上是关于在另一个维度上的应用数学。可能是生物学,因为生物学实际上是最接近人类大脑的东西,但我们不知道。我们甚至不了解自己的大脑,因此构建一个大脑需要很长时间。


作者:场长


评论