导读:未来App Store 可能会被AI 终结,以用户意图为中心,由AI 协调服务的模式将会开启。 4月24日,Meta 首席技术官安德鲁·博斯沃思(Andrew Bosworth)接受a16z 的访谈,本次对话围绕未来 5 到 10 年内容消费方式的演变、AI 对应用模型与交互范式的颠覆以及对产品、市场的深远影响展开。 01 未来十年内容消费将超越手机,AR眼镜是关键方向 主持人提问:未来五到十年,我们的内容消费方式将如何演变? Andrew Bosworth:展望未来十年,我非常有信心,我们将拥有远超拿出手机这种单一方式的途径来获取内容。我认为AR眼镜显然代表了一种切实的可能性。我也希望能为真正引人入胜的沉浸式体验找到更好的解决方案。例如,我想和父亲一起看比赛,并希望能有身临其境般坐在场边的感觉。当然,可以亲自去现场买高价票,但有没有更好的替代方案?我相信是有的。对于未来十年的展望,我对所有这些替代性的内容呈现媒介都非常看好。 五年的时间跨度则更为复杂。我相信五年后市面上会出现不错的眼镜——包括智能眼镜、AI 眼镜和显示眼镜。其中一些将极其高端,性能卓越。另一些则会非常小巧,也许显示分辨率不高,但它们几乎可以随时随地使用,就戴在你的脸上。我不会用它们来处理复杂工作,但在活动间隙用来获取一些简单的内容,它们可能会非常有效。 我们正目睹的,正如大家可能预料到的,是一个开端。这个谱系的一端是超级高端但可能非常昂贵的体验,这些体验并不会普及到所有人。另一端则是一系列更广泛可用的体验,但其功能还不足以取代我们今天使用的设备。我们希望,越来越多的人能够获得那些目前用其他任何方式都无法实现的真正独特的体验。这就需要我们去探索MR和VR的潜力。 02 当前的AI革命是广泛且真实的机遇 主持人提问:纵观您的职业生涯,您非常擅长将重大技术变革融合成新的产品体验,例如结合了社交、移动和“老派AI”的News Feed。如何将这种融合技术趋势、创造突破性产品的经验,应用于当前以AI为代表的技术浪潮? Andrew Bosworth:关于这一点我想谈两方面。首先,我认为如果说有什么是特别擅长的,那就是全身心投入去理解核心问题:人们到底想完成什么?他们想做什么?当你从这个角度出发时,你自然会去选用任何有助于实现目标的工具。这种方法能让你坦诚地评估现有的工具,并敏锐地识别新兴趋势。你越是只关注技术本身,就越有可能陷入某一个特定的技术浪潮里。之后你或许会不愿承认这个浪潮已经过去,并迟迟不肯拥抱下一个浪潮。那样你就是在为了技术而技术,而不是为了解决产品问题。 但如果你着眼于人们生活中面临的那些基本问题你就能保持务实。我之所以提到这一点,是因为我认为我们正处在一个有趣的时刻。我相信我们都经历过这样一个阶段:很多人期盼着某个新浪潮的到来,因为那会对他们有利。然而,那些潜在的浪潮并没有解决普通大众的实际问题。 我们现在都对这场AI 革命如此兴奋的原因在于,它让人感觉实实在在。它正在解决真实的问题。虽然它不能解决所有问题,还会带来新问题,但这没关系。但它感觉就像我们掌握了一种强大的、真实的、全新的能力。它的非同凡常之处在于其应用的广泛性。尽管它目前在事实准确性方面存在一些值得注意的缺点,当然也面临算力、成本和推理方面的挑战,但这些类型的问题感觉是完全可以解决的。 此外,它的应用领域极其广泛,这很不寻常。在我的职业生涯中,以往的技术突破几乎总是局限于特定领域。就好比某个特定流程会变快,或者某个特定东西会变便宜,或者某个任务现在可以实现了。而当前的这次变革给人的感觉更像是:“哇,一切都会变得更好。” 我接触的每一种交互界面,尝试解决的每一个应用领域,都将得益于这项新技术而变得更加简单。这真的相当少见。 Mark 和我一直相信这场 AI 革命终将到来,只是我们曾预料它需要更长时间。我们当时认为可能还需要十年。而我们原本以为会更早发生的是计算界面的革命。大约十年前,也就是 2015 年左右,我们就切实感觉到,手机这种形态,尽管已经非常了不起,但其发展已基本饱和,感觉它差不多就到此为止了。 一旦你开始思考超越手机的下一步就很清楚了,不过手机仍然是我们迄今为止用过的最伟大的计算设备,下一步交互方式必须更加自然,无论是信息如何进入我们身体还是我们如何向机器表达意图。那时你将不再需要触摸屏,也不再需要键盘。一旦你认识到这些是核心问题,答案就变得清晰:设备需要佩戴在脸上,因为需要通过眼睛和耳朵将信息从机器传递给用户。并且你需要神经接口这样的技术,让用户在没有键盘或鼠标,甚至没有触摸屏的情况下,也能操控机器、表达意图。 因此,面部佩戴设备和神经接口正是我们在过去十年里一直追求的一个极其清晰的愿景。但我们这一代工程师确实成长于一个系统固化的时代。应用程序模型是固定的,交互设计也是,我们经历了从鼠标到触摸屏的转变,但这仍属于直接操控界面,本质上是 20 世纪 60 年代就已开创的概念。我们其实并未从根本上改变这些交互模式。而改变这些模式是有代价的,因为我们整个社会已经习惯了通过这些特定的工具来与数字内容或数字工具进行交互。我们面临的挑战就是,必须制造出这样的硬件,它要能实现所有这些强大的功能,同时还要外观漂亮、轻便、并且价格合理。所有这些要求结合起来,是前所未有的。 我经常告诉我的团队,这还只是挑战的一半。另一半挑战是:造出来了,用户该怎么用?我如何让这种新设备感觉自然?我现在用手机已经非常熟练了,它就像是我身体和意图的延伸。我们如何让下一代设备用起来更简单、更直观? 我们当时正面临这些挑战。幸运的是,AI 在大约两年前出现了,并且比我们预期得更早地成熟起来。它为我们简化交互提供了一个巨大的机会,因为我们今天拥有的 AI 在理解用户意图方面能力要强得多。即使我给出一个模糊的指令,它也能利用其掌握的信息语料库进行处理,并产生具体的结果。当然,要让 AI 真正胜任这项任务,还有大量工作要做,它目前还不能算是一个成熟的控制界面,我还不能完全依赖它来可靠地操作我的设备。我们需要完成很多事情,但好在我们清楚目标是什么。 实际上我们现在处于一个更令人兴奋的阶段。之前我们觉得,硬件方面有一座大山要爬,交互设计方面也有一座大山要爬,但我们相信能做到。而现在我们有了一股强大的顺风,至少在交互设计这边,我们有可能拥有这种更智能的 AI Agent。它不仅能让你自然地与之对话并获得结果,还能结合上下文,了解你看到了什么、听到了什么、周围发生了什么,并基于这些信息进行智能推理。 03 展现了超越手机的可能性,AI融合是关键 主持人提问:请介绍Reality Labs的产品线(Quest头戴设备、智能眼镜以及像Orion这样的前沿原型设备),谈谈这些产品线的演进方向、您认为它们的市场定位是什么,以及未来它们是会趋于融合还是保持独立发展? Andrew Bosworth:当我们启动那个 Ray-Ban Meta 项目时,最初的定位是智能眼镜。事实上,产品已经完全开发完毕,距离量产只有六个月了,就在这时 Llama 3 问世了。团队成员立刻反应:“不行,我们必须把 AI 加进去。” 于是我们做了调整,所以现在它们是 AI 眼镜了。它们并非生来就是 AI 眼镜,但产品的形态正好合适,我们也能处理所需的算力,我们已经具备了这种能力。现在你可以向这款眼镜提问了。去年十二月,我们通过早期试用计划推出了我们称之为 Live AI 的功能。你可以用 Ray-Ban Meta 眼镜启动一个 Live AI 会话,在电池耗尽前(大约 30 分钟),它能实时看到你眼前的景象。从表面上看,Ray-Ban Meta 似乎只是 Ray-Ban Stories 的一次增量改进。但这正是我试图说明的关键点:虽然两者的硬件差异不大,但新产品为用户带来的交互体验却要丰富得多。 当你体验 Orion,或者说功能完整的 AR 眼镜时,你就能想象出一个后手机时代的情景。你会想:“哇,如果这东西的外形足够吸引人,足够轻便,电池续航也足够支撑全天佩戴,那我就真的可以不再依赖手机了,我需要的所有功能和信息就都在这眼镜里了。” 而当你开始把AR 眼镜的潜力,与我们所了解的 AI 的能力结合起来时,你之前体验过我们那个早餐演示吗?你走到摆放着一堆早餐食材的地方,看着它们,然后说:“嘿 Meta,看看这些食材,能做些什么食谱?” 对我而言,当我们思考 Orion 这个项目时,最初构思它的时候并没有包含 AI 组件。它当时的核心是关于直接操纵。所以它很大程度上是模仿了我们都非常熟悉的手机应用模型。我认为确实存在这样的应用场景。你当然会想要打电话、处理邮件、发短信,还想玩游戏。 现在让我们兴奋的是,将所有这些功能整合起来,再叠加一层交互式助手的能力,这个助手不仅能真正理解你设备上的动态和收到的邮件,还能理解你周围的物理世界正在发生什么。并且能够把你当下的需求和正在发生的事情联系起来。于是就产生了这样的想法:“哇,如果整个应用模型被彻底颠覆了会怎么样?” 如果不再是 “嘿,我现在想打开 Instagram”,而是 “嘿,设备注意到你在会议间隙有点空闲和无聊。要不要看看你最喜欢的篮球队的最新精彩集锦?” 诸如此类的事情都将成为可能。 话虽如此,硬件问题是真实且严峻的。成本问题也是真实且严峻的。手机如今是我们生活中不可思议的核心。我用它控制家里的设备,在车里使用它,用它工作,用它处理各种事务——它几乎无处不在,而且整个世界都已经围绕手机进行了调整。所以,你看,我的制冰机居然有个手机应用,这很奇怪,但确实如此。我也不知道为什么。所以我确实认为这将是一个漫长的过程,这就是为什么我说,对我而言,10 年的远景要清晰得多。我认为这些技术将变得可用、被广泛接受、并且越来越多地被采用。但 5 年的前景就比较难预测了,因为这些东西,即使它非常出色,要在五年内撼动手机的主导地位,这看起来太难了。简直难以想象。对我们来说是难以想象的,所以我才说,Orion 是我第一次觉得,也许 (有可能超越手机)。就像第一次戴上 Orion 时,我就想,好吧,这事或许能成。我们作为一个物种,确实存在超越手机的生活方式。 04 AI有望颠覆以应用为中心的交互模式,转向用户意图驱动 主持人提问:从手机主导到新设备形态的过渡期会是怎样的?硬件和市场接受度达到后,新设备会选择与手机绑定,还是坚持独立发展?此外,AI驱动的新应用模型将如何建立起相应的开发者生态系统?这种由AI引发的颠覆性变革,最有可能首先在哪些领域显现出来? Andrew Bosworth:我认为,手机拥有巨大的优势和劣势。巨大的优势在于,手机已经是我们生活的中心。它已经拥有庞大的开发者生态系统。所以它是一个核心设备,一个极好的核心设备。劣势在于,我确实认为,我们发现当应用程序不是通过触摸屏控制时,它们需要变得不同。这并不算什么新发现。很多公司在移动互联网早期都失败了,包括我们自己,仅仅是因为把网站内容直接搬到手机上,觉得 “哦,手机嘛,把网页放上去就行了。” 但因为它不是为手机原生设计的,我指的是从交互设计到实际视觉设计,再到布局和使用感受。因为我们没有做手机原生的东西,我们即使拥有网络史上最受欢迎的产品之一也失败了。这就像那个重大的设计上的失败,拟物化设计理念与原生设计理念的对决。 而且我认为拥有开发者是真正的价值所在,拥有所有这些应用功能也是真正的价值。可一旦你把它重新投射到空间中,用这样的手势而非触摸屏来操作时,你的精确度会大大降低。它无法响应语音命令,因为没有相应的工具,没有为此进行设计整合。所以,现在拥有一个手机平台感觉就像是我在硬件方面有了一个巨大的基础可以利用,但同时在软件方面,我也背负了一个沉重的负担。 所以,我们不排斥这类合作,一旦硬件发展得更成熟些,看看合作伙伴的反应会很有趣。而且,我希望他们能继续支持那些买这些手机的用户,让他们能够连接任何他们想用的硬件,并充分利用其全部功能。 关于应用模型和生态系统,我最大的疑问是,整个应用模型本身是否会改变。因为我们之前为这些设备设想的是一个非常类似手机的应用模型。当然,交互设计、输入和控制方案会非常不同,这需要开发者投入额外的精力。但我现在在想,未来几年 AI 的发展,会不会彻底颠覆应用模型?以至于不再是像现在这样,有点奇怪,我想要 “啊,我想听音乐”,然后在脑子里把它翻译成 “我必须打开 Spotify 或 Tidal”,首先想到的是 “我要用哪个提供商?” 但这根本不是我想要的。我想要的只是播放音乐。我只想能够直接对 AI 说:“酷,帮我放这首歌。” 然后 AI 应该知道:“哦,你已经在使用这项服务了,那我们就用它。” 或者,“这两项服务你都可以用,但这一家的音质更好。” 或者,“这一家的延迟更低”,诸如此类。或者它会说:“嘿,你想听的歌在这些服务上都没有。要不要注册另一项确实有这首歌的服务?” 我不想再负责去协调我该打开哪个应用来完成某件事。我们之所以一直这样做,是因为在整个数字计算历史上,事情就是这样运作的。你依赖的是一个基于应用程序的模型,那就是当时的系统。 所以我确实好奇 AI 会在多大程度上颠覆这一切。而且这不仅仅是关于可穿戴设备,不是关于任何特定形态。这就像,即使是在手机层面,如果你今天要从头开始打造一款手机,你会像过去那样构建一个应用商店吗?还是你会说:“嘿,作为消费者,请表达你的意图。说出你想完成什么,然后让我们系统看看能提供什么。” 让系统看看能为你生成什么。但我确实认为,如果你今天从零开始,你可能不会构建这样一个以应用为中心的世界,在这个世界里,我作为消费者想要解决一个问题,却必须先决定要用哪个提供商来解决。 这太有意思了。而且,我认为这取决于如今的技术能力,以及我们能预见到的编排能力。因为我认为在知识获取方面,现在或许已经具备了这种能力。但在编排方面,可能还有一段路要走。然后,当然,你还需要建立开发者生态系统,让他们在这个平台上进行开发。 这极其困难。这正是我认为最难的部分,最难的部分。我们在代理推理和相关能力方面越强,我就越能依赖我的 AI 在我缺席时处理事务。当然,一开始会是知识工作,这没问题。可一旦有大量消费者开始使用这个流程,你会发现他们会遇到很多死胡同。他们会问 AI:“嘿,能帮我做这件事吗?” AI 会回答:“抱歉,我做不到。” 这就是你带给开发者的金矿,你可以告诉他们:“嘿,每天有 10 万人尝试……” 尝试用你的应用来解决这个问题。他们正试图使用你的应用。他们自己可能没意识到,但他们确实想用你的应用。 这就是查询流,这就是用户输入的需求。我们现在只能告诉他们做不到。但如果你们构建这些接口,那么现在就有 10 万人迫切需要某项功能来使用你的服务。而且我们的 AI 完全可以回复说:“嘿,这项服务是需要付费的。有位开发者可以帮你做这个,但你需要付费。” 顺便说一句,我不只是在谈论应用程序。 它可能是一个水管工服务,就像这里存在某种形式的市场。我认为这会随着时间推移而出现。所以我预见的发展路径是这样的。我并不认为会是某人闭门造车,然后搞出一个应用平台。 将会发生的是,会出现一个人们使用AI 来做事形成的查询流,而 AI 会在某些特定领域反复失败,因为这些功能目前被某种应用壁垒阻隔,没有相应的接口或途径,或者说,还没有为这种特定的消费机制构建原生的功能。(AI 与现有应用之间)还没有现成的桥梁被建立起来。每个人都想去建这座桥,他们会说:“不,不,我们会让它能操纵像素,能操纵......” 这没问题,AI 确实能做到。我不是说 AI 不能跨越那些界限,但我认为随着时间的推移,如果 AI 成为人类与软件交互的主要界面,情况就会不同于现在这样从众多应用程序中挑选使用。 这非常合理,是一个非常吸引人的最终状态,单单作为一名消费者来看也是如此。这事非常复杂,而且我认为,它在 AI 内部为各种功能创造了这些非常激动人心的市场。它让很多公司的品牌变得模糊不清,这对整整一代的品牌来说将非常艰难。比如我根本不在乎音乐是用这两个服务中的哪一个播放的,这对于那些投入了大量资源、非常希望我在乎的音乐服务公司来说,是很难接受的。他们希望我对(用哪个服务)有更强烈的看法,希望我(对他们的品牌)产生某种依恋或用户粘性。但我不想产生这种依恋。 但是在那个“这是一个应用商店,这两个应用在争夺我的注意力”的世界里,他们建立起来的品牌是一笔极其宝贵的资产。而在我只关心歌曲能不能播放、音质好不好的世界里,重要的就是另一套优先级了。我认为这总体上是有益的,因为现在真正重要的是 AI 在被要求的任务上的表现。也就是实际的产品体验。以及价值、价格,还有性价比,这些都变得非常重要。我想很多公司不会喜欢这一点。将其抽象掉,实际上就是在说,把利润池给抽象掉了。 这也给我们施加了更大的压力,需要去信任 AI 本身或者 AI 的分发者。因此,只要我还在不同的、各自提供 AI 的公司之间进行选择,一个关键问题就是我能在多大程度上信任他们不会在背后被收买或者进行付费推广,以至于他们并非给我提供最佳体验或最佳运行性价比,而是给我那个能让他们赚最多钱的选择。当然,这就是如今搜索的体验。所以这是一个非常不同的世界。 你实际上今天就能看到一些苗头。某些公司愿意和新的 AI 提供商合作,进行由 AI Agent 来完成任务。然后他们又会想:“等等,我不希望只是让机器人来执行这些任务,我希望用户直接来找我。我觉得我需要这个。” 这就像是我必须直接与需求方建立品牌关系,这对公司的生存至关重要。所以,这可能会很混乱,但是前景是光明的,尤其是如果我们不必再支付那种所谓的“品牌税”。 我认为一旦消费者开始进入这种紧密的循环,他们越来越多的互动是由 AI 来居中处理,你就别无选择了。你的客户未来的聚集地就在那里。这将是一个不同的世界,而且很可能会有一些群体试图快速拥抱它,以此作为与现有品牌化产品竞争的手段,直接说:“我要靠性能和价格来竞争。” 关于最先发生颠覆的领域,它可能会反映出搜索查询量。实际上,我认为我们确实有一个先例可循,那就是在互联网时代,当 Google 成为主导的搜索引擎的时候。在那之前,互联网时代很大程度上是基于索引的,就像 Yahoo 那样,重点在于链接,谁能让主要的流量来源链接到你,谁就掌握了游戏的玩法。然后一旦 Google 占据了主导地位(这发生得非常快,大概就几年时间),那时唯一重要的就是 SEO (搜索引擎优化),唯一重要的就是你在查询流中的位置。查询流决定了哪些业务能够兴起并获得成功。因为那些最频繁的查询,就是那些最先被满足需求并由此发展起来的业务。 旅游就是那个几乎所有人都首先想到的例子。旅游行业的变化来得非常快,就像是巨大的颠覆,旅行社从一个普遍存在的事物变成了一个几乎不存在的事物,在相对较短的时间内就完成了。是立刻发生的。竞争完全是基于谁能以最高的转化率、真正无缝的方式执行并提供最划算的交易。我认为 SEO 现在已经发展到了一个有点让人扫兴的地步,它现在反而让事情变得更糟了。每个人都变得太擅长这个游戏了。这就像一场游戏,每个人都变得太精通了,尤其现在有了 AI 之后。所以我实际上觉得,我们有点经历过了这样一个令人难以置信的竞争扁平化曲线,现在它又开始在利用 AI 操纵 SEO 等方面有所抬头。尤其是还有付费排名,现在它太主流了。 这很可能就是 AI 领域未来发展的一个前车之鉴。我认为会有一个相当不错的黄金时代,在这个时代,查询流将决定哪些业务会率先发展起来,因为那些查询代表了大量对现有解决方案不满意的用户需求。否则他们就不会去用 AI问这些问题。而产品提供商和开发者会紧随其后,专门开发产品来解决这些问题。然后它会迅速切入一个真正有价值的领域,我们会取得很大进展。一旦在某个垂直领域发生转折,我们就能非常迅速地在为消费者提供更好解决方案方面取得巨大进步。而一旦达到稳定状态,就开始出现各种钻空子的行为了。这就是我们要对抗的东西。而那就是衰退时代的开始。那将是对 AI 的真正考验。 05 Meta之AI开源策略 主持人提问:Meta在AI开源方面一直走在前列,请阐述你们在这方面的努力(如Llama)及其背后的考量,以及您认为理想的AI模型市场结构是怎样的?此外,要实现您所描绘的未来愿景,当前面临哪些主要的障碍和风险(例如技术发明本身、用户的采纳意愿、开发者生态系统的建立、社会接受度和监管问题等)?在这些因素中,哪些进展可能是线性的、可预期的,哪些则更具挑战性或不确定性? Andrew Bosworth:这确实有两部分融合到了一起。第一部分是,Llama 来自 FAIR,我们的基础 AI 研究小组。从一开始,FAIR 就是一个开源的研究小组,自从 Yann LeCun 加入并建立这个小组以来。这使我们能够吸引到那些杰出的研究人员,他们真正相信,作为一个社会,我们跨越各个独立实验室的界限共同协作,会比各自为政取得更大的进步。公平地说,不仅仅是我们。很明显, Transformer论文是由 Google 发表的,而自监督学习可以说是我们的贡献。每个人都在为这个知识库添砖加瓦。但是当我们开源 Llama 的时候,那时所有的模型都是开源的。当时大家都是开源的,唯一不寻常的是其他所有模型随着时间推移都变成了闭源。完全正确。在那之前,每次有人构建一个有价值的模型,通常都会开源它,这样其他人就可以使用这个模型,看看它有多棒。当然,一些用于翻译之类的专用模型是保密的,但如果它是一个通用模型,那就是当时的做法。 Llama 2 对我们来说可能是个重大的决策点。我认为这就是第二件事发挥作用的地方:这是我一直持有并在内部极力推动的一个信念,Mark 也非常认同,那就是这些模型,首先,如果它们是开放的,我们将取得远超现在的进展。因为很多贡献并不会来自那些大型实验室,而是来自那些小型实验室。我们已经看到了 DeepSeek 的例子所以我们坚信,通过集体努力,我们将取得最大的进步。第二点,这里面蕴含着一个经典的信念,我相信这些AI大模型将成为大宗商品。而你总是希望将你的互补品商品化(即降低互补品的价格和门槛,来提升自己核心产品的竞争力)。 我们在战略上处于一个独特的位置:我们的产品因为 AI 而变得更好,这也是我们长期以来一直大力投资 AI 的原因。无论是在动态或 reels 中看到的推荐系统,还是一些简单的事情,比如当你输入想发新消息时,我应该把哪个朋友放在列表顶端——猜测你现在最想给谁发消息?诸如此类的小事,一直到非常宏大、应用广泛的事情,比如,一个完整的搜索界面,这是我们以前在 WhatsApp 里做不到的。而现在它成了一个非常受欢迎的功能入口。这一切对我们来说都是可能的。但并非其他任何人拥有了这项人工智能技术就能构建出我们的产品。这种不对称性是对我们有利的。 因此,将互补品商品化是明智的商业决策。同时,确保市面上有大量价格极具竞争力甚至近乎免费的模型,这既有助于整个行业、众多小型初创公司和学术实验室,也对我们自身有益。作为应用程序提供商,我们是巨大的受益者。我们在这方面高度一致,这关乎商业模式与行业的契合。这既源于我们对这类研究应如何进行的基本信念,同时也与我们的商业模式完美契合,因此不存在冲突。社会进步与商业模式一致,一切都结合起来,朝着同一方向发展,这非常好。 我们面临着真正的发明风险,也就是说,我们想要构建的东西,作为一个社会、一个物种,目前可能还没有能力去实现。但这并非板上钉钉。我们看到了一些希望的曙光,这表明它是可以做到的。这既是成本削减的任务,也是材料改进的任务,但它确实可以实现。不过,发明风险依然存在。我认为,远大于发明风险的是采用风险:这项技术是否被社会所接受?人们是否愿意学习一种新的交互模式?就像我们小时候都学会了打字,现在的人几乎一出生手里就拿着手机。那么,人们是否愿意学习新的交互模式?这值得吗?还有生态系统风险,甚至比采用风险更大:你造出了这个东西,但如果它只能处理电子邮件和 Reels,那可能还不够。人们是否会将与现代社会互动所必需的软件引入这个设备?这些都是极其巨大的风险。 我想说,我们在硬件和可接受性方面取得的进展令人鼓舞。我们相信能够做到这些,这在以前并非必然。通过 Ray-Ban Meta 眼镜,我们感觉可以克服。在可接受性方面,人们会接受我使用这项技术吗?这里面存在着非常有趣的监管挑战。我现在拥有一个永远在线、赋予我超人感知能力的设备。我的视力、听力、记忆力都更好了。这意味着如果几年后我再次见到您,而自这次访谈后没再见过,我可能会想:‘天哪,得想起这个人。我们一起做过播客。他叫什么名字?’ 我能问这个问题吗?我被允许问吗?您的权利是什么?这是您的脸,您给我看过的。如果我记性好,就能记住这张脸,这种情况确实存在。但我的记性不好,那么,我能用工具来辅助记忆吗?这里就牵涉到非常微妙的监管、隐私、社会可接受性问题,这些问题深植其中,各自都极其复杂,足以让整个项目脱轨。很容易让整个项目脱轨并延缓进展。 问题在于,我们行业内有时会陷入《梦幻之地》式的思维:‘你若建成,顾客自会前来。’但事实并非如此,很多事情都必须顺利到位才行。你也可能越界。这就是风险所在。伟大的技术可能因为一些愚蠢的原因而长时间停滞不前。核能就曾因此脱轨。因为一些错误的理由被耽搁了 70 年,我们现在知道那些理由是错的。你只会觉得,他们当初就是应对失策了。他们当时可能想:‘啊,别管这个。’ 但实际情况是:不,那些重要人物确实是这么想的。 所以我认为,我对发明风险相当乐观。可接受性风险看起来比以往要好,但仍存在许多重大不确定因素。实际上,我之前可能会说生态系统风险是最大的。但现在人工智能成为了我在这方面潜在的‘银弹’(silver bullet)。如果人工智能成为主要的交互界面,那么生态系统问题在某种程度上就迎刃而解了。此外,即使撇开 Orion 不谈,单单 Ray-Ban Metas 就收到了非常积极的反响,很多公司想和我们合作,并基于那个平台进行开发——尽管它目前还不是一个平台。它的计算能力非常有限。我们只是连接一个应用程序,实际上还没有提供任何开发空间。但我们确实与 Be My Eyes 建立了合作关系,这个应用帮助盲人和视力不佳者导航,效果非常出色。所以这里出现了一个小小的机会窗口,我们可以开始着手构建生态。目前的反响比我预期的要积极得多。可以说,现在一切顺利,顺风顺水。 关于这一点我想说两件事,这也是扎克伯格真正功不可没的地方,Mark 相信这就是下一件大事。它必须发生,而且不会自动发生,我们可以成为推动它实现的人。我们的首席科学家 Mike Yabrash经常谈论‘技术必然主义的神话’。技术并非注定会发生。科技界有很多人会说:‘AR最终会发生的。’ 但事情根本不是那样运作的。AR 就是一个典型的例子,它绝对不会自动发生。你必须停下来,投入资金和时间去做。必须有人站出来做这件事,这就是区别所在。所以我要说的第一点是,我们和其他任何人的区别在于:我们从内心深处相信这件事的价值。这可能是我一生中有机会从事的最重要的工作。
安德鲁·博斯沃思这样认为,AI 可能彻底改变以 App 为中心的交互模式,转向以用户意图为核心、由 AI 协调服务的模式。
访谈发布时间:2025年4月24日
视频地址:https://youtu.be/qEjTz2ZmxHI?si=miSZQjPmrdr6v8ml
作者:数字开物
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。