话说,微软从 Nvidia 和 AMD 购买了大量 GPU。但展望和思考未来,微软领导层正在希望将大部分 AI 工作负载从 GPU 转移到自主研发的加速器上。
然而这家软件巨头在定制芯片领域起步较晚。亚马逊和谷歌多年来一直在打造定制 CPU 和 AI 加速器,而微软直到 2023 年底才发布自己的 Maia AI 加速器。
推动这一转变的关键在于对性价比的关注,对于一家超大规模云服务提供商来说,这可以说是唯一真正重要的指标。
微软首席技术官凯文·斯科特 (Kevin Scott) 在周三由 CNBC 主持的炉边谈话中表示,到目前为止,英伟达的性价比最高,但为了满足需求,他愿意考虑任何可用方案。
展望未来,斯科特表示微软希望在其大部分数据中心工作负载中使用自主研发的芯片。
当被问及“长期计划是否主要在数据中心使用微软芯片?”斯科特回答说:“是的,绝对是。”
后来,他告诉大家:“这关乎整个系统设计。它涉及网络和冷却系统,你希望能够自由地做出必要的决策,以便真正优化你的计算能力以满足工作负载。”
凭借其首款内部 AI 加速器 Maia 100,微软在 2023 年将 OpenAI 的 GPT-3.5 转移到自己的芯片上,从而释放了 GPU 容量。然而,由于该芯片的 BF16 性能仅为 800 teraFLOPS、HBM2e 为 64GB,内存带宽为 1.8TB/s,因此远远落后于 Nvidia 和 AMD 的竞争 GPU。
据多方报道,微软将于明年将第二代 Maia 加速器并推向市场,CTO曾提到,它将提供更具竞争力的计算、内存和互连性能。
不过,尽管我们可能会看到微软数据中心的 GPU 与 AI ASIC 的组合发生变化,但它们似乎不太可能完全取代 Nvidia 和 AMD 的芯片。
过去几年,谷歌和亚马逊已经部署了数以万计的 TPU 和 Trainium 加速器。虽然这些芯片帮助他们赢得了一些知名客户,例如 Anthropic ,但这些芯片更多地用于加速公司自身的内部工作负载。
因此,我们继续看到这些云平台上大规模部署 Nvidia 和 AMD GPU,部分原因是客户仍然需要它们。
值得注意的是,AI加速器并非微软唯一研发的定制芯片。这家位于雷德蒙德的软件巨头还拥有自己的CPU,名唤Cobalt,以及一系列平台安全芯片,旨在加速加密并保护其庞大数据中心域之间的密钥交换。
作者:洛逸
本篇文章为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。
请扫描二维码,使用微信支付哦。