导读:中国人工智能公司智谱AI声称,它完全独立使用华为硬件训练了一个新模型,并且是第一家完全基于中国硬件构建高端模型的公司。
智谱(即Z.ai,https://chat.z.ai/),是中国第一家上市的人工智能公司,它提供多种类型的通用语言模型(GLM)的模型。
本周三,该公司发布了GLM-Image,称其采用了“自主研发的‘自回归+扩散解码器’混合架构,能够联合生成图像和语言模型”。这标志着其图像生成AI Nano Banana Pro取得了重大进展。
Z.ai 使用华为 Ascend Atlas 800T A2服务器开发了该款模型。这款服务器可以运行四颗鲲鹏 920 处理器,每颗处理器可选 64 核或 48 核。华为的处理器采用自主设计研发的 Arm 内核。
另外,这些服务器集群采用了华为昇腾910人工智能处理器。
华为 Ascend 系列显卡的最新版本是 2025 年8月推出的 910C。华为声称该显卡“每张卡在 FP16 精度下可实现约 800 TFLOPS 的计算能力,这大约是 NVIDIA H100 芯片(2022 年发布)计算能力的 80%”。
在模型市场 Hugging Face 上,智谱将GLM-Image 的架构描述为由以下两个元素组成:
该公司还表示说,“从数据预处理到大规模训练的整个过程”都是使用 Atlas 服务器完成的,因此该模型的首次亮相证明了“在中国国产全栈计算平台上训练尖端模型的可行性”。
但智谱并未透露其用于创建 GLM 镜像的服务器或加速器数量,以及生成的运行速度如何。
但可以确定的是,该公司可以声称其利用本土技术开发了一种模型。
但是也不能忽略 Arm 对鲲鹏的贡献,另外华为的硬件是否以速度或价格实现了这一目标,以充分证明中国已经抢占了先机,尚待观察。
专家预测未来许多测试平台都将是面向小众领域的小型设备,一款完全由中国自主研发的测试平台的消息是值得人们注目的。
作者:洛逸
本篇文章为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。
请扫描二维码,使用微信支付哦。