中国 Z.ai 声称，它使用华为硬件训练出了一个新模型

场长

动态 1 1303 2026-01-15 02:23:37

导读：中国人工智能公司智谱AI声称，它完全独立使用华为硬件训练了一个新模型，并且是第一家完全基于中国硬件构建高端模型的公司。

智谱（即Z.ai，https://chat.z.ai/），是中国第一家上市的人工智能公司，它提供多种类型的通用语言模型（GLM）的模型。

本周三，该公司发布了GLM-Image，称其采用了“自主研发的‘自回归+扩散解码器’混合架构，能够联合生成图像和语言模型”。这标志着其图像生成AI Nano Banana Pro取得了重大进展。

Z.ai 使用华为 Ascend Atlas 800T A2服务器开发了该款模型。这款服务器可以运行四颗鲲鹏 920 处理器，每颗处理器可选 64 核或 48 核。华为的处理器采用自主设计研发的 Arm 内核。

另外，这些服务器集群采用了华为昇腾910人工智能处理器。

华为 Ascend 系列显卡的最新版本是 2025 年8月推出的 910C。华为声称该显卡“每张卡在 FP16 精度下可实现约 800 TFLOPS 的计算能力，这大约是 NVIDIA H100 芯片（2022 年发布）计算能力的 80%”。

在模型市场 Hugging Face 上，智谱将GLM-Image 的架构描述为由以下两个元素组成：

自回归生成器
一个基于 GLM-4-9B-0414 初始化的 9B 参数模型，并扩展了词汇表以包含视觉标记。该模型首先生成约 256 个标记的紧凑编码，然后扩展到 1K 至 4K 个标记，对应于 1K 至 2K 的高分辨率图像输出。
扩散解码器
一种基于单流 DiT 架构的 7B 参数解码器，用于潜在空间图像解码。它配备了字形编码器文本模块，显著提高了图像中文本的渲染精度。