本文记录了我们使用自研微基准测试工具对 4× 海光 Z100 DCU 进行的一系列测试结果。 测试环境 项目 详情 GPU 4× 海光 Z100 DCU,每张 16GB,合计 64GB GPU 架构 gfx906 (Vega 20 / GCN 5.1) DTK 版本 DTK 26.04 (DCC2602-0317) PyTorch 2.10.0+das.opt1.dtk2604 测试工具 dcu_benchmark.py(基于 hy-smi 遥测采样) 采样间隔 1 秒 矩阵规模 4096 × 4096(Matmu…