CANN权重量化批量矩阵乘算子

张

张建站

2026/5/11 13:03:32

10分钟阅读

WeightQuantBatchMatmulV2【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√功能说明算子功能完成一个输入为伪量化场景的矩阵乘计算并可以实现对于输出的量化计算。计算公式$$ y x ANTIQUANT(weight) bias $$公式中的$weight$为伪量化场景的输入其反量化公式$ANTIQUANT(weight)$为$$ ANTIQUANT(weight) (weight antiquantOffset) * antiquantScale $$当需要对输出进行量化处理时其量化公式为$$ \begin{aligned} y QUANT(x ANTIQUANT(weight) bias) \ (x ANTIQUANT(weight) bias) * quantScale quantOffset \ \end{aligned} $$当不需要对输出再进行量化操作时其计算公式为$$ y x ANTIQUANT(weight) bias $$参数说明参数名输入/输出/属性描述数据类型数据格式x输入矩阵乘运算中的左矩阵。FLOAT16, BF16NDweight输入矩阵乘运算中的右矩阵。INT8, INT4, INT32, FLOAT8_E4M3FN, HIFLOAT8, FLOAT4_E2M1ND, FRACTAL_NZantiquant_scale输入反量化参数中的缩放因子对应公式的antiquantScale。FLOAT16, BF16, UINT64, INT64, FLOAT8_E8M0NDantiquant_offset输入反量化参数的偏置因子对应公式的antiquantOffset。FLOAT16, BF16, INT32NDquant_scale输入量化参数的缩放因子对应公式的quantScale。FLOAT32, UINT64NDquant_offset输入量化参数的偏置因子对应公式的quantOffset。FLOAT32NDbias输入矩阵乘运算后累加的偏置对应公式中的bias。FLOAT16, FLOAT32, BF16NDy输出矩阵乘运算的计算结果。FLOAT16, BF16, INT8NDAtlas A2 训练系列产品/Atlas A2 推理系列产品weight只支持INT8、INT4、INT32。antiquant_scale只支持FLOAT16、BF16、UINT64、INT64。Atlas A3 训练系列产品/Atlas A3 推理系列产品weight只支持INT8、INT4、INT32。antiquant_scale只支持FLOAT16、BF16、UINT64、INT64。Ascend 950PR/Ascend 950DTquant_scale和quant_offset暂不支持。约束说明不支持空tensor。支持连续tensor非连续tensor只支持转置场景。调用说明调用方式样例代码说明aclnn接口test_aclnn_weight_quant_batch_matmul_v2通过aclnnWeightQuantBatchMatmulV2aclnnWeightQuantBatchMatmulV3aclnnWeightQuantBatchMatmulNz等方式调用WeightQuantBatchMatmulV2算子。【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/asc-devkit SetBufferLen API

SetBufferLen 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言，原生支持C和C标准规范，主要由类库和语言扩展层构成，提供多层级API，满足多维场景算子开发诉求。项目地址: https://gitcode.c…...

2026/5/11 12:59:31 阅读更多 →

别再怕定点数！手把手教你用TI DSP的IQmath库搞定电机控制（附Q格式避坑指南）

从浮点到定点：TI DSP实战中的IQmath库高效电机控制指南在电机控制领域，实时性和计算效率往往是成败的关键。当你在深夜调试电机驱动板，看着示波器上那些不稳定的电流波形时，是否曾因浮点运算的速度瓶颈而抓狂？TI C20…...

2026/5/11 12:57:03 阅读更多 →

CANN/ge离线编译指导

GE 离线编译指导【免费下载链接】ge GE（Graph Engine）是面向昇腾的图编译器和执行器，提供了计算图优化、多流并行、内存复用和模型下沉等技术手段，加速模型执行效率，减少模型内存占用。 GE 提供对 PyTorch、TensorFlo…...

2026/5/11 12:57:02 阅读更多 →

【阳师范学院主办，多高校承协办 | IET出版，往届连续4届EI稳定检索，平均刊后2个月EI检索，EI检索稳定 | 择优至EI期刊】第五届电力工程与电气技术学术会议（ICPEET 2026）

ICPEET 2026 已申请IET (CA) EAI (JA) 出版会议论文（CA）： 会议已申请IET Conference Proceedings (ISSN: 2732-4494) 出版，收录于IET数字图书馆，并提交EI Compendex、Scopus、IEEE Xplore等数据库进行检索。期刊论文…...

2026/5/10 0:00:32 阅读更多 →