CANN/ops-nn权重量化批量矩阵乘法算子

张

张建站

2026/5/11 18:21:45

10分钟阅读

WeightQuantBatchMatmul【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn产品支持情况产品是否支持Ascend 950PR/Ascend 950DT×Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√Atlas 200I/500 A2 推理产品×Atlas 推理系列产品×Atlas 训练系列产品×功能说明算子功能完成一个输入为伪量化场景的矩阵乘计算并可以实现对于输出的量化计算。计算公式$$ result self ANTIQUANT(mat2) bias $$公式中的$mat2$为伪量化场景的输入其反量化公式$ANTIQUANT(mat2)$为$$ ANTIQUANT(mat2) (mat2 antiquantOffset) * antiquantScale $$当需要对输出进行量化处理时其量化公式为$$ \begin{aligned} result QUANT(self ANTIQUANT(mat2) bias) \ (self ANTIQUANT(mat2) bias) * quantScale quantOffset \ \end{aligned} $$当不需要对输出再进行量化操作时其计算公式为$$ result self ANTIQUANT(mat2) bias $$参数说明参数名输入/输出/属性描述数据类型数据格式x1输入公式中的输入self。FLOAT16NDx2输入公式中的输入mat2。INT8NDbias输入公式中的输入bias。FLOAT32NDantiquantScale输入反量化参数中的缩放因子对应公式中的antiquantScale。FLOAT32-antiquantOffset输入反量化参数中的偏置因子对应公式中的antiquantOffset。FLOAT32-quantScale输入量化参数中的缩放因子对应公式中的quantScale。FLOAT32-quantOffset输入量化参数中的偏置因子对应公式中的quantOffset。FLOAT32-out输出公式中的result。FLOAT16,INT8ND约束说明不支持空tensor。支持连续tensor非连续tensor只支持转置场景。调用说明调用方式样例代码说明aclnn接口test_aclnn_weight_quant_batch_mat_mul通过aclnnWeightQuantBatchMatmul调用WeightQuantBatchMatmul算子。【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

从PTA到项目实战：用C++实现矩阵乘法的几种姿势与性能小谈

从PTA到项目实战：用C实现矩阵乘法的几种姿势与性能小谈矩阵乘法作为线性代数中的基础运算，在计算机科学领域有着广泛的应用场景。从学生时代的编程练习题到工业级的高性能计算，矩阵乘法的实现方式直接影响着程序效率。本文将带您从基础的PTA…...

2026/5/11 18:21:34 阅读更多 →

告别Keil和IAR？手把手教你用MounRiver Studio搭建RISC-V单片机开发环境（Windows 10/11实测）

从Keil/IAR到MounRiver Studio：RISC-V开发环境迁移实战指南如果你是一位长期使用Keil或IAR进行ARM开发的工程师，最近可能已经注意到RISC-V架构在嵌入式领域的崛起。这种开源指令集架构正在重塑单片机市场格局，而MounRiver Studio作为专为RI…...

2026/5/11 18:18:53 阅读更多 →

如何快速解锁加密音乐？Unlock Music终极指南

如何快速解锁加密音乐？Unlock Music终极指南【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://gitcod…...

2026/5/11 18:15:50 阅读更多 →

【阳师范学院主办，多高校承协办 | IET出版，往届连续4届EI稳定检索，平均刊后2个月EI检索，EI检索稳定 | 择优至EI期刊】第五届电力工程与电气技术学术会议（ICPEET 2026）

ICPEET 2026 已申请IET (CA) EAI (JA) 出版会议论文（CA）： 会议已申请IET Conference Proceedings (ISSN: 2732-4494) 出版，收录于IET数字图书馆，并提交EI Compendex、Scopus、IEEE Xplore等数据库进行检索。期刊论文…...

2026/5/10 0:00:32 阅读更多 →