CANN / cannbot-skills：自定义算子入图

张

张建站

2026/5/20 12:32:03

10分钟阅读

【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skillsname: torch-custom-ops-guide description: 自定义算子入图完整指南。覆盖从零开发、Eager 算子适配 npugraph_ex 图模式torch.library.custom_op / torch.library.Library、Meta 推导函数编写等全流程。适用于两种纯 Python 自定义算子注册场景。关键词custom_op、torch.library.Library、register_fake、meta、mutates_args。自定义算子入图算子状态确认若用户未说明算子状态使用交互式提问工具发起问题您的算子处于什么状态路由还没开发从零开始 → 按 npugraph_ex 代码生成场景生成包含算子注册骨架参考torch-npugraph-ex-templateskill 中的「自定义算子代码块」图模式编译调用的完整 MRE算子实现用# 用户实现占位。In-place 与 Out-of-place 的区别在custom_op路径上体现在mutates_args与register_fake返回值在torch.library.Library路径上体现在 schema 的 alias 标注和 Meta 返回值函数化转换由 TorchAir 自动完成无需手动实现已经能在 Eager 模式下运行需要适配图模式 → 进入已有 Eager 算子适配流程已经入图但遇到问题 → 转到问题定位加载torch-npugraph-ex-dfx-triageskill已有 Eager 算子适配图模式确认算子注册方式若用户未说明注册方式使用交互式提问工具发起问题您的算子是通过哪种方式注册的路由torch.library.custom_opPython 层在用户脚本中注册→register_fake写在用户脚本内与算子定义同文件。参考docs/zh/custom_op_graph/op_adapt_torchair.md以及non_in_place_op_cases.md/in_place_op_cases.md取决于算子类型纯 Pythontorch.library.LibraryPython 层在用户脚本中通过Library(..., FRAGMENT)define(...)impl(...)注册 schema 和 Eager 实现再通过Library(..., IMPL, Meta)注册 Meta→ schema、Eager 实现和 Meta 注册都写在用户脚本内Eager 实现通常使用impl(mylib, op_name, PrivateUse1)Meta 使用meta_lib Library(mylib, IMPL, Meta)impl(meta_lib, op_name)不确定 → 引导用户检查如果算子通过torch.library.custom_op装饰器定义则为torch.library.custom_op如果脚本中显式创建Library(namespace, FRAGMENT)并调用define(...)、impl(..., PrivateUse1)、Library(..., IMPL, Meta)则为纯 Pythontorch.library.Library编写 Meta 推导函数register_fake/ Meta implagent 行为规则请求用户提供算子签名和语义描述输入/输出 tensor 的 shape、dtype 映射关系。Meta 函数只关心操作的数学语义不关心具体计算实现若是torch.library.custom_op路径 → 在用户脚本内使用my_op.register_fake编写 Meta 推导函数若是纯 Pythontorch.library.Library路径 → 在用户脚本内使用meta_lib Library(namespace, IMPL, Meta)impl(meta_lib, op_name)编写 Meta 推导函数若用户能提供算子签名和语义 → 帮助编写完整 Meta 骨架遵循对应 template skill 中的「自定义算子代码块」格式若用户无法提供 → 给出骨架代码用# TODO: 根据算子语义推导输出 shape/dtype标注需用户填充的部分关键点Meta 推导函数只做 shape/dtype/device 推导不执行实际计算。写 Meta 函数只需理解操作的数学语义和 input→output 的映射关系。In-place 算子返回NoneOut-of-place 算子返回与输出同 shape/dtype 的空 tensor。后续步骤完成 Meta 推导函数后即可支持 npugraph_ex 入图无需额外步骤。下一步加载torch-npugraph-ex-knowledgeskill继续处理编译调用、调试定位或性能优化。纯 Pythontorch.library.Library写法对照用途为不使用torch.library.custom_op的用户提供一份对照表帮助他们在同一脚本内完成 schema、Eager 实现和 Meta 注册。阶段常见写法说明Schema 定义mylib Library(mylib, FRAGMENT)mylib.define(my_op(Tensor x) - Tensor)定义算子 schemaIn-place 算子需在 schema 中显式标注 alias如Tensor(a!)Eager 实现impl(mylib, my_op, PrivateUse1)为 NPU 后端注册实际执行逻辑Meta 注册meta_lib Library(mylib, IMPL, Meta)impl(meta_lib, my_op)注册 Meta 推导函数用于torch.compile入图agent 使用流程收到纯 Pythontorch.library.Library算子需求 → 先确认 schema 和算子语义 → 再按define(...)、impl(..., PrivateUse1)、impl(..., Meta)三步生成对应骨架。【免费下载链接】cannbot-skillsCANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

基于深度强化学习的斗地主AI助手：从算法原理到实战应用

基于深度强化学习的斗地主AI助手：从算法原理到实战应用【免费下载链接】DouZero_For_HappyDouDiZhu 基于DouZero定制AI实战欢乐斗地主项目地址: https://gitcode.com/gh_mirrors/do/DouZero_For_HappyDouDiZhu 在复杂卡牌游戏领域，决策智能体的…...

2026/5/20 12:31:08 阅读更多 →

ops-collections批量操作详解：提升NPU数据处理效率的7大技巧

ops-collections批量操作详解：提升NPU数据处理效率的7大技巧【免费下载链接】ops-collections ops-collections是基于昇腾硬件的高性能容器模板库，提供运行在NPU上的static_map、dynamic_map、set等容器。利用最新的SIMT并发能力，支持对容器…...

2026/5/20 12:30:09 阅读更多 →

如何快速下载B站4K高清视频：bilibili-downloader完全指南

如何快速下载B站4K高清视频：bilibili-downloader完全指南【免费下载链接】bilibili-downloader B站视频下载，支持下载大会员清晰度4K，持续更新中项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 你是否曾想在B站…...

2026/5/20 12:29:33 阅读更多 →

app扫描wifi的时候需要打开GPS定位----否则扫不到

这是很奇怪的一个事情，wifi和定位有什么关系？但是就是要打开。...

2026/5/18 6:22:28 阅读更多 →

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！ 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tab…...

2026/5/19 8:13:30 阅读更多 →

Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密）

更多请点击： https://intelliparadigm.com 第一章：Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密） 抽象表现主义并非仅关乎色彩与笔触的失控，而是神经感知系统在高维特征空间中对抗坍缩…...

2026/5/19 8:47:40 阅读更多 →

2026届毕业生推荐的AI科研方案实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 处在学术研究的起始阶段，开题报告的撰写常常令好多研究生以及青年学者觉得麻烦&…...

2026/5/18 10:49:06 阅读更多 →