CANN 9.0.0-beta.2【免费下载链接】release-managementCANN版本发布管理仓库项目地址: https://gitcode.com/cann/release-management版本下载地址https://www.hiascend.com/cann/download版本配套1、CANN与Ascend HDK版本配套关系|CANN版本 | 配套Ascend HDK版本| |--|--| | CANN 9.0.0-beta.2| Ascend HDK 25.5.1|2、 CANN组合包版本配套关系|ops版本 |配套toolkit版本 ||--|--| | ascend-cann-ops 9.0.0-beta.2| ascend-cann-toolkit 9.0.0-beta.2 |3、 CANN独立升级子包版本配套关系| CANN子包版本 | 版本源码标签 | 配套CANN版本 | | ------------------------------------------------------------ | ------------------------------------------------------------ | ----------------- | | cann-ops-math 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ops-nn 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ops-cv 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ops-transformer 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-hccl 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-hixl 9.0.0-beta.2 | CANN 9.0.0-beta.2 |4、CANN开源子包版本配套关系| CANN子包版本 | 版本源码标签 | 配套CANN版本 | | ---------------------------------- | ------------------------------------------------------------ | ----------------- | | cann-opbase 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-oam-tools 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-asc-tools 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-asc-devkit 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-pto-isa 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ge-compiler 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ge-executor 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-graph-autofusion 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-metadef 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-dflow-executor 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-hcomm 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-npu-runtime 9.0.0-beta.2 | v9.0.0-beta.2 | CANN 9.0.0-beta.2 |子包独立升级的具体操作请参考子包独立升级。新增特性算子库ops-nn库开源算子支持Ascend950PR芯片算子工程适配!450。LogSigmoid!1837。Norm类!995。SoftMax类!1010。AvgPoolV2Grad!1183。RmsNormQuant!1057。Ascend950PR芯片支持Parallel Welford和超长轴二分累加算法提高Norm类算子的数值稳定性与计算精度该特性主要涉及算子LayerNormV4。BatchNormV3。Ascend950PR芯片新增MM融合算子QuantBatchMatmulInplaceAdd!1130。TransposeQuantBatchMatmul!1136。DualLevelQuantBatchMatmul!1141。QuantBatchMatmul算子基于Ascend950PR芯片支持mxfp8 weightNz特性提升网络推理性能!1144。ops-transformer库transformer相关算子在Atlas A3系列产品上能力完善MC2 dispatch和combine算子支撑Aiv直驱Roce能力:moe_distribute_dispatch。Rope 支持算子泛化mrope_section。BlockSparseAttention算子能力增强。GroupedMatmulSwigluQuantV2算子能力增强支持A4W4动态分块优化。GroupedMatmul算子能力增强A4W4支持NZ转置动态分块优化。ops-cv库image类算子支持Ascend950PR覆盖ResizeNearestNeighborV2、ResizeNearestNeighborV2Grad、UpsampleNearest、UpsampleNearest3d等!284 #97 #93。CI对Ascend950PR的编译与 UT 识别能力增强 !281、!368、#105。算子的example支持在仿真simulator上执行可在不依赖真实硬件的场景下进行样例编译与执行验证便于Ascend950PR适配前置联调与回归!567 !397。ops-math库数学运算、张量变换及随机数生成支持Ascend950PR覆盖Erfc、Sinh、Asin、Atanh、BitwiseXor、Asinh、Cosh、Scale、Tan、Acos、Acosh等#599。aclnnMul/aclnnMuls/aclnnAdd/aclnnAdds/aclnnSum等API支持非连续输入使相关接口性能得到提升、内存占用有优化!874。Sort算子在Ascend950PR上相较于Atlas A3新增UINT16/UINT32/UINT64类型。Atlas A3支持的数据类型在Ascend950PR性能平均提升1.5倍#557 #632。离散类张量变换类算子性能优化覆盖Pad、Transpose、AsStrided#569 #539 #495。算子的example支持在仿真simulator上执行可在不依赖真实硬件的场景下进行样例编译与执行验证便于 Ascend950PR 适配前置联调与回归!563 !1215。opbase库基础框架库支持Ascend950PR#65。通信库集合通信 通信算子支持Ascend950PR覆盖Allgather、AllgatherV、Allreduce、AlltoAll、AlltoAllV、Broadcast、Reduce、ReduceScatter、ReduceScatterV、Scatter、SendRecv等#106。集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品 超节点内AICPU场景下 AlltoAll算子支持使用对称内存功能#575。集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品 AICPU场景下 ReduceScatterAllReduce算子支持Batch一致性#483。集合通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品 超节点内 ReduceScatterAllReduceAllGatherAlltoAll算子支持多机间的superkernel#596。集合通信 支持离线编译提升构建易用性#126。单边通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品 支持自动建链模式无需显式调用connect接口#106。单边通信 Atlas A3 训练系列产品/Atlas A3 推理系列产品 支持Fabric Memory全局统一编址模式支持使用HCCS进行D2rH的KV Cache直传能力提升传输效率#33。图引擎ES构图支持消费历史原型生成合法的重载cxx接口#643。支持算子级控核场景代码优化#450。图融合删除模型输出节点时框架支持识别更新模型输出#434。公共子表达式消除优化#622。支持通过dump开关使能L0和L1 exception dump#398。error msg优化整改#685。提供端到端Sample动态分档样例#813和#685自定义算子入图样例#867基于graph接口的MatmulAdd融合为GEMM自定义pass样例#1106。编译工程优化#646和#890。支持确定性和强一致性配置ge.deterministicLevel。支持TensorMove消除。在线场景支持用户使用graph级别的option指定模型输出datatypege.outputDatatype。去除执行路径上的单例和锁提升调度性能。算子编程Ascend 950PR支持SIMD编程模式提供200 API 接口跨代兼容能力可实现Atlas A2系列产品和Atlas A3系列产品算子平滑迁移。Ascend 950PR新增基于Reg的编程方式提供Reg数据搬运、基础算术、规约计算、同步控制等90 Reg编程接口。Atlas A2系列产品、Atlas A3系列产品、Ascend 950PR支持语言扩展层纯 C 接口支持数组式内存分配与指针型计算接口提供原生纯 C 编程体验。Ascend 950PR支持SIMD与SIMT混合编程提供约700个SIMT API接口包含warp、atomic、基本数学计算、类型转换等基础接口。Ascend 950PR支持通信高阶API的CCU通信接口提供基于CCU的AllreduceAllgatherReducescatterAlltoAll等主流通信原语Matmul高阶API新增支持MXFP4/8低比特数据类型的矩阵运算实现内存占用减半、算力吞吐倍增。Ascend 950PR新增及兼容支持样例共计约260个包含SIMT样例、SIMD样例框架类、基础API、高阶API、最佳实践等并按照编程模型和样例类别对样例目录结构进行调整提升样例目录结构的易读性。融合编译与调用方式支持CPU模式以及SIM仿真模式。运行时运行时Runtime支持Ascend950PR。易用性增强支持AclGraph场景stream规格扩充至64k解决大模型资源不足等问题#461。支持Aclgraph场景Event规格扩充扩充后的Event规格仅取决于Device内存#482。发布Runtime编程指南#1030。发布Runtime Ascend950配套资料#1255。开发与维测工具性能调优工具msprof支持aicore-metrics选项采集自定义PMU指标能力#136。HCCL性能测试工具支持FP64数据类型#122。AMCT模型压缩工具支持HIF8分位量化算法#54。删除和废弃特性mmpa头文件${install_path}/include/mmpa目录下头文件中的接口调整为内部接口该目录下接口将废弃内部接口调整到${install_path}/pkg_inc/mmpa目录, 废弃目录计划在2026/12/30之后的版本删除。已知问题无。已修复问题无。文档变更说明算子编程新增90 Reg编程接口API资料Reg矢量计算API是面向RegBase架构开发的API用户可通过该API直接对芯片中涉及Vector计算的寄存器进行操作实现更大的灵活性和更好的性能。新增SIMT快速入门、编程模型和算子实现介绍。新增SIMD与SIMT混合编程模型、算子实现、性能优化介绍。新增SIMT API。新增兼容性迁移指南220x架构版本迁移到351x架构版本。昇腾社区中Ascend C算子开发新增可视化专区通过视频呈现Cube和Vector算子的执行过程。图引擎《图引擎开发指南》手册大纲调整原《AutoFuse自动融合用户手册》合并至该手册中。《图引擎开发指南》新增“Session到GeSession的迁移指导”章节。通信库《HCCL集合通信用户指南》的“相关参考集群信息配置”章节下新增“rank table配置资源信息Atlas 350 加速卡”章节。《HCCL集合通信用户指南》的“通信算子开发”章节下新增“AIV算子开发”章节。漏洞修补列表版本开源及第三方软件漏洞修复情况详见漏洞修补列表。子包独立升级使用场景子包独立升级提供了灵活的按需升级功能。使用场景举例某用户已安装了a.b.c版本的组合包Ascend-cann-toolkit和Ascend-cann-ops由于业务需要要求将单边通信库能力更新至x.y.z版本此时可通过独立升级子包cann-hixl来实现。其中a.b.c和x.y.z请替换为实际版本号。操作步骤升级子包前请确保已安装配套版本的组合包Ascend-cann-toolkit和Ascend-cann-ops。如未安装请参考《CANN软件安装指南》进行安装。子包的升级路径应与组合包的安装路径保持一致。所有子包的升级操作相同以下以升级 cann-hixl_x.y.z_linux-aarch64.run 为例进行说明。升级场景一组合包Ascend-cann-toolkit和Ascend-cann-ops安装在默认路径下即安装时未使用“--install-path”参数chmod x cann-hixl_x.y.z_linux-aarch64.run ./cann-hixl_x.y.z_linux-aarch64.run --upgrade升级场景二组合包Ascend-cann-toolkit和Ascend-cann-ops安装在指定路径“/home/custom_path”即安装时指定“--install-path/home/custom_path”chmod x cann-hixl_x.y.z_linux-aarch64.run ./cann-hixl_x.y.z_linux-aarch64.run --upgrade --install-path/home/custom_path【免费下载链接】release-managementCANN版本发布管理仓库项目地址: https://gitcode.com/cann/release-management创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考