通信引擎【免费下载链接】hcommHCOMMHuawei Communication是HCCL的通信基础库提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcommHCCL可以使用不同通信引擎实现通信算子不同的通信引擎适用不同的场景对比结果如下表 1不同通信引擎的适用场景通信引擎优势约束适用场景支持的产品型号AI CPUTS不占用计算核通信效率高适用于大数据高带宽场景。通信静态开销较大对小数据量通信场景不友好。高带宽通信场景Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atlas A3 推理系列产品Host CPUTS不占用计算核。下发开销大随任务数线性增加。NAAtlas A2 训练系列产品/Atlas A2 推理系列产品AIV低时延。通信占用Vector计算核需要多个Vector计算核才能打满通信带宽通信算子与计算算子竞争计算核资源可能互相影响。低时延通信场景Ascend 950PR/Ascend 950DT下面分别介绍不同通信引擎的任务执行流程。AI CPUTS由AI CPU向任务调度系统Task Scheduler简写为TS提交通信操作相关任务如下图所示。Host提交一个AI CPU Kernel至任务队列。AI CPU Kernel被任务调度器调度后交给AI CPU执行AI CPU提交通信任务至任务队列。AI CPU提交的通信任务被调度器调度至执行器执行。Host CPUTS由Host CPU向Device侧的任务调度系统Task SchedulerTS提交通信操作相关任务如下图所示。Host将通信过程中的各类操作包括内存拷贝、同步操作等提交至任务队列。调度器将下发至任务队列中的任务调度至对应的执行器上执行。AIV通信算子的执行逻辑与操作步骤由Vector Core执行如下图所示。Host提交一个AIV Kernel至任务队列。AIV Kernel被调度器调度后发送至Vector Core执行。Vector Core可以利用不同协议完成数据搬运。【免费下载链接】hcommHCOMMHuawei Communication是HCCL的通信基础库提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考