CANN/ops-transformer注意力融合算子

张

张建站

2026/5/10 3:29:33

10分钟阅读

CANN/ops-transformer注意力融合算子

AttentionWorkerCombine【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer产品支持情况产品是否支持Ascend 950PR/Ascend 950DT×Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√Atlas 200I/500 A2 推理产品×Atlas 推理系列产品×Atlas 训练系列产品×功能说明算子功能将多个计算单元处理的注意力token数据进行融合结合专家权重对结果进行加权输出最终的注意力融合结果并更新层ID。参数说明参数名输入/输出/属性描述数据类型数据格式schedule_context输入包含调度上下文信息。INT8NDexpert_scales输入表示专家权重。FLOATNDlayer_id输入当前的模型层ID。INT32NDy输出最终的注意力合并结果。FLOAT16BFLOAT16NDnext_layer_id输出下一个要处理的层ID。INT32NDhidden_size属性token_data的隐藏维度大小用于确定输出y的第二维大小。必要属性。Int-token_dtype属性指定schedule_context中token数据的原始精度类型0表示FLOAT161表示BFLOAT16。Int-need_schedule属性指定是否等待token数据填充完成后再执行0表示不等待1表示等待。Int-约束说明schedule_context为1D的Tensor。expert_scales为2D的Tensor[BatchSize, K]。y为2D的Tensor[BatchSize, HiddenSize]即第二维由属性hidden_size确定。layer_id和next_layer_id为1D的Tensor。调用说明调用方式样例代码说明图模式调用test_geir_attention_worker_combine.cpp通过算子IR构图方式调用AttentionWorkerCombine算子。【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

Cursor AI 上下文优化：智能压缩代码提升 AI 编程助手效率

Cursor AI 上下文优化：智能压缩代码提升 AI 编程助手效率

1. 项目概述：Cursor AI 的“上下文节流阀”如果你和我一样，深度依赖 Cursor 这类 AI 编程助手，那你一定遇到过这个令人头疼的场景：当你试图向 AI 提问一个关于大型代码文件的问题时，那个红色的“上下文超限”警告弹窗&…...

2026/5/10 3:27:20 阅读更多 →

AI智能体3D可视化监控：用Phaser构建等距办公室视图

AI智能体3D可视化监控：用Phaser构建等距办公室视图

1. 项目概述：为AI智能体打造一个“看得见”的办公室如果你正在开发或管理一个由多个AI智能体组成的复杂系统，你可能会遇到一个共同的痛点：这些智能体到底在干什么？它们的状态如何？任务进展到哪一步了？传统的…...

2026/5/10 3:23:36 阅读更多 →

Dark Modern Neue：打造极致专注的VS Code深色主题与开发环境配置

Dark Modern Neue：打造极致专注的VS Code深色主题与开发环境配置

1. 从“无法忍受”到“新生”：Dark Modern Neue 的诞生与设计哲学作为一名每天在代码编辑器里泡上十几个小时的开发者，我对编辑器主题的挑剔程度，可能不亚于一位米其林主厨对食材的苛求。屏幕就是我的画布，代码就是我的颜料&#…...

2026/5/10 3:23:09 阅读更多 →

系统中文件管理—计算机等级—软件设计师考前备忘录—东方仙盟

系统中文件管理—计算机等级—软件设计师考前备忘录—东方仙盟

在使用已经存在的文件之前，要通过 “打开 (open)” 文件操作建立起文件和用户之间的联系，目的是把文件的控制管理信息从辅存读到内存。打开文件应完成如下功能：在内存的管理表中申请一个空表目，用来存放该文件的文件目录信息。根据…...

2026/5/10 0:03:48 阅读更多 →

因果推断赋能可解释AI：从相关性解释到可行动干预

因果推断赋能可解释AI：从相关性解释到可行动干预

1. 项目概述：当可解释性遇见因果推断在人工智能，尤其是深度学习模型日益复杂的今天，我们常常面临一个困境：模型预测得越准，我们越难理解它“为什么”做出这样的决策。这就是可解释人工智能（XAI）…...

2026/5/10 0:05:59 阅读更多 →

AI智能体OSINT技能包：自动化开源情报收集与人物侧写实战指南

AI智能体OSINT技能包：自动化开源情报收集与人物侧写实战指南

1. 项目概述：一个为AI智能体赋能的OSINT技能包如果你正在寻找一个能让你的AI助手（比如Claude Code、OpenClaw这类代码智能体）瞬间化身“网络侦探”的工具，那么 smixs/osint-skill 这个项目绝对值得你深入研究。简单来说&#…...

2026/5/10 0:08:00 阅读更多 →

Farcaster智能体框架实战：从事件驱动到社区助手构建

Farcaster智能体框架实战：从事件驱动到社区助手构建

1. 项目概述：一个面向Farcaster生态的智能体框架最近在Web3社交领域，Farcaster生态的活跃度肉眼可见地增长。无论是原生应用Warpcast的火爆，还是各种第三方客户端和机器人的涌现，都预示着这里正在成为一个新的开发者乐园。在这个背…...

2026/5/10 0:09:35 阅读更多 →