CANN/pyasc复制函数文档
asc.language.basic.duplicate【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyascasc.language.basic.duplicate(dst: LocalTensor, scalar: int | float, count: int) → Noneasc.language.basic.duplicate(dst: LocalTensor, scalar: int | float, mask: int, repeat_times: int, dst_block_stride: int, dst_repeat_stride: int, is_set_mask: bool True) → Noneasc.language.basic.duplicate(dst: LocalTensor, scalar: int | float, mask: List[int], repeat_times: int, dst_block_stride: int, dst_repeat_stride: int, is_set_mask: bool True) → None将一个变量或立即数复制多次并填充到向量中。对应的Ascend C函数原型template typename T void Duplicate(const LocalTensorT dst, const T scalarValue, const int32_t count) template typename T, bool isSetMask true void Duplicate(const LocalTensorT dst, const T scalarValue, uint64_t mask[], const uint8_t repeatTime, const uint16_t dstBlockStride, const uint8_t dstRepeatStride) template typename T, bool isSetMask true void Duplicate(const LocalTensorT dst, const T scalarValue, uint64_t mask, const uint8_t repeatTime, const uint16_t dstBlockStride, const uint8_t dstRepeatStride)参数说明dst目的操作数。scalar被复制的源操作数支持输入变量和立即数数据类型需与dst中元素的数据类型保持一致。count参与计算的元素个数。maskmask用于控制每次迭代内参与计算的元素。repeat_time矢量计算单元每次读取连续的8个datablock每个block32Bytes共256Bytes数据进行计算为完成对输入数据的处理必须通过多次迭代repeat才能完成所有数据的读取与计算。repeat_time表示迭代的次数。dst_block_stride单次迭代内矢量目的操作数不同datablock间地址步长。dst_repeat_stride相邻迭代间矢量目的操作数相同datablock地址步长。约束说明操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。调用示例tensor高维切分计算样例-mask连续模式mask 128 scalar 18.0 asc.duplicate(dst_local, scalar, maskmask, repeat_times2, dst_block_stride1, dst_repeat_stride8)tensor高维切分计算样例-mask逐bit模式mask [uint64_max, uint64_max] scalar 18.0 asc.duplicate(dst_local, scalar, maskmask, repeat_times2, dst_block_stride1, dst_repeat_stride8)tensor前n个数据计算样例源操作数为标量scalar 18.0 asc.duplicate(dst_local, scalar, countsrc_data_size)【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考