【TBE算子开发】TIK 算子开发问题集锦
【摘要】 1、出现如下错误是因为start_debug的返回值有2个,而只接收了一个返回值导致出现错误。2、scalar 不能加减乘除浮点数,硬件不支持。最终表现为ccec 编译出错。3、debug_print打印字符串先用单引号,再用双引号包装起来。例如debug_print('"被打印的字符串"')4、算子的输入输出数据的大小和32字节不对齐的处理方式 1)在定义输入数据tensor时,按照...
1、出现如下错误是因为start_debug的返回值有2个,而只接收了一个返回值导致出现错误。
2、scalar 不能加减乘除浮点数,硬件不支持。最终表现为ccec 编译出错。
3、debug_print打印字符串先用单引号,再用双引号包装起来。例如debug_print('"被打印的字符串"')
4、算子的输入输出数据的大小和32字节不对齐的处理方式
1)在定义输入数据tensor时,按照实际大小定义。
2)定义目的数据tensor 大小时,需要按照32字节大小定义。否则可能被覆盖数据。
3)data_move时,由于搬迁的大小必须是32个字节大小。所以调试模块会报读越界错误。
5、vadds源操作数和目的操作数,地址有重叠,结果不对,硬件不报错。
6、指令操作数地址重叠说明:
1、如果指令的repeat time 等于1,则源操作数和目的操作数之间的地址可以重叠。
2、如果指令的repeat time 大于1,除了vadd,vsub,vmul,vmax,vmin,vor,vand,并且这些指令的数据类型为fp16,s32,fp32外,其他指令的源操作数和目的操作数之间的地址不能重叠。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)