ECS-Ai1分设结构-试玩笔记
首先看一云学院里的
环境部署(Atlas200DK)和 环境部署(计算加速型ECS),因为我现在没有购买Atlas200DK所以,使用ECS分设方案,先看看怎么玩的;
部署过程中再参考下这个帖子:https://blog.csdn.net/Hello_yes112/article/details/107546041
本地开发环境:
安装教程安装Ubuntu18.04的虚拟机即可(我本地使用的Vmware安装的Ubuntu18.05的镜像也没问题)
Mindstudio下载 https://developer.huaweicloud.com/techfield/ascend.htmlzh/software/mindstudio/download ,注意ECS中的Ai1的固件已经是20.1了,所以选择当前最上面的支持20.1的
mindstudio下载即可,然后选择CANN下载 https://developer.huaweicloud.com/techfield/ascend.htmlzh/software/cann
把上面这两个toolkit也下载下来,
安装mindstudio的过程可以参考视频或者csdn那个帖子;注意toolkit安装上面的20.1的即可;
因为我们的ECS选择的是下下下x86_64所以按道理不按照视频中的那个交叉编译的gcc也是没问题的,不过安装一下也没什么,省的以后买了Atlas200DK之后还需要再安装;(apt-get install aarch64-linux-gnu-g++)
到了这一步,可以新建一个样例工程,把例子里的,编译,模型转换,数据预处理做了;
ECS远程运行环境:
- 登录华为云之后点击控制台,点击弹性云之后按照视频或者csdn那个帖子创建即可,我只说2020/1/23这个时间点上的一些变化和注意点:
- 共有镜像已经有了ai1的专有镜像了,这里面的驱动和固件已经装好了,很方便;
- 第二个注意点分设场景,mindstudio需要连接到ecs服务器上的ada(默认端口22118,截图里是因为的ada端口修改成了22119),所以需要修改一下安全组配置,新建一个;
此外,等ECS创建完成之后,
还需要su HwHiAiUser,bash切换下,
vim ~/ide_daemon/ide_daemon.cfg 修改 HOST_IP监听IP为 0.0.0.0,如果不想使用默认端口22118也可以改成一个自己想要的;
ps -ef | grep ada,找到ada进程id,kill -9 ada进程的id,
运行/usr/local/Ascend/driver/tools/ada & 重启ada经常,
可以netstat -antp |grep ada看看ada使用的ip和端口是否符合自己的预期;
- 注意修改一下ECS中root用户的/root/.bashrc,默认是指定的latest的toolkit,我们也改成20.1.rc1以保持和本地环境的toolkit一致;
- 后面我们就可以准备Mindstuido编译并连接远程ecs了,注意ecs是x86_64的,所以我们编译时选择x86_64即可,如果出现运行出现程序二进制格式不对的问题,清理下cmake缓存文件再重新构建;
- Mindstudio运行样例项目,libascendcl.so找不到,下面这段是直接复制的csdn上的,目前的Ai1镜像下其实没有mind_so.conf文件,我就新建了一个,其实我还做了另外一个操作,就是把/root/.bashrc中后面加的那段也复制了一份给了/home/HwHiAiUser/.bashrc中,后来重启之后就好了,不清楚具体那个设定起了关键作用;(这个问题还真挺怪的,手动连接远程主机,无论哪个用户运行run.sh一点问题没有,也使用HwHiAiUser重启过ada还是再现,后来上面的操作后就好了,不管了..)
切换到root用户下搜索 libascendcl.so 所在的路径:
su root
find / -name libascendcl.so
cd /etc/ld.so.conf.d
vim mind_so.conf
添加路径到此文件中
添加完成后,执行 ldconfig
参考:
https://bbs.huaweicloud.com/forum/thread-78893-1-1.html
关于ada连接的安全问题,参考一下这个文档:
https://support.huaweicloud.com/intl/zh-cn/tg-training-cann/atlasadxtrain_16_0010.html
- 点赞
- 收藏
- 关注作者
评论(0)