华为云2020 AI实战营 第七章 NLP 打卡指南
一、课程打卡
课程内容为《7.3 课程打卡》,打卡的方法如下:
下载课程中提供的pdf文件。点击7.3课程打卡后,选择右边的“下载文档”
打开pdf文件,根据pdf的提示一一执行。关键内容是:打开 https://nbviewer.jupyter.org/ 网址:
在url位置贴入pdf中的 .ipynb结尾的URL:
https://github.com/huaweicloud/ModelArts-Lab/blob/master/notebook/DL_nlp_bert_ner/nlp_ner.ipynb
点击Go。系统会弹出以下操作指导页面:
这个文档非常细致。逐一执行即可。
一般情况下,按照步骤执行应该能得到预期的结果。但是本节课仍然有点例外,主要是因为如果选择免费实例:
会在按照顺序执行操作的第八步的时候,系统会报错:
所以,建议此时选用收费实例,我选择的是8核64G的实例:
则可以成功完成课程全过程,第八步也是一步就过。
其中,训练,验证,测试完成的截图如下:
交互测试的截图如下:
按照教材提供的文本测试好像都没啥问题。
自己输入了2-3条:
最后第3个能识别。前2个是不是因为找不到人,地点和组织,所以解析不出来。。
(课程打卡完毕)
二、作业1打卡
作业内容为 生成三国演义云图。
下载课程中提供的pdf文件。点击7.4作业打卡后,选择右边的“下载文档”
打开pdf文件,根据文件的要求在链接:https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/gen_wordcloud.py
下载 词云图生成脚本gen_wordcloud.py
在链接:https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/三国演义.txt 下载三国演义全文。
在链接 https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/三足鼎.jpg 下载三足鼎立的图片。。。(就是个鼎。。。)
依然创建Notebook(建议还是使用8核64G的。大了保险。。。今天监督学习直播课的专家也说了,资源越大越保险。。。。)
将三国演义.txt和三足鼎.jpg上传到notebook
然后进去Notebook,创建Tensorflow 1.13.1,将下载的python脚本一一贴入执行:
当然了,如果不出意外的话,你会在解析 三国演义.txt的文件时出错:
因为下载的 txt文件是GB2312编码,所以你需要将其转换为UTF-8编码,可以使用UltraEdit或者Vscode工具进行另存即可:
重新上传三国演义文件。(系统会提示是否覆盖,显然要覆盖。。。)
重新执行后续的Python脚本:
最终应得出一张可爱的图片:
拿这个图片去打卡即可。记得将notebook名字改为你的华为云账号。
(作业1打卡完毕)
三、作业2打卡
作业2是要部署模型并进行预测。
根据上面下载的pdf的要求,到链接 https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_ner/model.zip 下载模型zip文件。解压后生成model目录。
然后用你自己的OBS上传这个目录(如果没有需要去申请。。)
我这边是使用OBS Browser+创建目录:
注意目的前后不要有空格,因为根据菊花厂的料性,你加了前后空格它照样帮你建立带前后空格的目录,而这个是兵家大忌。。
然后你上传目录到OBS桶:
等文件传送完毕:
(不要羡慕哥的速度,这是个安静的夜晚。。。)
进入模型管理-模型-导入界面
选择OBS文件夹导入:
(是的,你看到了,上图那些乱七八糟的文件夹就是笔者测试的 前中后带空格的文件夹,只要你愿意,菊花厂都给你建,,我曾经提过建议,说windows前后空格的目录都建不起来,为啥你可以建起来?它理直气壮的没有回答这个问题。
创建这个导入的模型:
等待模型构建:
构建完毕
选择,部署成在线服务:
此时好像可以选择免费的服务。。。
等待部署结束进入运行状态:
选择预测:
左边输入:
{"sentence":"中国男篮与委内瑞拉队在北京五棵松体育馆展开小组赛最后一场比赛的争夺,赵继伟12分4助攻3抢断、易建联11分8篮板、周琦8分7篮板2盖帽。"}
点击预测,获得右边的返回结果:
{
"LOC": [
"北京",
"五棵松体育馆"
],
"PER": [
"赵继伟",
"易建联",
"周琦"
],
"ORG": [
"中国男篮",
"委内瑞拉队"
]
}
又随便搜索了一条新闻测试:
新闻为:
{"sentence":"在8月14日,广东卫健委通报一名深圳市罗湖区水贝盒马鲜生超市员工在老家汕尾陆丰市确诊为新冠肺炎后,广东已排查出5例无症状感染者,其中深圳2例,汕尾报告3例。随后,深圳、汕尾开始收紧防控措施。其中,深圳超市门店经营场所范围内暂停堂食服务,盒马鲜生在深圳的21家门店暂停营业,进行全面消杀。汕尾陆丰市开展免费核酸检测、暂停电影院营业、暂停零售药店销售“退烧药”等。"}
预测结果为:
{
"LOC": [
"深圳市",
"罗湖区",
"水贝盒马鲜生超市",
"汕尾",
"陆丰市",
"广东",
"深圳",
"汕尾",
"深圳",
"汕尾",
"深圳超",
"深圳"
],
"PER": [
"马鲜生"
],
"ORG": [
"广东卫健委"
]
}
可见,已成功完成预测。
你就可以将最后的预测结果图截图发到指定的打卡贴即可。记得截图的时候需要包含右上角的华为云账号。
至此,第七章的打卡就做完了。
想想还有最后一章就结束了。还有点期待。。。。毕竟GT手表这个东西,确实没用过,也不知道它是Great Teacher的GT,还是GoTop的GT。
(全文完,谢谢阅读)
- 点赞
- 收藏
- 关注作者
评论(0)