- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

华为云2020 AI实战营第七章 NLP 打卡指南

张辉发表于 2020/08/16 01:46:50 2020/08/16

【摘要】走向拥有GT手表之路。

一、课程打卡

课程内容为《7.3 课程打卡》，打卡的方法如下：

下载课程中提供的pdf文件。点击7.3课程打卡后，选择右边的“下载文档”

打开pdf文件，根据pdf的提示一一执行。关键内容是：打开 https://nbviewer.jupyter.org/ 网址：

在url位置贴入pdf中的 .ipynb结尾的URL：

https://github.com/huaweicloud/ModelArts-Lab/blob/master/notebook/DL_nlp_bert_ner/nlp_ner.ipynb

点击Go。系统会弹出以下操作指导页面：

这个文档非常细致。逐一执行即可。

一般情况下，按照步骤执行应该能得到预期的结果。但是本节课仍然有点例外，主要是因为如果选择免费实例：

会在按照顺序执行操作的第八步的时候，系统会报错：

所以，建议此时选用收费实例，我选择的是8核64G的实例：

则可以成功完成课程全过程，第八步也是一步就过。

其中，训练，验证，测试完成的截图如下：

交互测试的截图如下：

按照教材提供的文本测试好像都没啥问题。

自己输入了2-3条：

最后第3个能识别。前2个是不是因为找不到人，地点和组织，所以解析不出来。。

（课程打卡完毕）

二、作业1打卡

作业内容为生成三国演义云图。

下载课程中提供的pdf文件。点击7.4作业打卡后，选择右边的“下载文档”

打开pdf文件，根据文件的要求在链接：https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/gen_wordcloud.py

下载词云图生成脚本gen_wordcloud.py

在链接：https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/三国演义.txt 下载三国演义全文。

在链接 https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_introduction/三足鼎.jpg 下载三足鼎立的图片。。。（就是个鼎。。。）

依然创建Notebook（建议还是使用8核64G的。大了保险。。。今天监督学习直播课的专家也说了，资源越大越保险。。。。）

将三国演义.txt和三足鼎.jpg上传到notebook

然后进去Notebook，创建Tensorflow 1.13.1，将下载的python脚本一一贴入执行：

当然了，如果不出意外的话，你会在解析三国演义.txt的文件时出错：

因为下载的 txt文件是GB2312编码，所以你需要将其转换为UTF-8编码，可以使用UltraEdit或者Vscode工具进行另存即可：

重新上传三国演义文件。（系统会提示是否覆盖，显然要覆盖。。。）

重新执行后续的Python脚本：

最终应得出一张可爱的图片：

拿这个图片去打卡即可。记得将notebook名字改为你的华为云账号。

（作业1打卡完毕）

三、作业2打卡

作业2是要部署模型并进行预测。

根据上面下载的pdf的要求，到链接 https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_nlp_ner/model.zip 下载模型zip文件。解压后生成model目录。

然后用你自己的OBS上传这个目录（如果没有需要去申请。。）

我这边是使用OBS Browser+创建目录：

注意目的前后不要有空格，因为根据菊花厂的料性，你加了前后空格它照样帮你建立带前后空格的目录，而这个是兵家大忌。。

然后你上传目录到OBS桶：

等文件传送完毕：

（不要羡慕哥的速度，这是个安静的夜晚。。。）

进入模型管理-模型-导入界面

选择OBS文件夹导入：

（是的，你看到了，上图那些乱七八糟的文件夹就是笔者测试的前中后带空格的文件夹，只要你愿意，菊花厂都给你建，，我曾经提过建议，说windows前后空格的目录都建不起来，为啥你可以建起来？它理直气壮的没有回答这个问题。

创建这个导入的模型：

等待模型构建：

构建完毕

选择，部署成在线服务：

此时好像可以选择免费的服务。。。

等待部署结束进入运行状态:

选择预测：

左边输入：

{"sentence":"中国男篮与委内瑞拉队在北京五棵松体育馆展开小组赛最后一场比赛的争夺，赵继伟12分4助攻3抢断、易建联11分8篮板、周琦8分7篮板2盖帽。"}

点击预测，获得右边的返回结果：

{

"LOC": [

"北京",

"五棵松体育馆"

"PER": [

"赵继伟",

"易建联",

"周琦"

"ORG": [

"中国男篮",

"委内瑞拉队"

]

}

又随便搜索了一条新闻测试：

新闻为：

{"sentence":"在8月14日，广东卫健委通报一名深圳市罗湖区水贝盒马鲜生超市员工在老家汕尾陆丰市确诊为新冠肺炎后，广东已排查出5例无症状感染者，其中深圳2例，汕尾报告3例。随后，深圳、汕尾开始收紧防控措施。其中，深圳超市门店经营场所范围内暂停堂食服务，盒马鲜生在深圳的21家门店暂停营业，进行全面消杀。汕尾陆丰市开展免费核酸检测、暂停电影院营业、暂停零售药店销售“退烧药”等。"}

预测结果为：

{

"LOC": [

"深圳市",

"罗湖区",

"水贝盒马鲜生超市",

"汕尾",

"陆丰市",

"广东",

"深圳",

"汕尾",

"深圳",

"汕尾",

"深圳超",

"深圳"

"PER": [

"马鲜生"

"ORG": [

"广东卫健委"

]

}

可见，已成功完成预测。

你就可以将最后的预测结果图截图发到指定的打卡贴即可。记得截图的时候需要包含右上角的华为云账号。

至此，第七章的打卡就做完了。

想想还有最后一章就结束了。还有点期待。。。。毕竟GT手表这个东西，确实没用过，也不知道它是Great Teacher的GT，还是GoTop的GT。

（全文完，谢谢阅读）

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

华为云2020 AI实战营 第七章 NLP 打卡指南

一、课程打卡

二、作业1打卡

三、作业2打卡

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品

华为云2020 AI实战营第七章 NLP 打卡指南