使用mindspore+modelarts体验BERT完成文本分类任务

举报
girafree 发表于 2020/09/16 18:36:32 2020/09/16
【摘要】 BERT的大名相信大家已经是耳熟能详了给大家分享一下用华为出品的Mindspore深度学习框架+modelarts云计算平台完成BERT的finetune和文本分类流程代码链接:https://github.com/LmYjQ/mindspore_bert 1.准备工作来自https://github.com/CLUEbenchmark/CLUE里面的今日头条新闻数据集 华为对象存储下载预训...

BERT的大名相信大家已经是耳熟能详了

给大家分享一下用华为出品的Mindspore深度学习框架+modelarts云计算平台完成BERT的finetune和文本分类流程

image.png

代码链接:https://github.com/LmYjQ/mindspore_bert



1.准备工作

来自https://github.com/CLUEbenchmark/CLUE里面的今日头条新闻数据集 

华为对象存储下载预训练模型:/chz/bert_base.ckpt,并上传到自己的对象存储

将代码和数据都上传到对象存储OBS

image.png

2.预处理:转TFRecord(本地)

第一步:json转tsv

python preprocess.py 'train'
python preprocess.py 'dev'

第二步:tsv转TFRecord

sh run.sh

生成的tfrecord上传到对象存储

这一步是将训练数据解析,并且转换成TFRecord格式,供后续模型训练和评估使用

3.finetune(modelarts)

将bert目录上传到对象存储,modelarts执行的代码目录选它,执行finetune.py

image.png

这一步是使用train数据集对bert_base模型做finetune

现在使用计算资源都是免费的哦~

4.评估(modelarts)

执行evaluation.py

这一步是使用dev数据集做evaluation

image.png

在日志里可以看到每一个batch的准确率



以上就是使用mindspore做bert的文本分类任务finetune+评估的完整流程了

大家还可以找一些其他的数据集,尝试一下NER或者问答任务

只要自己处理一下数据解析,改一下配置文件就可以~


感兴趣的同学欢迎关注我们的公众号、B站,搜索MindSpore即可,

也欢迎关注MindSpore的抖音账号:MindSpore梯度森林会,持续给大家分享技术干货哦~

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。