- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

告别夏日空调，用华为云ModelArts训练AI鬼故事生成器，0成本打造降温神器

举报

苏苏思量发表于 2020/08/19 11:01:15 2020/08/19

【摘要】 Hello大家好，我是B站UP主苏苏思量，最近又要开学了。不禁让我想起之前读书时候，宿舍没空调，晚上睡不着的经历。所以，用代码为大家排忧解难的我又来了！天热嘛，出身冷汗就好了。这次给大家准备了一个AI鬼故事生成器，保证用完让你瑟瑟发抖。这个生成器的本质就是喂给AI模型一些鬼故事后，让它进行自由文本生成。文末有福利哦，千万不要错过！说起生成中文，这次我用的是OPENAI发布的GPT 2模型...

Hello大家好，我是B站UP主苏苏思量，最近又要开学了。

不禁让我想起之前读书时候，宿舍没空调，晚上睡不着的经历。

所以，用代码为大家排忧解难的我又来了！

天热嘛，出身冷汗就好了。

这次给大家准备了一个AI鬼故事生成器，保证用完让你瑟瑟发抖。

这个生成器的本质就是喂给AI模型一些鬼故事后，让它进行自由文本生成。

文末有福利哦，千万不要错过！

说起生成中文，这次我用的是OPENAI发布的GPT 2模型结合pytorch来进行训练。

首先设置输入参数，包括词库地址，是否预处理，学习率，最短字数等等等等。

然后声明一个全新的GPT2模型。

为了在稍后的迭代中看到实时进度条，还得加一个tqdm模块。

但是！

我的个人电脑配置是英特尔i7加英伟达GEFORCE GTX的GPU。

之前用几百K的数据训练一个SVM都得将近一小时。这次训练这么高级的模型，不得跑一周吗

为了提高训练效率，还是得上云，来吧华为云ModelArts在线写码在线调试。

首先把刚刚的文件都上传存储在OBS。

然后回到ModelArts，左侧“开发环境”-“notebook”，这里既可以选择免费体验版，也可以选择付费加速版（结尾有福利，可以领取免费试用付费版哦）

在本地读取指定路径下的文件要写成这样：

model_config = transformers.modeling_gpt2.GPT2Config.from_json_file("文件在本地的地址")

在modelArts的notebook里要使用华为云的moxing包

import moxing as mox

mox.file.make_dirs('/cache')

mox.file.copy_parallel('obs://{obs桶名称}/{桶内文件地址}', '{执行机中地址}')

model_config = transformers.modeling_gpt2.GPT2Config.from_json_file(''{执行机中地址}'')

在本地读去用户传进来的参数的时候，是这样的：

args = parser.parse_args()

但是在modelArts的notebook里调试的时候，要改成这样。

args, unparsed = parser.parse_known_args()

Notebook支持分块执行，调试起来也更加轻松。

接着把数据按照刚刚设置的epoch和batch size分割。

然后传递给pytorch去构建张量。

接着设置前向传播，损失函数，反向传播，优化步骤。

全部设置好，之后，就可以开始训练啦！

果然烧别人家的GPU就是不心疼，本来可能要一周的项目，很快就训练好了。

现在来试一下给你们的开学礼物的效果吧。

附件给大家提供了所有文件和一个简化版的训练文本（只有几百K，训练起来很快，方便大家快速拿到结果，早点来抢礼物哟）

只需要把nlpdata文件夹里的数据传到OBS，然后把notebook1.py中的代码复制到ModelArts的notebook中的第一个模块，然后点击run；

接着把notebook2.py中的代码复制到下一个模块，然后把里面我的OBS文件地址，改成你的OBS内文件地址，点击run，就开始训练啦！

训练结束后，把notebook3.py中的代码复制到下一个模块，把里面我的文件的OBS文件地址，改成你的OBS内文件地址，点击run，就能生成属于你的鬼故事啦！

-------------------------------------------------

为了感谢大家对我的支持，特意为大家带来了2个福利，并且还有机会获得精美奖品哦（业界良心，全国包邮），欢迎大家参与：

https://bbs.huaweicloud.com/forum/thread-72177-1-1.html

鬼故事生成器数据（快速版）.zip

639.66KB 下载次数：37次

附件下载

鬼故事生成器数据（快速版）.zip 639.66KB 下载次数：37次

【版权声明】本文为华为云社区用户原创内容，未经允许不得转载，如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

评论（0）

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长