学习强化学习,第一步看这里就对了

举报
ground-zero 发表于 2021/07/01 06:57:40 2021/07/01
【摘要】 强化学习热火朝天,ModelArts助您流畅体验强化学习各种经典算法

AI技术持续火热,吸引着无数新人加入AI学习大潮,而强化学习作为通用AI的希望,无疑是工业界和学术界的研究热点。

入门强化学习,资料还是比较丰富的(比如Richard S. Sutton 教授的经典教材《增强学习导论》第二版便是一个很好的选择,喜欢通过视频学习的同学也可以看看AlphaGo项目的主要负责人David Silver的强化学习视频课程)。从大神们的著作中,我们可以学习强化学习的各种概念、算法等,这一步是基础,对以后更深入的强化学习研究学习是必不可少的,学习和调试具体的算法代码可以让我们对概念和算法理解的更彻底(出门左转,来到openAI开源的baselines,强化学习的各种算法应有尽有)。

代码都有了,那赶紧的跑起来!但好多同学可能在这一步又举步维艰,比如安装运行环境复杂老是出错,机器连块GPU也没有代码跑不起来...

这一步,请到这里来,华为云ModelArts可以为您解决这些烦恼。接下来请跟着我的步伐,体验ModelArts如何让我们学习强化学习如此轻松。

准备

本文默认您已经注册了华为云账户。然后按照这儿配置访问密钥。

获取访问密钥并完成ModelArts全局配置只是使用AI开发平台ModerArts的其中一个步骤,当然尤为重要的一步。

创建免费算力实例

ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。

目前福利大放送,ModelArts免费算力开放,免费体验开发者在线开发平台工具Notebook、自动学习和AI全流程开发

ModelArts有两个入口可以创建开发环境,一键生成的CodeLab和可根据自己配置要求的Notebook,创建方式分别如下:

1. 一键式创建(简直不要太方便~~~):点击首页的CodeLab,静待20来秒,即开即用的开发环境为您呈上。

这种一键打开的默认环境是没有配置GPU资源的,按您需求,可一键切换

2. 按需配置式创建:这儿,按照如下步骤创建一个免费的Notebook。




image.png

待Notebook启动成功之后,点击右侧的【打开】进入Jupyter工作台。如果遇到系统繁忙请耐心等待,毕竟免费算力的活动实在是太火爆了!打开Jupyter界面后,新建一个TensorFlow 1.13.1的Notebook,解下来便可以在这个Notebook里面运行代码了

强化学习跑起来

(单击选中Notebook的代码段,然后点击工具栏的Run按钮即可运行对应代码段)

第一步:下载openAI开源的强化学习baseline代码库,并安装依赖


第二步:给模型装上Deep Q-Learning大脑,学习一下怎么玩雅达利公司经典的《PONG》,让模型也体验一把国球的快乐

第三步:看看训练后的模型,打乒乓球是不是很厉害

第四步:您也可以体验更多强化学习算法,ModelArts助你事半功倍。

写到最后

ModelArts是面向开发者的一站式AI开发平台,更多高阶功能待您体验,ModelArts让您的AI探索之路畅行无阻。ModelArts致力于为AI开发者提供最有效率的AI开发平台,更多建议,欢迎留言。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。