使用时序预测算法实现访问流量预测
场景介绍
针对有一定AI基础的AI初学者,ModelArts基于业界的主流引擎提供了预置算法,无需关注模型开发过程,直接使用预置算法对已有数据进行训练,并快速部署为服务。时序预测可针对时间序列数据进行预测。
这里提供了一个访问流量预测的样例,帮助您快速熟悉使用ModelArts AI Gallery算法训练的过程。此样例针对问流量数据cdn.csv,利用lstm预测得到接下来一个时间段内的结果。
数据准备
-
进入数据集介绍,单击“下载”,将“cdn.csv”数据集下载至目标位置OBS目录。
-
设置“目标区域”和“目标位置”,然后单击“下一步”。
“目标区域”:请设置为ModelArts的所在区域。ModelArts支持在“华北-北京一”、“华北-北京四”、“华东-上海一”使用,此处选择的区域与您想要使用的ModelArts所在区域填写一致。
“目标位置”:将数据集从AI Gallery下载至您的OBS桶中。例如,将数据集存储至“test-modelarts/dataset”OBS路径下。
-
数据开始下载后,可以单击右上角“个人中心>数据集”,查看数据集下载进度。当此数据集的“状态”为“推送成功”时,此样例数据集已同步至你指定的目标位置下。
进入AI Gallery订阅算法
ModelArts预置的时序预测算法发布在AI Gallery中。您可以前往AI Gallery,订阅此模型,然后同步至ModelArts中。
-
进入ModelArts的AI Gallery,在搜索框中输入“时序预测”,查找对应的算法。
-
单击算法名称进入算法详情页,单击右侧的“订阅”,根据界面提示完成算法订阅。
此算法由ModelArts官方提供,目前免费开放。订阅算法完成后,页面的“订阅”按钮显示为“已订阅”。
-
单击商品详情页的“前往控制台”,此时弹出“选择云服务区域”对话框,选择对应的区域,然后再单击“确定”,
页面将自动跳转至ModelArts的“算法管理>市场订阅”中同步对应的算法。
图1 前往控制台
图2 选择云服务区域
-
在ModelArts管理控制台的算法管理页面,算法将自动同步至ModelArts中。
未同步的算法,无法直接用于创建训练作业,因此从AI Gallery订阅完成后,需在ModelArts管理控制台执行同步操作。同步成功后,下方界面中的“创建训练作业”按钮可用,且状态变更为“就绪”。图3 同步算法
使用订阅算法创建训练作业
算法订阅成功后,算法将呈现在“算法管理>市场订阅”中,您可以使用订阅的“时序预测算法”算法创建训练作业,获得模型。
-
进入“算法管理>市场订阅”页面,选择订阅的“时序预测算法”算法,单击左侧的小三角展开算法,在版本列表中,单击“创建训练作业”。
图4 创建训练作业
-
在创建训练作业页面,参考如下说明填写关键参数。
-
“算法来源”:系统默认选择步骤1订阅的算法,请勿随意修改。
-
“训练输入”:数据来源选择“cdn.csv”数据文件存储的OBS目录。注意此处选择目录,而不是此文件。
-
“训练输出”:选择一个OBS空目录存储训练输出的模型。
-
“调优参数”:此算法提供的参数均提供了默认值。针对本示例,建议“epoch”迭代轮数修改为“20”,其他参数采用默认值,如需修改,建议仔细阅读算法介绍,并根据参数解释进行修改。
“model”支持多种类型的模型,其中arima、holt_winters仅支持单维的时序预测,rnn、lstm、gru、lstnet和attetion支持多维度的时序预测。本示例使用lstm模型。
-
“规格”:建议选择免费规格的GPU进行训练。如果需要选择CPU,建议将上述“调优参数”中,“gpu”的值设置为“0”。
图5 训练作业参数
图6 调优参数配置
图7 资源配置
-
参数填写完成后,单击“下一步”,根据界面提示完成训练作业创建。
-
进入“训练管理>训练作业”页面,等待训练作业完成。
训练作业运行需要几分钟时间,请耐心等待。根据经验,使用GPU资源时此样例在2分钟左右完成训练。
当训练作业的状态变更为“运行成功”时,表示已运行结束。您可以单击训练作业名称,进入详情页面,了解训练作业的“配置信息”、“日志”、“资源占用情况”等信息。您也可以在配置的“训练输出位置”对应的OBS目录下获得训练生成的模型以及预测结果“forecast.csv”。
创建可视化作业
针对训练输出的预测结果,可通过可视化作业查看,更加直观的查看预测结果。您也可以前往训练输出目录,获取预测结果,进行查看。
-
在“训练管理 > 训练作业”页面中,选择“可视化作业”页签,单击“创建”。
-
在“创建可视化作业”中,填写相关参数,其中“训练输出位置”选择步骤2中“训练输出”对应的OBS目录,然后“下一步”,并根据界面提示完成可视化作业创建。
图8 可视化作业参数配置
-
等待可视化作业创建成功,当作业状态为“运行中”时,可单击作业名称进入TensorBoard界面查看预测结果,其结果展示如图9所示。
图9 tensorboard可视化
清除资源
为避免产生不必要额费用,通过此示例学习时序预测算法的使用后,您可以清除相关资源,避免造成资源浪费。
-
删除可视化作业:在“训练管理>训练作业”页面,进入“可视化作业”页签,单击操作列的“更多>删除”。
-
删除训练作业:在“训练作业”页面,单击操作列的“删除”。
-
删除数据:前往OBS,删除上传的数据,然后删除文件夹及OBS桶。
- 点赞
- 收藏
- 关注作者
评论(0)