[干货分享] [MindSpore新年新版本体验]MindSpore1.1实现简单线性函数拟合

一、运行环境(Vmware虚拟机环境)

操作系统:Ubuntu 18.04

CPU:Intel i7

内存:2GB

Anconda版本:Anconda 2020.11

MindSpore版本:1.1.0


二、MindSpore安装

根据安装文档,采用pypi安装

执行命令:

pip install https://ms-release.obs.cn-north-4.myhuaweicloud.com/1.1.0/MindSpore/cpu/ubuntu_aarch64/mindspore-1.1.0-cp37-cp37m-linux_aarch64.whl --trusted-host ms-release.obs.cn-north-4.myhuaweicloud.com -i https://pypi.tuna.tsinghua.edu.cn/simple

打开jupyterlab引入mindspore验证一下安装版本

image.png

运行结果显示1.1.0说明MindSpore1.1.0安装完成了


三、实现简单线性函数拟合

这部分内容参考:https://www.mindspore.cn/tutorial/training/zh-CN/r1.1/quick_start/linear_regression.html

回归问题算法通常是利用一系列属性来预测一个值,预测的值是连续的。例如给出一套房子的一些特征数据,如面积、卧室数等等来预测房价,利用最近一周的气温变化和卫星云图来预测未来的气温情况等。如果一套房子实际价格为500万元,通过回归分析的预测值为499万元,则认为这是一个比较好的回归分析。在机器学习问题中,常见的回归分析有线性回归、多项式回归、逻辑回归等。本例子介绍线性回归算法,并通过MindSpore进行线性回归AI训练体验。

第一部分,MindSpore运行配置,定义数据集生成函数及可视化展示

from mindspore import context
import numpy as np
import matplotlib.pyplot as plt

#设置MindSpore运行配置
context.set_context(mode=context.GRAPH_MODE, device_target="CPU")

#定义数据集生成函数
def get_data(num, w=2.0, b=3.0):
    for _ in range(num):
        x = np.random.uniform(-10.0, 10.0)
        noise = np.random.normal(0, 1)
        y = x * w + b + noise
        yield np.array([x]).astype(np.float32), np.array([y]).astype(np.float32)
#可视化展示
_data = list(get_data(50))
x_target_label = np.array([-10, 10, 0.1])
y_target_label = x_target_label * 2 + 3
x__label,y__label = zip(*_data)

plt.scatter(x__label, y__label, color="red", s=5)
plt.plot(x_target_label, y_target_label, color="green")
plt.("Eval data")
plt.show()

执行结果

image.png

上图中绿色线条部分为目标函数,红点部分为验证数据_data。

第二部分:定义数据增强函数

#定义数据增强函数
from mindspore import dataset as ds

def create_dataset(num_data, batch_size=16, repeat_size=1):
    input_data = ds.GeneratorDataset(list(get_data(num_data)), column_names=['data', 'label'],num_parallel_workers=2)
    input_data = input_data.batch(batch_size)
    input_data = input_data.repeat(repeat_size)
    return input_data

#使用数据集增强函数生成训练数据,并查看训练数据的格式。
data_number = 1600
batch_number = 16
repeat_number = 1

ds_train = create_dataset(data_number, batch_size=batch_number, repeat_size=repeat_number)
print("The dataset size of ds_train:", ds_train.get_dataset_size())
dict_datasets = next(ds_train.create_dict_iterator())

print(dict_datasets.keys())
print("The x label value shape:", dict_datasets["data"].shape)
print("The y label value shape:", dict_datasets["label"].shape)

第三部分:定义训练网络

#定义训练网络
from mindspore.common.initializer import Normal
from mindspore import nn

class LinearNet(nn.Cell):
    def __init__(self):
        super(LinearNet, self).__init__()
        self.fc = nn.Dense(1, 1, Normal(0.02), Normal(0.02))

    def construct(self, x):
        x = self.fc(x)
        return x

net = LinearNet()
model_params = net.trainable_params()
print(model_params)

#可视化
from mindspore import Tensor

x_model_label = np.array([-10, 10, 0.1])
y_model_label = (x_model_label * Tensor(model_params[0]).asnumpy()[0][0] +
                 Tensor(model_params[1]).asnumpy()[0])

plt.scatter(x_eval_label, y_eval_label, color="red", s=5)
plt.plot(x_model_label, y_model_label, color="blue")
plt.plot(x_target_label, y_target_label, color="green")
plt.show()

运行结果:

image.png

第四部分:定义前向传播网络与反向传播网络并关联

from mindspore import Model
import matplotlib.pyplot as plt
import time

net = LinearNet()
net_loss = nn.loss.MSELoss()
opt = nn.Momentum(net.trainable_params(), learning_rate=0.005, momentum=0.9)
model = Model(net, net_loss, opt)

def plot_model_and_datasets(net, eval_data):
    weight = net.trainable_params()[0]
    bias = net.trainable_params()[1]
    x = np.arange(-10, 10, 0.1)
    y = x * Tensor(weight).asnumpy()[0][0] + Tensor(bias).asnumpy()[0]
    x1, y1 = zip(*eval_data)
    x_target = x
    y_target = x_target * 2 + 3

    plt.axis([-11, 11, -20, 25])
    plt.scatter(x1, y1, color="red", s=5)
    plt.plot(x, y, color="blue")
    plt.plot(x_target, y_target, color="green")
    plt.show()
    time.sleep(0.02)

#定义回调函数
from IPython import display
from mindspore.train.callback import Callback

class ImageShowCallback(Callback):
    def __init__(self, net, eval_data):
        self.net = net
        self.eval_data = eval_data

    def step_end(self, run_context):
        plot_model_and_datasets(self.net, self.eval_data)
        display.clear_output(wait=True)

第四部分:执行训练

from mindspore.train.callback import LossMonitor

epoch = 1
imageshow_cb = ImageShowCallback(net, eval_data)
model.train(epoch, ds_train, callbacks=[imageshow_cb], dataset_sink_mode=False)

plot_model_and_datasets(net,eval_data)
print(net.trainable_params()[0], "\n%s" % net.trainable_params()[1])


四、出现的问题

在执行数据增强和执行训练的时候报一下错误:

RuntimeError: Thread ID 139848515852096 Unexpected error. GeneratorDataset's num_workers=4, this value is not within the required range of [1, cpu_thread_cnt=2].
Line of code : 429
File         : /home/jenkins/agent-working-dir/workspace/Compile_CPU_X86_Ubuntu/mindspore/mindspore/ccsrc/minddata/dataset/engine/ir/datasetops/dataset_node.cc

具体原因还在琢磨


个人邮箱:JeffDing890430@163.com