机器学习之输入特征判断鸢尾花的种类

举报
南蓬幽 发表于 2022/05/29 11:36:35 2022/05/29
【摘要】 保存算法模型 1、加载数据集 2、数据集划分 3、特征工程(标准化) 4、模型选择 代码: 使用算法模型 保存算法模型 1、加载数据集data = load_iris() 2、数据集划分train_x,test_x,train_y,test_y = train_test_split(data['data'],data['target']) 3、特征工程(标准化)std = Standard...

保存算法模型

1、加载数据集

data = load_iris()

2、数据集划分

train_x,test_x,train_y,test_y = train_test_split(data['data'],data['target'])

3、特征工程(标准化)

std = StandardScaler()
train_x = std.fit_transform(train_x)
test_x = std.transform(test_x)

4、模型选择

可以选择不同的算法

逻辑回归

 lg = LogisticRegression()
 lg.fit(train_x,train_y)

KNN算法

lg = KNeighborsClassifier(n_neighbors=3)
 lg.fit(train_x,train_y)

朴素贝叶斯

 lg = MultinomialNB()
 lg.fit(train_x,train_y)

支持向量机

 lg = SVC()
 lg.fit(train_x,train_y)

决策树

 lg = DecisionTreeClassifier()
 lg.fit(train_x,train_y)

随机森林

lg = RandomForestClassifier()
lg.fit(train_x,train_y)

保存模型

joblib.dump(std,'lg_std.pkl')
joblib.dump(lg,'lg.pkl')

代码:

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import precision_score,recall_score,f1_score
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB,MultinomialNB,BernoulliNB
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
import joblib
#1、加载数据集
data = load_iris()
#2、数据集划分
train_x,test_x,train_y,test_y = train_test_split(data['data'],data['target'])
#3、特征工程(标准化)
std = StandardScaler()
train_x = std.fit_transform(train_x)
test_x = std.transform(test_x)
#4、模型选择
# lg = LogisticRegression()
# lg.fit(train_x,train_y)

# lg = KNeighborsClassifier(n_neighbors=3)
# lg.fit(train_x,train_y)

# lg = MultinomialNB()
# lg.fit(train_x,train_y)

# lg = SVC()
# lg.fit(train_x,train_y)

# lg = DecisionTreeClassifier()
# lg.fit(train_x,train_y)

lg = RandomForestClassifier()
lg.fit(train_x,train_y)

joblib.dump(std,'lg_std.pkl')
joblib.dump(lg,'lg.pkl')

使用算法模型

import joblib
import numpy as np
x1 = input("请输入鸢尾花花萼的长度")
x2 = input("请输入鸢尾花花萼的宽度")
x3 = input("请输入鸢尾花花瓣的长度")
x4 = input("请输入鸢尾花花瓣的宽度")

x = np.array([x1,x2,x3,x4]).reshape(1,4)
std = joblib.load('lg_std.pkl')
x = std.transform(x)

lg = joblib.load('lg.pkl')

y = lg.predict(x)
print(y)
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。