AI 学习 7天测试题
Day 7 测试题
Day1
1.分类问题的label是一个( )值
数
类别
类别或者数
2.强化学习属于()的一种
无监督学习
机器学习
监督学习
3.逻辑回归常用于解决( )
回归问题
分类问题
优化问题
4.聚类算法属于()的一种
无监督学习
强化学习
监督学习
5.支持向量机可以解决()
分类问题
回归问题
分类问题和回归问题
提交
多选题
5.0/5.0 points (graded)
1.MLS平台提供的功能范围是()
特征工程
模型构建
模型评估
数据理解
正确
2.MLS平台提供的算法种类为()
分类、聚类、回归
异常检测、推荐、频繁模式挖掘
CNN、RNN
文本分析、关系分析、时序分析
正确
3.MLS平台客户拓展中与客户进行场景的沟通主要达成以下哪些目标()
了解诉求
聚焦数据
场景转化
建模输出
正确
4.企业应用AI的难点()
不了解AI算法
没有积累的有价值的数据
没有合适的AI承载平台
无法进行数据建模
正确
5.以下说法正确的是()
无监督学习不需要进行数据的人为标注
强化学习只需要环境的反馈奖惩即可进行学习
分类问题中label是连续的
回归问题的评价指标中有召回率
k-means是一种无监督学习的算法
Alpha Go只采用了无监督学习的算法
正确
提交
Day2
单选题
10/10 points (graded)
1.样本生成的目的是为了()
样本准确性
样本完整性
样本可信性
2.样本选择的目的是为了()
统计样本分布
筛选无意义样本
监督学习
3.特征归约主要是为了进行特征的()
缺失值处理
一致性处理
异常值处理
4.分箱用于处理()
连续型数据
离散型数据
连续型和离散型数据即可
5.主成分分析用于()
特征降维
特征膨胀
特征子集计算
提交
正确 (10/10 分)
检查
多选题
10/10 points (graded)
1.特征预处理一般包含()
特征清洗
特征生成
特征选择
特征归约
正确
2.特征清洗一般包含()
样本忽略
缺失值和异常值处理
平滑处理
聚类
正确
3.常用的标准化方法()
min-max标准化
Z变换
比例变换
等宽分箱
正确
4.机器学习建模需要的高质量数据的特点是()
准确
完整
一致
时效
可信
正确
5.特征归约一般包含()
离散化
标准化
光滑
聚集
正确
提交
正确 (10/10 分)
Day3
单选题
10.0/10.0 points (graded)
1.分类的类别标签列是()
类别数值
类别的不同
具有次序、大小的意义
2.分类模型在进行训练时需要()
训练集
训练集与测试集
训练集、验证集、测试集
3.典型的分类算法是()
决策树
k-means
BIRCH
4.决策树每个非叶结点表示()
某一个特征或者特征组合上的测试
某个特征满足的条件
某个类别标签
5.随机森林的分类机制是()
投票
提升
概率计算
提交
多选题
10.0/10.0 points (graded)
1.随机森林的随机性在于()
随机样本
随机特征
随机特征组合
随机分裂规则
正确
2.随机森林相比决策树的优点有()
对离群点更加鲁棒
准确率更高
泛化误差收敛
大型数据集上更加有效
正确
3.决策树常用的特征分裂方法()
信息增益
基尼指数
距离计算
频率计算
正确
4.常见的决策树节点测试的类型有()
离散值,分裂所有可能
连续值,分裂两种可能
离散值,分裂两种可能
连续值,分裂两种以上可能
正确
5.随机森林中进行投票时,采用()
平等投票
权重投票
随机投票
不投票
正确
提交
Day 4
1.分类模型评估指标中的召回率如何计算()
(TP+TN)⁄(P+N)
TP⁄P
TP⁄(TP+FP)
2.在分类中的“设备故障/异常检测”场景下,指标()要首先满足接近100%
accuracy
specificity
recall 正确
3.混淆矩阵对角线上的值()
越大约好
越小越好
无所谓大小
4.逻辑回归拟合的函数是()
sigmoid 正确
tanh
relu
5.SVM中要寻找和计算的MMH是指()
最大边缘超平面
超平面
最小边缘超平面
提交
多选题
5.0/5.0 points (graded)
1.SVM常用的核函数有()
h次多项式核函数
高斯径向基函数核函数
Sigmoid型核函数
拉普拉斯核函数
正确
2.分类评估指标中的AUC()
AUC=1,表示分类器是完美的
AUC=0.5,表示分类器是可用的
AUC<0.5,表示分类器不可用
0.5< AUC<1,表示分类器优于随机猜测
正确
3.分类评估指标的使用原则()
所有指标都要尽可能的好
首先确立重要类别
为重要类别的部分指标制定高的标准
满足重要类别指标的前提下提升非重要类别的指标
正确
4.逻辑回归的一般过程是()
拟合sigmoid function
某个样本的sigmoid function的计算结果看做是这个样本属于类别1的概率
其它样本的sigmoid function的计算结果看做是样本属于类别0的概率
将sigmoid function的计算结果大于等于0.5的归属为类别1,小于0.5的归为类别0
正确
5.SVM处理线性不可分数据时()
数据变换到高维空间
在原始空间求解MMH
在高维空间求解MMH
使用核函数代替点积运算
正确
Day5
10/10 points (graded)
1.关于回归问题,说法正确的是()
可以不需要label
label列是连续型
属于无监督学习
2.回归问题的评价指标中MAE是指()
均方根误差
均方误差
平均绝对误差
3.关于线性回归算法,说法正确的是()
在高维空间中求解一个线性方程的系数组合
对异常值不敏感
无需对数据做标准化处理
4.KNN算法应用于回归时,计算的是()
从属类别的均值
从属类别的最大值
从属类别的最小值
5.回归评估指标中RMSE和MSE的关系是()
MSE是RMSE的平方
没有关系
RMSE是MSE的平方
提交
正确 (10/10 分)
检查
多选题
10/10 points (graded)
1.KNN的主要优点是()
理论成熟,思想简单,既可以用来做分类也可以用来做回归
训练时间复杂度比支持向量机之类的算法低,仅为O(n)
与朴素贝叶斯之类的算法比,对数据没有假设,准确度高,对异常点不敏感
可用于非线性分类
正确
2.KNN的主要缺点是()
计算量大,尤其是特征数非常多的时候
样本不平衡的时候,对稀有类别的预测准确率低
预测时速度比起逻辑回归之类的算法慢
相比决策树模型,KNN模型可解释性不强
正确
3.KNN的关键参数是()
K值
距离计算方式
样本总量
样本均衡性
正确
4.关于线性回归说法不正确的是()
梯度下降在靠近极大值时速度减慢
梯度下降学习率a的选择不合适不影响模型结果
线性回归对异常值非常敏感
适用于预测目标与特征之间线性关系强的数据集
正确
5.关于回归算法,下列说法正确的是()
线性回归可以让预测值跨越训练集中label的范围
KNN回归可以让预测值跨越训练集中label的范围
KNN在预测异常样本时是有效的。
线性回归使用梯度下降法来进行学习。
正确
Day6
1.随机森林算法用于回归时,单棵树的分裂原则是()
基尼指数
方差
信息增益率
2.构建回归树的时间复杂度最重要的因素是()
特征中类别的个数
label列值域
样本总量
3.关于梯度提升树,说法正确的是()
梯度提升树中样本的权重是不等的
梯度提升树只需构建一棵树
梯度提升树回归可以跨越训练集中label的值范围
提交
多选题
4.0/4.0 points (graded)
1.梯度提升的步骤是()
首先用简单的模型对数据进行建模并分析数据中的错误。
这些错误表示难以用简单模型拟合的数据点。
然后对于以后的模型,我们特别关注那些难以拟合的数据点,以使他们正确
我们通过随机挑选部分样本再次进行树的构建
正确
2.回归树构建过程是()
考虑数据集 R 上的所有特征 j,遍历每一个特征下所有可能的取值或者切分点 s,将数据集 R 划分成两部分 R_1 和 R_2
分别计算多个子集划分的平方误差和,选择最小的平方误差对应的特征与分割点,生成两个子节点
在每个子节点再次进行划分计算
叶结点的最大值视为叶结点的表征值
正确
Day7
1.聚类的结果是将数据分成了多个簇,()
每个簇有确切的含义
单个簇要再次进行统计分析
簇与簇之间差异巨大
2.聚类属于()
监督学习
无监督学习
强化学习
3.基于划分的聚类,说法正确的是()
对分区个数敏感
无法区分互斥的簇
有利于寻找非球形簇
4.k-means算法用()表示簇心
簇均值
簇中位数
簇众数
5.基于层次的聚类,说法正确的是()
凝聚法是从一个大的数据簇开始计算
分裂法是从一个小的数据簇开始计算
簇与簇之间可以进行合并,进行层次分析
提交
多选题
5.0/5.0 points (graded)
1.常用的样本距离计算方法有()
欧式距离
余弦距离
曼哈顿距离
闵可夫斯基距离
正确
2.基于层次的聚类方法优点是()
可以根据应用场景人为的控制聚类的层次
多层次聚类可以让簇的分析更加全面
可以发现非球形簇
对于簇内个数阈值或者距离阈值不敏感
正确
3.k-means的一般过程是()
从数据集D中以某种规则选择k个样本或者k个在值域范围内的点作为初始簇的中心
计算簇中心之外的每个样本和每个簇中心的距离,将样本归属于最近的的簇
计算簇内均值,将均值作为簇的中心
直到簇中心的变化小于一定的阈值或者即便簇中心变动,但是簇内样本不变动
正确
4.k-means初始簇心的选择的合理方式是()
随机k个簇心
设定一个尝试次数值,在这个值的范围内进行最远簇心寻找
计算所有样本的两两距离,随机给定一个样本作为第1个簇心,使用距离排序确定k个簇心
多次进行随机初始簇心,聚类完成后,具体分析簇与簇之间的互斥性,然后进行优化
正确
5.关于k-means聚类,说法正确的是()
可以在簇完全不发生任何更新时停止
可以设定簇的最大更新次数
k值设定一般来源于经验值和场景设定
最佳k值设定需要多次重复试验进行优化。
正确
- 点赞
- 收藏
- 关注作者
评论(0)