如果题目顺序不一样请用CTRL+F来搜索试题

确定好题一样,再下载

点击支付下载即可看见答案

 

《大数据分析与挖掘技术》·形考任务1

 

题目1.请问在Python中缺失值通常用( )来记号。

A.NaN

B.?

C.NA

D.na

 

题目2.请问不是缺失值通常用的处理方式是( )。

A.填补

B.删除

C.插补

D.提取

 

题目3.数据整合后( )。

A.数据量会增加

B.数据量会不变

C.数据的波动性增加

D.数据波动性减小

 

题目4.数据离散化可以采用( )方式。

A.等宽或者等频

B.插补

C.抽样

D.查询

 

题目5.下面关于主成分分析说法错误的是( )。

A.主成分是相互正交(垂直)的

B.主成分捕获了数据差异最大的方向

C.是线性降维方法

D.是非线性降维方法

 

题目6.数据经过标准化处理后( )。

A.数据的波动性将会增加

B.数据的波动单位为1

C.数据的波动性将会减小

D.数据值将被放大

 

题目7.白化是指( )。

A.从相关矩阵出发求解主成分

B.从协方差矩阵出发求解主成分

C.将数据进行标准化

D.剔除数据中的异常值

 

题目8.分类模型评价时,通常采用( )损失。

A.0-1损失

B.指数

C.绝对值

D.平方

 

题目9.不是回归模型常采用的评价指标是( )。

A.MAE

B.MSE

C.R2

D.准确率

 

题目10.期望预测误差是指( )。

A.真实值与预测值在某种损失函数下的平均值

B.真实值与预测值之差

C.真实值与预测值在某种损失函数下的值

D.真实值与预测值之比

 

题目11.缺失数据的处理方法包括( )。

A.填补

B.删除

C.插补

D.提取

 

题目12.数据抽样后( )。

A.数据量会增加

B.数据量会减少

C.数据的波动性可能增加

D.数据波动性可能减小

 

题目13.下面关于主成分分析说法正确的是( )。

A.主成分是相互正交(垂直)的

B.主成分捕获了数据差异最大的方向

C.是线性降维方法

D.是非线性降维方法

 

题目14.期望预测误差中的方差部分是由( )带来的。

A.最优解所在空间假设失误

B.数据的随机性

C.估计值自身的波动

D.估计值的平均可能偏离了真实值

 

题目15.聚类分析的外部评价指标通常有( )。

A.DBI

B.兰德指数

C.Jaccard系数

D.FM指数

E.DI

 

题目16.分类任务的评价指标通常采用( )。

A.准确度

B.ROC曲线

C.特效度

D.灵敏度

E.错分成本

 

题目17.主成分分析中最大的特征值对应的特征向量也就是是数据差异最大的的方向。( )

A.对

B.错

 

题目18.白化是指将数据进行标准化。( )

A.对

B.错

 

题目19.数据经过标准化处理后,数据的波动性将会减小。( )

A.对

B.错

 

题目20.在Python中缺失值通常用NA来记号。( )

A.对

B.错

 

题目21.主成分是相互正交(垂直)的。( )

A.对

B.错

 

题目22.回归模型评价时,通常采用0-1损失。( )

A.对

B.错

 

题目23.兰德指数是聚类分析的内部评价指标。( )

A.对

B.错

 

题目24.期望预测误差中的偏差部分是由估计值的平均可能偏离了真实值带来的。( )

A.对

B.错

 

题目25.分类模型评价时,通常采用平方损失。( )

A.对

B.错

 

题目26.由于最优解所在空间假设失误将会造成期望预测误差中的方差部分。

A.对

B.错

 

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源