当前位置:首页 >课程 >Python数据分析与数据可视化

1、在机器学习扩展库sklearn中,Lasso是可以估计稀疏系数的线性模型,尤其适用于减少给定解决方案依赖的特征数量的场合。如果数据的特征过多,而其中只有一小部分是真正重要的,此时选择Lasso比较合适。

A、错
B、对

参考答案:请扫码使用小程序查看答案

2、使用朴素贝叶斯算法进行分类时,分别计算未知样本属于每个已知类的概率,然后选择其中概率最大的类作为分类结果。

A、对
B、错

参考答案:请扫码使用小程序查看答案

3、支持向量机(Support Vector Machine, SVM)是通过寻找超平面对样本进行分隔从而实现分类或预测的算法,分隔样本时的原则是使得间隔最大化,寻找间隔最大的支持向量。

A、对
B、错

参考答案:请扫码使用小程序查看答案

4、KNN算法是k-Nearest Neighbor的简称,叫作k近邻算法,属于有监督学习算法,既可以用于分类,也可以用于回归。

A、对
B、错

参考答案:请扫码使用小程序查看答案

5、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)属于密度聚类算法,把类定义为密度相连对象的最大集合,通过在样本空间中不断搜索高密度的核心样本并扩展得到最大集合完成聚类,能够在带有噪点的样本空间中发现任意形状的聚类并排除噪点。

A、对
B、错

参考答案:请扫码使用小程序查看答案

6、DBSCAN算法不需要预先指定聚类数量,但对用户设定的参数非常敏感。当空间聚类的密度不均匀、聚类间距相差很大时,聚类质量较差。

A、错
B、对

参考答案:请扫码使用小程序查看答案

7、在样本的众多特征中,并不是每个特征都对要分析的问题有贡献。即使是对问题有贡献的若干特征,每个特征的重要程度可能也不一样。

A、对
B、错

参考答案:请扫码使用小程序查看答案