数据挖掘工程师题库
总共有 214 条题目
数据挖掘工程师题库
刷题
下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。 A.JP
先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。
在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
定量属性可以是整数值或者是连续值。
对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类
数据仓库中间层OLAP服务器只能采用关系型OLAP。
商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,
基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。
SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器
K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。
DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。
聚类分析可以看作是一种非监督的分类。
噪声和伪像是数据错误这一相同表述的两种叫法。
图挖掘技术在社会网络分析中扮演了重要的角色。
在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始