对象:进行了螺旋线圈中的自动两相流模式识别
方法:X射线照相的空隙率测量数据+聚类+KNN、RF、SVM
目标:模式识别
关注特征:
结果:
聚类
分类:模型是随机森林 (RF) 分类器、KNN 分类器和SVM(参见第 1节)。为了优化超参数并估计分类器精度,所有模型均采用嵌套 5 × 5 交叉验证方案,如图1所示。分层抽样用于解释各个类别中实例数量的不平衡(参见第 3节)。对于超参数选择,采用贝叶斯优化。
对于 RF 分类器,决策分割的最大数量、叶节点观测的最小数量以及为每个分割随机选择的预测变量的数量被优化为超参数(Breiman,2001)。树的数量,即集成学习周期的数量,固定为 100。
对于KNN分类器,距离度量(城市街区距离、切比雪夫距离、一减去样本线性相关系数、余弦距离、欧氏距离、汉明距离、一减去杰卡德系数、马哈拉诺比斯距离、明可夫斯基距离、标准化欧氏距离、一减去样本斯皮尔曼等级相关系数)以及最近邻参数的数量被选为超参数( Murphy,2012)。
对于SVM,三个具有不同内核的单独分类器,
DD聚类算法 (Rodriguez 和 Laio,2014)应用于由PCA和拉普拉斯评分算法压缩的预处理特征矩阵
标签:KNN,radiography,based,helically,距离,分类器,RF,SVM,数量 From: https://www.cnblogs.com/darunfa-and-20-years-fish/p/18158483