本发明公开了一种基于时间序列的计算机数据挖掘聚类方法,该计算机数据挖掘聚类方法通过对输入样本集X、Y进行去噪、归一化处理,并对处理后的时间序列进行极值点求取,得到极值点序列X'、Y';再对X'、Y'进行等长处理,等长处理后得到长度相等的分类序列X”、Y”;然后对处理后的序列X”、Y”进行类距离计算,将距离最大的两类进行合并,合并后类别数减少一个;接着对处理后的分类序列X”、Y”循环执行类距离计算并且合并距离最大的两类,直到聚类数等于预设的数据,即可聚类结束;最后输出聚类结果。该方法能够有效地处理数据量大、维度高的时间序列数据,方法简单易行,不依赖于具体序列,能高效地进行数据挖掘聚类,将海量数据有效压缩并保留其数据的主要特征。
|