多重数据库中的知识发现 |
发布于:2014/11/01 |
近年来,越来越多的组织和机构对分布式数据库上的信息挖掘有迫切的应用需求。特别是随着互联网的迅猛发展,让个人和企业低成本地获取海量信息成为可能,而通过对数据的分析无疑会帮助他们做出更加科学合理的决策。然而,面对海量数据,如何有效地从不同的数据源获取高质量的数据已经成为了一个亟需解决的问题。这样一个严峻的挑战吸引了包括本书作者在内的众多研究者的热情参与。所不同的是,作者独辟蹊径,提出了一种本地模式分析模型,从而让那些在传统的多数据库挖掘技术条件下不能被采集的潜在信息,能被有效地发现和利用。 全书分为三大部分,共10章。第1部分是多数据库挖掘基础,包含第1-3章:1.多数据库挖掘技术的重要性,介绍了单数据库挖掘与多数据库挖掘之间的区别,然后简述了多数据库挖掘的处理过程;2.数据挖掘和多数据库挖掘,介绍了数据挖掘与多数据库挖掘之间的区别与联系,简述了一些重要概念,最后介绍了前人在本方向所做的工作以及目前的应用热点;3.本地模式分析,介绍了本地模式分析框架,详述了多数据库环境下的模式结构以及本地模式分析的有效性。 第2部分是数据预处理,包含第4-6章:4.框架的使用,介绍了传统的多数据库挖掘技术面临的问题,在此基础上提出了识别高质量数据技术及相关概念;5.数据库聚类,介绍了分类的有效性以及数据库的分类,最后给出了在本地模式下识别特殊模式的高效算法;6.非一致性处理,包括语义定义,以及加权多数法,在此基础上提出了一种基于权重合成模式的方法,并且给出了改进合成模型的规则。 第3部分是模式识别,包括第7-10章:7.高票选模式,包括建立高票选模式识别模型、设计高票选模式搜索算法、构造模糊逻辑控制器、分析高票选模式识别方法等;8.例外模式,包括构造例外模式兴趣度模型、设计例外模式搜索算法、构造最小兴趣度的逻辑控制器,最后用实例证明了本章所提出的算法的有效性;9.加权综合模式,包括构造基于加权的综合模型、改进现有的综合模型、分析算法复杂度等;10.总结与展望,总结了本书中的创新之处,并对多数据库知识发现技术未来的发展方向给出了预测。 本书语言通俗易懂,观点精辟独到,适合数据挖掘、分布式数据分析、机器学习等相关专业硕士研究生阅读和参考。亦可作为在数据挖掘、数据库知识发现等领域展开科学研究的工程师们的专业参考书。 臧光明,硕士研究生 来源:国外科技新书评介
|
|