好书推荐:海量数据挖掘第2版 |
发布于:2016/03/08 |
移动互联网等技术的发展使得网络社交、网络购物等成为人们生活的一部分。在这个过程中,各种网络设备也产生了大量的数据。对于掌握数据资源的电商、运营商来说,非常希望能从这些海量的数据中挖掘出有用的信息。本书所关注的正是在海量数据挖掘中所涉及到的关键理论、模型和算法。本书以MapReduce框架为数据处理的基础,介绍了在上层进行数据挖掘过程中可能遇到的各种问题以及相应的解决方案。 全书分为12章:1. 数据挖掘介绍;2. MapReduce和新的软件栈;3. 发现相似项;4. 数据流挖掘;5. 链接分析;6. 频繁项挖掘;7. 聚类算法;8. 广告投放;9. 推荐系统;10. 社交网络挖掘;11. 维度约减;12. 大规模机器学习。 本书源自作者在斯坦福大学教授的“海量数据挖掘”(CS246: Mining Massive Datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。本书非常适合相关专业的研究生参考。 张志斌,副研究员 (中国科学院计算技术研究所)来源:国外科技新书评介
|
|