资源简介


随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念、模型、方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。

本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。

本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。

◆ 介绍支持向量机(SVM)和Kohonen映射

◆ 讲解DBSCAN、BIRCH和分布式DBSCAN聚类算法

◆ 介绍贝叶斯网络,讨论图形中的Betweeness和Centrality参数测量算法

◆ 分析在建立决策树时使用的CART算法和基尼指数

◆ 介绍Bagging & Boosting集成学习方法,并详述AdaBoost算法

◆ 讨论Relief以及PageRank算法

◆ 讨论文本挖掘的潜在语义分析(LSA),并分析如何测定文本文档之间的语义相似性

◆ 讲解时态、空间、Web、文本、并行和分布式数据挖掘等新主题

◆ 更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容


代码片段和文件信息

评论

共有 条评论