高级搜索  |  搜索帮助
最近的浏览历史
购买此书的人还购买过
书  名:Excel 2007数据挖掘完全手册
  • 作  者: 谢邦昌、朱建平、来升强
  • 出版时间: 2008-07-01
  • 出 版 社: 清华大学出版社
  • 字  数: 426 千字
  • 印  次: 1-1
  • 印  张: 19
  • 开  本: 16开
  • ISBN: 9787302174745
  • 装  帧: 平装
  • 定  价:¥32.00
电子书价:¥22.40 折扣:70折 节省:¥9.60 vip价:¥22.40 电子书大小:23.15M
配套资源下载:
  • 名称
  • 说明
  • 权限
  • 文件大小
  • 点击图标下载
  • 图书样章
  • 所有用户
  • 256K
  • 图书课件
  • 教师
  • 12M
共有商品评论0条 查看评论摘要
内容简介
  本书围绕Excel 2007的数据挖掘模块,通过大量操作示范,介绍了主流的数据挖掘方法。全书包括数据挖掘算法介绍、Excel 2007数据挖掘模块介绍、其他分析工具介绍、数据挖掘范例4篇,共26章。除了给出有关的理论和原理阐述之外,还提供了一些大型应用案例。通过详细的操作讲解和结果分析,读者可以获得实际的数据挖掘经验,并能迅速地在自己所处的领域中加以应用。
利用Excel 2007的数据挖掘模块,读者无须经过专业培训,就能完成多种数据挖掘任务。本书适用于学习数据挖掘和相关课程的学生、运用Excel 2007进行复杂大型数据分析的职场人士及咨询公司从业人员等。
前言
  目前,各行各业都开始利用计算机及相应的信息技术进行管理和决策,这使得各企事业单位生成、收集、存储和处理数据的能力大大提高。数据量与日俱增,大量复杂信息层出不穷,人们将面临着复杂数据的处理问题。Excel是当前使用最普遍的电子表格软件,它能容易地完成图表的制作、统计、分析以及数据处理,不但功能强大,而且简单易用。最新版本的Microsoft Office Excel 2007支持超过104万笔记录的单张数据工作表,并可以同时存储1.6万列的数据。为能有效提升Excel 2007用户数据处理和分析的能力,微软公司提供了一个免费的数据挖掘模块。通过调用该模块,Excel 2007用户可以方便快速地完成以往只有使用专业数据挖掘软件才能完成的任务。因此,我们编写了《Excel 2007数据挖掘完全手册》这本书,其目的是使具有一定Excel基础的读者,能够在了解相关统计思想与方法的基础上,运用该软件对复杂数据和海量数据进行处理、分析。
本书的编写力求以统计思想为主线,以数据挖掘技术应用为目的。基本内容和特点具体体现为:第1篇详细叙述数据挖掘的一般概念、通行规范、方法技术以及软件应用等,使读者获得一个较为清晰和正确的数据挖掘观念。第2篇围绕Excel 2007的数据挖掘模块,通过大量操作示范,详细讲述了Excel 2007数据挖掘模块的九大模型的使用。这些模型包括决策树、贝叶斯概率分类、关联规则、聚类分析、时序聚类、线性回归、Logistic回归、类神经网络和时间序列分析,基本涵盖了主要的数据挖掘技术和方法。第3篇介绍了Excel 2007的其他分析工具,结合数据挖掘技术和方法,使用改进的Excel表格工具,可以很方便地进行图形化的分析。第4篇是数据挖掘的案例分析,包括投资决策、信用评级,以及市场销售和客户细分等领域的数据挖掘模型。通过详细的操作讲解和结果解释,读者可以获得实际的数据挖掘经验,并能迅速在自己所处的领域中加以应用。
本书适合多层次多专业人士如数学、统计、经济金融、管理类等专业的本科生、专科生学习,还适合于非统计类的研究生及从事相关数据分析的人员阅读。
本书在编写及出版的过程中,得到了厦门大学经济学院计划统计系、台湾辅仁大学统计资讯学系和清华大学出版社的大力支持,在此一并表示衷心感谢!编写一本好书并不容易,尽管我们努力想奉献给读者一本满意的书,但仍有一些内容达不到读者各方面的要求。书中难免有疏漏之处,恳请读者多提宝贵意见,以便今后进一步修改与完善。
为了方便读者高效、便捷地使用本书,特免费提供本书所有实例的原始数据、源文件,请登录清华大学出版社网站(www.tup.tsinghua.edu.cn)下载。
本书的编写得到了厦门大学讲座教授基金和国家教育部“新世纪优秀人才支持计划”(Program for New Century Excellent Talents in University,NCET)的资助。

编 者
2008年3月
目录
第1篇 数据挖掘算法介绍
第1章 数据挖掘简介 3
1.1 数据挖掘的定义 3
1.2 数据挖掘的重要性 3
1.3 数据挖掘的功能 3
1.4 数据挖掘的步骤 4
1.5 数据挖掘建模的标准CRISP-DM 5
第2章 数据挖掘运用的理论和技术 7
2.1 回归分析 7
2.1.1 简单线性回归分析 7
2.1.2 多元回归分析 7
2.1.3 岭回归分析 8
2.1.4 Logistic回归分析 9
2.2 关联规则 9
2.3 聚类分析 10
2.4 判别分析 11
2.5 类神经网络分析 12
2.6 决策树分析 13
2.7 其他分析方法 15
第3章 数据挖掘与相关领域的关系 17
3.1 数据挖掘与统计分析的不同 17
3.2 数据挖掘与数据仓储的关系 17
3.3 知识发现与数据挖掘的关系 18
3.4 OLAP与数据挖掘的关系 19
3.5 数据挖掘与机器学习的关系 19
3.6 网络挖掘与数据挖掘的关系 20
第4章 数据挖掘商业软件产品及其应用现状 21
4.1 数据挖掘商业软件的分类 21
4.2 主要软件的介绍 21
4.3 顾客关系管理 22
4.4 数据挖掘的行业应用 23
第2篇 Excel 2007数据挖掘模块介绍
第5章 安装与设定Excel 2007数据挖掘加载项 27
5.1 系统需求 27
5.2 开始安装 27
5.3 完成安装验证 30
5.4 组件设定 30
5.5 配置完成检查 35
第6章 Excel 2007数据挖掘入门 37
6.1 Excel 2007数据挖掘功能介绍 37
6.2 数据挖掘使用说明 37
6.2.1 目录查询 37
6.2.2 开始功能 38
6.2.3 视频和教学 39
6.3 数据挖掘连接配置 39
6.3.1 设定目前的连接 39
6.3.2 跟踪 41
6.4 数据准备 41
6.4.1 浏览数据 41
6.4.2 清除数据 44
6.4.3 分割数据 46
6.5 数据建模 50
6.6 精确度和验证 51
6.6.1 准确性图表 51
6.6.2 分类矩阵 52
6.6.3 利润图 53
6.7 模型用法 53
6.7.1 浏览功能 53
6.7.2 查询功能 56
6.8 模型管理 57
6.8.1 重新命名挖掘模型 57
6.8.2 删除挖掘结构 57
6.8.3 清除挖掘结构 58
6.8.4 用原始数据处理挖掘结构 58
6.8.5 用新数据处理挖掘结构 58
6.8.6 导出挖掘结构 59
6.8.7 导入挖掘结构 60
第7章 决策树 61
7.1 基本概念 61
7.2 决策树模块的建立 61
7.3 决策树与判别函数比较 61
7.4 计算方法 62
7.4.1 确定预测精度的标准 62
7.4.2 选择分裂(分层)技术 62
7.4.3 定义停止分裂(分层)的时间点 62
7.4.4 选择适当大小的决策树 63
7.5 Excel 2007 决策树算法 63
第8章 贝叶斯概率分类 71
8.1 基本概念 71
8.2 Excel 2007贝叶斯概率分类 73
第9章 关联规则 84
9.1 基本概念 84
9.2 关联规则的种类 85
9.3 关联规则的算法:Apriori算法 85
9.4 Excel 2007关联规则 86
第10章 聚类分析 96
10.1 基本概念 96
10.2 层次聚类分析 96
10.3 聚类分析原理 97
10.4 Excel 2007聚类分析 100
第11章 时序聚类 116
11.1 基本概念 116
11.2 相关研究和算法 116
11.3 Excel 2007时序聚类 117
第12章 线性回归 126
12.1 基本概念 126
12.2 简单回归分析 127
12.3 多元回归分析 130
12.4 Excel 2007线性回归 133
第13章 Logistic回归 142
13.1 基本概念 142
13.2 logit变换 142
13.3 Logistic分布 143
13.4 列联表的Logistic回归模型 144
13.5 Excel 2007 Logistic回归 145
第14章 类神经网络 161
14.1 基本概念 161
14.2 类神经网络的架构与训练算法 163
14.3 类神经网络的特性 163
14.4 类神经网络应用 163
14.5 类神经网络优缺点 164
14.6 Excel 2007类神经网络 165
第15章 时间序列分析 175
15.1 基本概念 175
15.2 时间序列的成分 177
15.3 时间序列数据的图形介绍 178
15.4 利用平滑法预测 182
15.5 用趋势方程预测时间序列 186
15.6 预测含趋势与季节成分的时间序列 187
15.7 利用回归模型预测时间序列 188
15.8 其他预测模型 189
15.9 单变量时间序列预测模型 189
15.10 时间趋势预测模型 192
15.11 Excel 2007时间序列 193
第16章 DMX介绍 198
16.1 DMX介绍 198
16.2 DMX函数介绍 199
16.2.1 模型建立 200
16.2.2 模型训练 201
16.2.3 模型使用(预测) 201
16.2.4 其他函数语法 202
16.3 DMX数据挖掘语法 205
16.3.1 决策树 206
16.3.2 贝叶斯概率分类 207
16.3.3 关联规则 207
16.3.4 聚类分析 208
16.3.5 时序聚类 209
16.3.6 线性回归 210
16.3.7 Logistic回归 211
16.3.8 类神经网络 212
16.3.9 时间序列 213
16.4 DMX应用范例 214
16.4.1 分类 215
16.4.2 估计 216
16.4.3 预测 217
16.4.4 关联分组 217
16.4.5 聚类 218
第3篇 其他分析工具介绍
第17章 分析关键影响因素 223
第18章 检测类别 228
第19章 从示例填充 231
第20章 预测 233
第21章 突出显示异常值 235
第22章 应用场景分析 238
22.1 目标查找 238
22.2 假设 240
第23章 Visio 2007数据透视分析 243
第4篇 数据挖掘范例
第24章 上市公司投资价值分析的挖掘模型 251
24.1 研究动机与目的 251
24.2 挖掘模型的构建 251
24.3 变量筛选 252
24.4 决策树模型 253
24.5 贝叶斯概率模型 255
24.6 Logistic回归模型 255
24.7 预测准确度比较 256
第25章 信用卡用户信用评测的挖掘模型 259
25.1 研究背景 259
25.2 研究动机 260
25.3 研究目的 260
25.4 Excel 2007构建数据挖掘模型 260
25.4.1 决策树分析 260
25.4.2 聚类分析 263
25.4.3 Logistic回归 269
第26章 市场营销与客户细分的挖掘模型 271
26.1 研究动机与目的 271
26.2 研究方法与限制 271
26.3 数据分析 271
26.4 挖掘建模 273
26.4.1 决策树 273
26.4.2 单纯贝叶斯分类 280
26.4.3 聚类分析 282
26.4.4 决策树 286
26.4.5 Logistic回归 288
26.4.6 关联分析 292
26.5 结论 295
Copyright(C)清华大学出版社有限公司,All Rights Reserved 京ICP备10035462号 联系我们