新書推薦:
《
利他主义的生意:偏爱“非理性”的市场(英国《金融时报》推荐读物!)
》
售價:HK$
79.4
《
认知行为疗法:心理咨询的顶层设计
》
售價:HK$
102.4
《
FANUC工业机器人装调与维修
》
售價:HK$
102.4
《
吕著中国通史
》
售價:HK$
64.4
《
爱琴海的光芒 : 千年古希腊文明
》
售價:HK$
204.7
《
不被他人左右:基于阿德勒心理学的无压力工作法
》
售價:HK$
67.9
《
SDGSAT-1卫星热红外影像图集
》
售價:HK$
457.7
《
股市趋势技术分析(原书第11版)
》
售價:HK$
227.7
|
內容簡介: |
本书重点介绍Python语言在数据处理与数据挖掘方面的应用技巧,主要包括数据分析基础知识(数据收集与分析软件、数据挖掘的分析基础、简单数据的统计分析),数据分析高级方法(多元数据的综合分析、时序数据的模型分析),大数据基本处理方法(大数据分析基础应用、文献计量与科研评价、社会网络分析方法、数据分析编程平台)等内容。附录中还提供了Python数据分析相关方法和函数等,方便读者随时查看。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向数据分析的读者,能有效帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据、习题数据及相关代码都可在作者的学习博客http:blog.leanote.comDaPy下载使用,也可登录华信教育资源网http:www.hxedu.com.cn免费下载。本书适合各层次的数据分析用户,既可作为初学者的入门指南,又可作为中高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。
|
關於作者: |
暨南大学教授,中国统计学会会员,广东省统计学会常务理事,暨南大学统计学专业博士生导师。著有多部统计学教材或专著。
|
目錄:
|
目录
第一部分数据分析基础知识
第1章数据收集与分析软件2
1.1数据收集过程2
1.1.1数据的类型2
1.1.2数据的收集3
1.1.3数据的管理8
1.2数据分析软件9
1.2.1数据分析软件简介9
1.2.2Python语言介绍10
1.2.3Python在线平台13
1.3Python编程基础18
1.3.1Python编程入门18
1.3.2Python数据类型20
1.3.3数值分析包numpy24
1.3.4数据分析包pandas25
1.3.5Python编程运算34
数据及练习138
第2章数据挖掘的分析基础41
2.1数据的描述分析41
2.1.1基本统计量41
2.1.2基本绘图函数46
2.2数据的透视分析55
2.2.1一维频数分析56
2.2.2二维集聚分析57
2.2.3多维透视分析60
数据及练习262
第3章简单数据的统计分析64
3.1随机变量及其分布64
3.1.1均匀分布64
3.1.2正态分布65
3.2随机模拟及其应用67
3.2.1随机模拟方法67
3.2.2模拟大数定律68
3.2.3模拟方法求积分69
3.3单变量统计分析模型70
3.3.1单变量线性相关模型71
3.3.2单变量线性回归模型73
数据及练习375
第二部分数据分析高级方法
第4章多元数据的综合分析78
4.1多元线性相关与回归79
4.1.1多元线性相关79
4.1.2多元线性回归模型81
4.2综合评价方法91
4.2.1综合评价指标体系91
4.2.2综合评价分析方法93
4.3数据压缩方法99
4.3.1主成分分析的基本思想99
4.3.2主成分的基本分析101
4.4聚类分析方法105
4.4.1聚类分析的概念105
4.4.2系统聚类方法108
数据与练习4113
第5章时序数据的模型分析116
5.1时间序列简介116
5.1.1时间序列的概念116
5.1.2时间序列的模拟116
5.1.3时间序列的读取118
5.2时间序列分析模型119
5.2.1AR模型120
5.2.2MR模型120
5.2.3ARMA模型121
5.2.4ARIMA模型122
5.3ARMA模型的构建124
5.3.1序列的相关性检验124
5.3.2ARMA模型的建立与检验127
5.3.3序列的平稳性检验131
5.4股票指数预测模型的构建133
5.4.1模型的预处理134
5.4.2参数的估计与检验135
5.4.3模型的预测136
数据与练习5137
第三部分大数据基本处理方法
第6章大数据分析基础应用140
6.1大数据的概念140
6.1.1大数据的含义140
6.1.2大数据应用举例141
6.1.3大数据分析方法142
6.2Python文本预处理144
6.2.1字符串的基本操作144
6.2.2字符串查询与替换146
6.3网络爬虫及应用146
6.3.1网页的基础知识147
6.3.2Python爬虫步骤148
6.3.3爬虫方法的应用149
6.4数据库技术及应用154
6.4.1Python中数据库的使用154
6.4.2数据库的建立与使用155
数据及练习6156
第7章文献计量与科研评价159
7.1文献计量研究的框架159
7.2文献数据的获取与分析161
7.2.1文献数据的获取161
7.2.2文献数据的分析163
7.3科研数据的管理与评价166
7.3.1科研单位与项目分析167
7.3.2科研期刊与作者分析169
数据及练习7171
第8章社会网络分析方法172
8.1社会网络的初步印象172
8.1.1社会网络分析概念172
8.1.2社会网络分析包174
8.2社会网络图的构建174
8.2.1社会网络数据形式174
8.2.2社会网络统计量177
8.2.3网络图之知识图谱180
数据及练习8183
第9章数据分析编程平台185
9.1Anaconda科学计算发行包185
9.1.1Anaconda下载与安装185
9.1.2Anaconda启动与运行186
9.2Jupyter编辑平台188
9.2.1Jupyter Notebook188
9.2.2Jupyter Lab193
9.2.3在Jupyter中使用R语言196
9.3Spyder分析平台197
9.3.1Spyder平台简介197
9.3.2Spyder平台使用198
附录A本书的学习网站200
附录B书中的例子数据201
附录C书中自定义函数202
参考文献205
|
內容試閱:
|
前 言
人类从农耕社会进入工业社会用了上千年时间,从工业社会进入信息社会用了一百多年时间,而从信息时代进入数据时代仅用了不到十年时间。随着互联网、物联网、云计算的不断深入应用,产生了大量的数据,这些数据的挖掘和分析应用,需要人们掌握数据分析技术。人类正全面进入大数据分析时代。
需要是发明之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是,存在大量的数据,可以被广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以应用于各种领域,包括商务管理、生产控制、市场分析、工程设计和科学探索等。
人生苦短,我要用Python,这是网上对Python评价最多的一句话,说明Python作为一种新兴的编程语言,已深入人心。现在我国许多地区高考试卷中都加入了Python编程的内容,一些中小学也开始开设Python编程课程。
本书重点介绍Python语言在数据处理与数据分析方面的应用技巧,涉及数据的整理、数据的输入和输出、探索性数据分析、基本数据分析、多元数据分析、时间序列数据分析、网络爬虫技术、社会网络分析、知识图谱和文献计量研究等数据分析方面的内容。附录中还提供了Python数据分析相关方法和函数等,方便读者随时查看。
全书分三部分,共9章内容。第一部分主要讲解数据分析基础知识,包括第1、2、3章,重点介绍数据收集与分析软件、数据挖掘的分析基础,以及简单数据的统计分析;第二部分讲解数据分析高级方法,包括第4、5章,主要介绍多元数据的综合分析和时序数据的模型分析;第三部分讲解大数据基本处理方法,包括第6、7、8章,重点介绍大数据分析基础应用、文献计量与科研评价、社会网络分析方法和数据分析编程平台。最后对Python的一些编程环境做了进一步介绍。
本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向进行数据分析的读者,能有效地帮助读者提高数据处理与分析水平,提升工作效率。本书适合各层次的数据分析用户,既可作为初学者的入门指南,又可作为中高级用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。
本书具有以下三大优点:
1使用Python科学计算发行版Anaconda,方便数据分析者使用。
读者可从https:www.anaconda.com下载安装并直接使用。
2公开本书自定义函数的源代码,使用者可以深入理解Python函数的编程技巧,用这些函数建立自己的开发包;并建立了本书的学习博客http:blog.leanote.comDaPy,书中的例子数据、习题数据及相关代码都可直接在网上下载使用。
3采用网络化教学平台。Python的基础版缺少一个面向一般人群的菜单界面,这对那些只想用其进行数据分析的使用者而言是一大困难,本书采用流行的Python网络分析平台Jupyterhttps:jupyter.org,该平台可作为数据分析教学软件使用。
书中软件输出的坐标图多数没有标出横、纵坐标的量,目的是与软件界面保持一致。
本书在写作过程中得到了广东恒电信息科技股份有限公司的大力支持,该公司将为本书的实战操作提供可靠的实训环境支持,读者可以使用恒华大数据实训管理系统完成本书的实验操作。
本书由王斌会、王术共同完成,其中第1~5章由王斌会撰写,第6~9章由王术撰写,王斌会负责全书统稿。侯雅文、谢贤芬、何志锋、颜斌、徐锋、刘霞、蒋冠莹等进行了校对,在此深表谢意!
由于作者知识和水平有限,书中难免有错误和不足之处,欢迎读者批评指正!
作 者
2019年1月于暨南园
|
|