新書推薦:
《
慢慢变富66招
》
售價:HK$
53.8
《
战国竹书复原综论
》
售價:HK$
98.6
《
走出内心的深渊:快节奏人群心理疾病与健康指南(原书第3版)
》
售價:HK$
77.3
《
如何成为一家千亿公司
》
售價:HK$
76.2
《
趋势跟踪: 汤姆·巴索的交易谋略
》
售價:HK$
77.3
《
滚滚红尘(《滚滚红尘》电影原著)
》
售價:HK$
54.9
《
罗马之变(法语直译,再现罗马共和国走向罗马帝国的辉煌历史)
》
售價:HK$
109.8
《
自然之争:1600年以来苏格兰和英格兰北部地区的环境史(新史学译丛)
》
售價:HK$
106.4
|
內容簡介: |
本书旨在为已有一定基础的R用户提供现成的方法来实现重要的数据分析任务。全书共分为11章。第1章涵盖了进行真正的数据分析任务之前的准备工作。第2章讨论了数据分析师在实施特定的分析手段之前常用的理解数据的做法。第3章涵盖了运用分类技术肚饿方法。第4章是关于回归技术的方法。第5章介绍数据简化。第6章介绍时间序列分析。第7章讨论了社交网络分析。第8章介绍制作文档和呈现分析的方法。第9章解决了面对大型数据如何书写高效且简洁的R代码的问题。第10章讨论了R在处理空间数据上的强大功能。第11章介绍了R与其他系统的连接。
|
關於作者: |
Abut the Authors 作 者 简 介Viswa Viswanathan是西顿霍尔大学斯蒂尔曼商学院计算和决策科学系的一名副教授。在获得人工智能领域的博士学位之后,Viswa先从事了十多年学术工作,接下来的十几年在软件行业高就。在这段时间中,他曾就职于Infosys、Igate和Starbase公司。他于2011年重新回归学术界。 Viswa在非常广泛的领域中开展教学,包括运筹学、计算机科学、软件工程、管理信息系统,以及企业系统。除了在大学中教学之外,Viswa还负责专业人士的培训项目。他有多篇同行评议的研究论文发表在《Operations Research》《IEEE Software》《Computers and Industrial Engineering》以及《International Journal of Artificial Intelligence in Education》等期刊上。他也编写了《Data Analytics with R: A hands-on approach》一书。 Viswa非常享受亲自动手开发软件的过程,并且独立构思、搭建、开发、部署了几个基于网络的应用程序。 除了对数据分析、人工智能、计算机科学、软件工程等技术领域有深厚的兴趣之外,Viswa也对教育有浓厚的兴趣,特别关注学习的根源和培养更深入学习的方法。他已经在这个领域做了不少研究并希望在未来继续研究这一学科。 Viswa想对Amitava Bagchi 和 Anup Sen教授表示由衷的感激,他们在Viswa的早期研究生涯中鼓舞了他。同时,他也很感激几个非常聪明的同事,比如Rajesh Venkatesh、Dan Richner和Sriram Bala,他们极大地影响了他的思想。他的婶婶Analdavalli,他的姐妹Sankari,以及他的妻子Shanthi,在辛勤工作上教会了他很多,即便他只吸收了一点皮毛也觉得受益匪浅。他的儿子Nitin 和 Siddarth也在很多主题上给出了不计其数的深刻评论。 Shanthi Viswanathan是一位经验丰富的技术专家,她为许多企业客户提供技术管理和企业结构咨询。她曾工作于Infosys、Oracle和Accenture公司。作为一名顾问,Shanthi为一些大型机构,比如Canon、Cisco、Celgene、Amway、Time Warner Cable 和 GE等,在数据架构和分析,高级数据管理,面向服务的架构,商业流程管理,以及建模等方面提供帮助。当她空闲时,Shanthi会在纽约州和新泽西州的郊外徒步旅行,摆弄园艺,以及教授瑜伽。 Shanthi想要感谢她的丈夫Viswa,在他们一起徒步旅行时关于各种主题展开的深入讨论;以及将她带入R和Java的世界。她也要感谢她的儿子Nitin 和 Siddarth使她进入了数据分析领域。
|
目錄:
|
目录 Contents译者序作者简介审校者简介前言第1章 获取并准备好材料—数据11.1 引言11.2 从csv文件中读取数据11.3 读取XML数据41.4 读取JSON数据61.5 从定宽格式文件中读取数据71.6 从R数据文件和R库中读取数据81.7 删除带有缺失值的样本101.8 用均值填充缺失值111.9 删除重复样本131.10 将变量缩放至[0,1]区间141.11 对数据框中的数据做正则化或标准化151.12 为数值数据分箱171.13 为分类变量创建哑变量18第2章 那里面有什么——探索性数据分析212.1 引言212.2 创建标准化数据概览212.3 抽取数据集的子集232.4 分割数据集252.5 创建随机数据分块262.6 创建直方图、箱线图、散点图等标准化图像292.7 在网格窗口上创建多个图像372.8 选择图形设备382.9 用lattice包绘图392.10 用ggplot2包绘图422.11 创建便于比较的图表472.12 创建有助于发现因果关系的图表512.13 创建多元图像53第3章 它属于哪儿——分类技术553.1 引言553.2 创建误差分类–混淆矩阵553.3 创建ROC图583.4 构建、绘制和评估—分类树613.5 用随机森林模型分类 663.6 用支持向量机分类693.7 用朴素贝叶斯分类723.8 用K最近邻分类743.9 用神经网络分类773.10 用线性判别函数分类793.11 用逻辑回归分类803.12 用AdaBoost来整合分类树模型83第4章 给我一个数——回归分析864.1 引言864.2 计算均方根误差864.3 建立用于回归的KNN模型884.4 运用线性回归944.5 在线性回归中运用变量选择994.6 建立回归树1024.7 建立用于回归的随机森林模型1084.8 用神经网络做回归1124.9 运用K-折交叉验证1144.10 运用留一交叉验证来限制过度拟合116第5章 你能化简它吗——数据简化技术1185.1 引言1185.2 用K-均值聚类法实现聚类分析1185.3 用系统聚类法实现聚类分析1245.4 用主成分分析降低维度127第6章 从历史中学习——时间序列分析1346.1 引言1346.2 创建并检查日期对象1346.3 对日期对象进行操作1386.4 对时间序列数据做初步分析1406.5 使用时间序列对象1436.6 分解时间序列1496.7 对时间序列数据做滤波1516.8 用HoltWinters 方法实现平滑和预测1526.9 创建自动的ARIMA模型155第7章 这都是你的关系——社交网络分析1577.1 引言1577.2 通过公共API下载社交网络数据1577.3 创建邻接矩阵和连边列表1617.4 绘制社交网络数据1647.5 计算重要的网络度量指标176第8章 展现你最好的一面——制作文档和呈现分析报告1828.1 引言1828.2 用R Markdown 和 knitR创建数据分析报告1828.3 用shiny创建交互式Web应用1918.4 用R Presentation为分析报告创建PDF幻灯片196第9章 事半功倍——高效且简洁的R代码2019.1 引言2019.2 利用向量化操作2019.3 用apply函数操作整行或整列2039.4 用lapply和sapply将函数应用于整组元素2069.5 在向量的一个子集上应用函数2089.6 用plyr完成分割–应用–组合策略2109.7 用数据表对数据进行切片、切块和组合213第10章 在哪儿——地理空间信息数据分析21910.1 引言21910.2 下载并绘制一个地区的谷歌地图21910.3 在已下载的谷歌地图上叠加数据22210.4 将ESRI形状文件导入到R中22410.5 使用sp包绘制地理数据22610.6 从maps包中获取地图22810.7 从包含空间及其他数据的普通数据框中创建空间数据框22910.8 通过合并普通数据框和空间对象生成空间数据框23010.9 为已有的空间数据框添加变量234第11章 友好协作——连接到其他系统23711.1 引言23711.2 在R中使用Java对象23711.3 从Java中用JRI调用R函数24311.4 从Java中用Rserve调用R函数24511.5 从Java中执行R脚本24811.6 使用xlsx包连接到Excel24911.7 从关系型数据库—MySQL中读取数据25211.8 从非关系型数据库—MongoDB中读取数据256
|
|