登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書

『簡體書』Spark大数据实例开发教程

書城自編碼: 2698950
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: 王家林 等编著
國際書號(ISBN): 9787111519096
出版社: 机械工业出版社
出版日期: 2016-01-01

頁數/字數: 332页
書度/開本: 16开 釘裝: 平装

售價:HK$ 88.5

我要買

share:

** 我創建的書架 **
未登入.


新書推薦:
中国传统药食同源物质图典
《 中国传统药食同源物质图典 》

售價:HK$ 250.8
文化模式
《 文化模式 》

售價:HK$ 96.8
TensorFlow自然语言处理及应用
《 TensorFlow自然语言处理及应用 》

售價:HK$ 75.9
信托法(第五版)
《 信托法(第五版) 》

售價:HK$ 184.8
敦煌究竟有多美
《 敦煌究竟有多美 》

售價:HK$ 97.9
我在唐朝穿什么(图解中国传统服饰 服饰搭配 汉服研究 古代服饰)
《 我在唐朝穿什么(图解中国传统服饰 服饰搭配 汉服研究 古代服饰) 》

售價:HK$ 96.8
优化你的2小时 : 基于神经科学和能量流的时间管理方法
《 优化你的2小时 : 基于神经科学和能量流的时间管理方法 》

售價:HK$ 54.9
经典与经学
《 经典与经学 》

售價:HK$ 85.8

 

建議一齊購買:

+

HK$ 118.5
《Spark MLlib机器学习:算法、源码及实战详解》
+

HK$ 88.5
《Spark大数据分析实战》
+

HK$ 103.5
《Spark核心技术与高级应用》
+

HK$ 109.2
《Spark机器学习》
+

HK$ 109.2
《Spark高级数据分析》
+

HK$ 90.7
《Spark MLlib机器学习实践》
內容簡介:
王家林、徐香玉等编*的《Spark大数据实例开发教程》是面向Spark开发者的一本实用参考书,书中结合实例系统地介绍了Spark的开发与使用。
本书包括5章内容,第1章为spark简介;第2章为 Spark RDD实践案例与解析;第3章为spark SQL实践案例与解析;第4章为Spark Streaming实践案例与解析;第5章为Tachyon实战案例与解析。在全书*后的附录部分介绍了Spark1.4版本的新特性。
本书适合刚接触spark或对Spark分布式计算的开发不熟悉的初学者学习。对于熟悉函数式开发或面向对象开发,并有一定经验的开发者,本书也可以作为参考书。
目錄
前言
第1章 Spark简介
1.1 什么是spark
1.2 Spark生态圈
1.2.1 伯克利数据分析协议栈
1.2.2 Spark开源社区发展
1.3 RDD编程模型
1.3.1 RDD抽象概念
1.3.2 RDD的操作
1.3.3 RDD的依赖关系
1.3.4 一个典型的DAG示意图
第2章 Spark RDD实践案例与解析
2.1 Spark应用程序部署
2.1.1 Spark应用的基本概念
2.1.2 应用程序的部署方式
2.2 RDD数据的输入、处理、输出的基本案例与解析
2.2.1 集群环境的搭建
2.2.2 交互式工具的启动
2.2.3 文本数据的ETL案例实践与解析
2.2.4 文本数据的初步统计案例实践与解析
2.2.5 文本数据统计结果的持久化案例实践与解析
2.2.6 RDD的Lineage关系的案例与源码解析
2.2.7 RDD的持久化案例与解析
2.2.8 RDD的构建案例与解析
2.2.9 分区数设置的案例与源码解析
2.3 RDD API的应用案例与解析
2.3.1 如何查找RDD API的隐式转换
2.3.2 RDD[T]的分区相关的API
2.3.3 RDD[T]常用的聚合API
2.3.4 DoubleRDDFunctionsself:RDD[Double]常用的API
2.3.5 PairRDDFunctions[K,V]聚合相关的API
2.3.6 RDD相互间操作的API
2.3.7 PairRDDFunctions[K,V]间的相关API
2.3.8 OrderedRDDFunctions[K,V,P:Product2[K,V]]常用的API
2.4 Spark应用程序构建
2.4.1 基于SBT构建Spark应用程序的实例
2.4.2 基于IDEA构建Spark应用程序的实例
2.4.3 Spark提交应用的调试实例
2.5 移动互联网数据分析案例与解析
2.5.1 移动互联网数据的准备
2.5.2 移动互联网数据分析与解析
2.6 Spark RDD实践中的常见问题与解答
第3章 Spark SQL实践案例与解析
3.1 Spark SQL概述
3.2 DataFrame处理的案例与解析
3.2.1 DataFrame编程模型
3.2.2 DataFrame基本操作案例与解析
3.2.3 DataFrame与RDD之间的转换案例与解析
3.2.4 缓存表列式存储的案例与解析
3.2.5 DataFrame API的应用案例与分析
3.3 Spark SQL处理各种数据源的案例与解析
3.3.1 通用的加载/保存功能的案例与解析
3.3.2 Parquet文件处理的案例与解析
3.3.3 JSON数据集操作的案例与解析
3.3.4 操作Hive表的案例与解析
3.3.5 使用JDBC操作其他数据库的案例与解析
3.3.6 集成Hive数据仓库的案例与解析
3.4 基于Hive的人力资源系统数据处理案例与解析
3.4.1 人力资源系统的数据库与表的构建
3.4.2 人力资源系统的数据的加载
3.4.3 人力资源系统的数据的查询
第4章 Spark Streaming实践案例与解析
4.1 Spark Streaming概述
4.2 Spark Streaming基础概念
4.3 企业信息实时处理的案例与解析
4.3.1 处理TCP数据源的案例与解析
4.3.2 处理HDFS文件数据源的案例与解析
4.3.3 处理Kafka数据源的准备工作
4.3.4 基于Receiver读取Kafka数据的案例与解析
4.3.5 直接读取无ReceiverKafka数据的案例与解析
4.3.6 处理Flume数据源的实践准备
4.3.7 基于Flume风格的推送数据案例与解析
4.3.8 定制FlumeSink的拉取数据案例与解析
4.4 性能调优
4.4.1 减少批处理的时间
4.4.2 设置正确的批间隔
4.4.3 内存调优
第5章 Tachyon实践案例与解析
5.1 Taclayon概述
5.2 重新编译部署包
5.2.1 重新编译Tachyon的部署包
5.2.2 重新编译Spark的部署包
5.3 Taclayon部署的案例与解析
5.3.1 单机模式部署的案例与解析
5.3.2 集群模式部署的案例与解析
5.3.3 集群Master容错部署的案例与解析
5.4 Taclayon配置的案例与解析
5.4.1 底层存储系统的配置案例与解析
5.4.2 配置属性与解析
5.5 命令行接口的案例与解析
5.5.1 命令行接口的说明
5.5.2 命令行接口的案例实践与解析
5.6 同步底层文件系统的案例与解析
5.6.1 同步HDFS底层文件系统的案例与解析
5.6.2 同步本地底层文件系统的案例与解析
5.7 基于Tachyon运行的案例与解析
5.7.1 基于Tachyon运行Spark的案例与解析
5.7.2 基于Tachyon运行Hadoop MR的案例与解析
附录 Spark 1.4版本新特性

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.