新書推薦:

《
结构 Structures(埃隆马斯克推荐读物之一,经典又实用的结构力学普及读物)
》
售價:HK$
93.2

《
影响世界的十八个定律:破解万物运行规律人类,如何用公式定义世界?
》
售價:HK$
65.8

《
道教大辞典·道教百科全书(通识版本+飞机盒): 附赠32张海报:神仙谱系大全x1、道教宗派与法术全鉴x1、时间线上的道教史x1
》
售價:HK$
327.8

《
伦理学与生活(第11版)
》
售價:HK$
118.8

《
巴格达新版 和平之城 血腥之城 汗青堂丛书055
》
售價:HK$
118.8

《
水之契约
》
售價:HK$
79.2

《
ABB工业机器人离线编程与仿真
》
售價:HK$
130.9

《
工厂生产计划精细化、精益化、精进化管理手册
》
售價:HK$
75.9
|
編輯推薦: |
通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。
你将接触到Spark的基本操作和常用函数,还包括一种全新的构建端到端流数据应用的结构化流处理API。开发人员和系统管理员将了解到Spark的监控、调优,以及调试的原则和方法,并通过使用Spark提供的可扩展机器学习库Mllib来了解机器学习算法的实现技术。
|
內容簡介: |
通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。
來源:香港大書城megBookStore,http://www.megbook.com.hk 本书的主要内容有:
大数据技术和Spark概述。
通过实例学习DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。
了解Spark如何在集群上运行。
Spark集群和应用程序的调试、监控、和调优。
学习Spark强大的流处理引擎结构化流处理。通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。
本书的主要内容有:
大数据技术和Spark概述。 通过实例学习DataFrame、SQL、Dataset等Spark的核心API。 了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。 了解Spark如何在集群上运行。 Spark集群和应用程序的调试、监控、和调优。 学习Spark强大的流处理引擎结构化流处理。 学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。
|
關於作者: |
Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客, 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位, 研究方向为数据科学。Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。
|
|