新書推薦:

《
清华简《系年》综合研究(全二册)
》
售價:HK$
552.2

《
微渺人生
》
售價:HK$
80.2

《
具身情绪:如何借助身体化解情绪困境
》
售價:HK$
105.0

《
卢浮幽灵
》
售價:HK$
82.6

《
思接千载:115件文物里的古代中国
》
售價:HK$
269.0

《
AI伴学:让AI成为孩子学习和成长的智能助手
》
售價:HK$
70.6

《
经济运行的逻辑(精装)
》
售價:HK$
108.9

《
文化中国研究丛书 公众舆论与北洋外交
》
售價:HK$
60.5
|
內容簡介: |
本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
來源:香港大書城megBookStore,http://www.megbook.com.hk *章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。
本书的*、二章是基础,三至八章分别介绍了大数据处理的某一环节。这些章节的内容相互独立,读者在自学时可根据兴趣和时间调整学习顺序或内容。
本书适合本科院校大数据专业的学生使用。
|
|