新書推薦:
《
中国古代北方民族史丛书——东胡史
》
售價:HK$
87.8
《
巨人传(插图珍藏本)
》
售價:HK$
705.6
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:HK$
74.8
《
偿还:债务与财富的阴暗面
》
售價:HK$
78.2
《
清华大学藏战国竹简校释(壹):《命训》诸篇
》
售價:HK$
92.0
《
封建社会农民战争问题导论(光启文库)
》
售價:HK$
66.7
《
虚弱的反攻:开禧北伐
》
售價:HK$
92.0
《
泰山:一种中国信仰专论(法国汉学经典译丛)
》
售價:HK$
81.4
|
編輯推薦: |
1.内容全面
全面覆盖了机器学习的三大领域:有监督学习、无监督学习、强化学习。在分析它们的传统算法模型后,着重解析近年来取得突破的深度学习在人工智能方面的应用。
2.深入浅出
用生活化的语言描述算法与模型的原理与作用,并给出实践指导和案例解析。使得没有任何专业基础的读者在学习本书后能够独立设计与开发机器学习产品。
3.工具多样
理论内容全面,以至于没有哪个工具能够全部实现这些模型,因此在每一个模型的实践部分选取*合适的工具。总体来看,本书围绕scikit-learn与TensorFlow展开实践,并在需要时引入其他工具。
4.案例丰富
除了每个模型的小型实践,本书包括的较大案例是:金融预测、医疗诊断概率模型、月球登陆器、图像识别、写诗机器人、中国象棋博弈。
5.授人以渔
在运用到较深的理论知识或更细节的论证结果时,本书给出这些知识与结论的出处,确保读者能够追本溯源;在工具使用方面,不仅着眼于接口细节,更关注那些能使读者快速形成查阅该工具*在线文档的核心知识的能力。
|
內容簡介: |
这是一本场景式的机器学习实践书,笔者努力做到授人以渔,而非授人以鱼。理论方面从人工智能(AI)与机器学习(ML)的基本要素讲起,逐步展开有监督学习、无监督学习、强化学习这三大类模型的应用场景与算法原理;实践方面通过金融预测、医疗诊断概率模型、月球登陆器、图像识别、写诗机器人、中国象棋博弈等案例启发读者将机器学习应用在各行各业里,其中后三个案例使用了深度学习技术。本书试图用通俗的语言讲解涵盖算法模型的机器学习,主要内容包括机器学习通用概念、三个基本科学计算工具、有监督学习、聚类模型、降维模型、隐马尔可夫模型、贝叶斯网络、自然语言处理、深度学习、强化学习、模型迁移等。在深入浅出地解析模型与算法之后,介绍使用Python相关工具进行开发的方法、解析经典案例,使读者做到能理解、能设计、能编码、能调试,没有任何专业基础的读者在学习本书后也能够上手设计与开发机器学习产品。本书内容深入浅出、实例典型,适合对机器学习感兴趣的产品设计、技术管理、数据分析、软件开发或学生读者。阅读本书既能了解当前工业界的主流机器学习与深度学习开发工具的使用方法,又能从战略方面掌握如何将人工智能技术应用到自己的企业与产品中
|
關於作者: |
刘长龙,复旦大学信息管理学士学位、上海交通大学计算机技术硕士学位,从事计算机软件研发十余年。对应用软件开发有较广泛深入了解,用C、Python等技术主持负责过电信级实时计费系统、客户管理系统、智能家居、物联网云平台的研究和设计开发工作。在不写作的时候,业余时间喜欢跑步和游泳。
|
目錄:
|
目录
第1章机器学习基础1
1.1引言1
1.1.1为什么使用机器学习2
1.1.2机器学习与数据挖掘4
1.1.3机器学习与人工智能5
1.2机器学习的一般流程7
1.2.1定义问题7
1.2.2收集数据8
1.2.3比较算法与模型9
1.2.4应用模型10
1.3学习策略10
1.3.1有监督学习11
1.3.2无监督学习14
1.3.3强化学习16
1.3.4综合模型与工具18
1.4评估理论19
1.4.1划分数据集19
1.4.2交叉验证21
1.4.3评估指标22
1.4.4拟合不足与过度拟合25
1.5本章内容回顾26
第2章Python基础工具27
2.1Numpy28
2.1.1Numpy与Scipy的分工28
2.1.2ndarray构造29
2.1.3数据类型32
2.1.4访问与修改33
2.1.5轴35
2.1.6维度操作38
2.1.7合并与拆分40
2.1.8增与删41
2.1.9全函数42
2.1.10广播42
2.2Matplot43
2.2.1点线图44
2.2.2子视图50
2.2.3图像53
2.2.4等值图57
2.2.5三维绘图58
2.2.6从官网学习59
2.3Scipy60
2.3.1数学与物理常数61
2.3.2特殊函数库62
2.3.3积分64
2.3.4优化65
2.3.5插值67
2.3.6离散傅里叶68
2.3.7卷积70
2.3.8线性分析71
2.3.9概率统计73
2.4本章内容回顾77
第3章有监督学习:分类与回归79
3.1线性回归80
3.1.1何谓线性模型80
3.1.2最小二乘法81
3.1.3最小二乘法的不足82
3.1.4岭回归85
3.1.5Lasso回归87
3.2梯度下降90
3.2.1假设函数与损失函数90
3.2.2随机梯度下降92
3.2.3实战:SGDRegressor和SGDClassifier93
3.2.4增量学习94
3.3支持向量机95
3.3.1最优超平面95
3.3.2软间隔97
3.3.3线性不可分问题98
3.3.4核函数99
3.3.5实战:scikit-learn中的SVM100
3.4朴素贝叶斯分类101
3.4.1基础概率102
3.4.2贝叶斯分类原理103
3.4.3高斯朴素贝叶斯105
3.4.4多项式朴素贝叶斯106
3.4.5伯努利朴素贝叶斯107
3.5高斯过程107
3.5.1随机过程108
3.5.2无限维高斯分布109
3.5.3实战:gaussian_process工具包111
3.6决策树114
3.6.1最易于理解的模型114
3.6.2熵的作用115
3.6.3实战:DecisionTreeClassifier与DecisionTreeRegressor117
3.6.4树的可视化118
3.7集成学习119
3.7.1偏差与方差120
3.7.2随机森林121
3.7.3自适应增强124
3.8综合话题126
3.8.1参数与非参数学习127
3.8.2One-Vs-All与One-Vs-One127
3.8.3评估工具129
3.8.4超参数调试131
3.8.5多路输出134
3.9本章内容回顾134
第4章无监督学习:聚类136
4.1动机137
4.2K-means138
4.2.1算法139
4.2.2实战:scikit-learn聚类调用141
4.2.3如何选择K值144
4.3近邻算法145
4.3.1生活化的理解145
4.3.2有趣的迭代146
4.3.3实战:AffinityPropagation类147
4.4高斯混合模型149
4.4.1中心极限定理150
4.4.2最大似然估计151
4.4.3几种协方差矩阵类型152
4.4.4实战:GaussianMixture类154
4.5密度聚类156
4.5.1凸数据集157
4.5.2密度算法158
4.5.3实战:DBSCAN类159
4.6BIRCH160
4.6.1层次模型综述161
4.6.2聚类特征树162
4.6.3实战:BIRCH相关调用164
4.7距离计算166
4.7.1闵氏距离166
4.7.2马氏距离167
4.7.3余弦相似度168
4.7.4时间序列比较169
4.7.5杰卡德相似度169
4.8聚类评估170
4.9本章内容回顾172
第5章无监督学习:数据降维173
5.1主成分分析174
5.1.1寻找方差最大维度174
5.1.2用PCA降维177
5.1.3实战:用PCA寻找主成分178
5.2线性判别分析181
5.2.1双重标准181
5.2.2实战:使用LinearDiscriminantAnalysis183
5.3多维标度法185
5.3.1保留距离信息的线性变换185
5.3.2MDS的重要变形187
5.3.3实战:使用MDS类188
5.4流形学习之Isomap189
5.4.1什么是流形190
5.4.2测地线距离192
5.4.3实战:使用Isomap类193
5.5流形学习之局部嵌入195
5.5.1局部线性嵌入195
5.5.2拉普拉斯特征映射(LE)198
5.5.3调用介绍200
5.5.4谱聚类201
5.6流形学习之t-SNE203
5.6.1用Kullback-Leiber衡量分布相似度203
5.6.2为什么是t-分布205
5.6.3实战:使用TSNE类206
5.7实战:降维模型之比较207
5.8本章内容回顾210
第6章隐马尔可夫模型212
6.1场景建模213
6.1.1两种状态链213
6.1.2两种概率215
6.1.3三种问题217
6.1.4hmmLearn介绍218
6.2离散型分布算法与应用222
6.2.1前向算法与后向算法222
6.2.2MultinomialNB求估计问题226
6.2.3Viterbi算法227
6.2.4MultinomialNB求解码问题229
6.2.5EM算法232
6.2.6Baum-Welch算法233
6.2.7用hmmLearn训练数据235
6.3连续型概率分布236
6.3.1多元高斯分布237
6.3.2GaussianHMM239
6.3.3GMMHMM240
6.4实战:股票预测模型241
6.4.1数据模型241
6.4.2目标243
6.4.3训练模型243
6.4.4分析模型参数245
6.4.5可视化短线预测247
6.5本章内容回顾250
第7章贝叶斯网络251
7.1什么是贝叶斯网络252
7.1.1典型贝叶斯问题252
7.1.2静态结构253
7.1.3联合边缘条件概率换算256
7.1.4链式法则与变量消元258
7.2网络构建259
7.2.1网络参数估计260
7.2.2启发式搜索261
7.2.3Chow-Liu Tree算法262
7.3近似推理263
7.3.1蒙特卡洛方法264
7.3.2马尔可夫链收敛定理265
7.3.3MCMC推理框架267
7.3.4Gibbs采样268
7.3.5变分贝叶斯268
7.4利用共轭建模270
7.4.1共轭分布270
7.4.2隐含变量与显式变量272
7.5实战:胸科疾病诊断274
7.5.1诊断需求274
7.5.2Python概率工具包275
7.5.3建立模型276
7.5.4MCMC采样分析278
7.5.5近似推理281
7.6本章内容回顾282
第8章自然语言处理284
8.1文本建模285
8.1.1聊天机器人原理285
8.1.2词袋模型286
8.1.3访问新闻资源库287
8.1.4TF-IDF290
8.1.5实战:关键词推举290
8.2词汇处理294
8.2.1中文分词294
8.2.2Word2vec296
8.2.3实战:寻找近似词298
8.3主题模型303
8.3.1三层模型303
8.3.2非负矩阵分解304
8.3.3潜在语意分析305
8.3.4隐含狄利克雷分配307
8.3.5实战:使用工具包309
8.4实战:用LDA分析新闻库311
8.4.1文本预处理311
8.4.2训练与显示313
8.4.3困惑度调参315
8.5本章内容回顾317
第9章深度学习319
9.1神经网络基础320
9.1.1人工神经网络320
9.1.2神经元与激活函数321
9.1.3反向传播323
9.1.4万能网络325
9.2TensorFlow核心应用328
9.2.1张量329
9.2.2开发架构331
9.2.3数据管理332
9.2.4评估器335
9.2.5图与会话338
9.2.6逐代(epoch)训练341
9.2.7图与统计可视化343
9.3卷积神经网络349
9.3.1给深度学习一个理由349
9.3.2CNN结构发展351
9.3.3卷积层354
9.3.4池化层356
9.3.5ReLU与Softmax357
9.3.6Inception与ResNet359
9.4优化362
9.4.1批次规范化362
9.4.2剪枝364
9.4.3算法选择366
9.5循环神经网络与递归神经网络367
9.5.1循环神经网络368
9.5.2长短期记忆(LSTM)371
9.5.3递归神经网络374
9.6前沿精选377
9.6.1物件检测模型377
9.6.2密连卷积网络381
9.6.3胶囊网络382
9.7CNN实战:图像识别385
9.7.1开源图像库CIFAR385
9.7.2项目介绍388
9.7.3构建Graph389
9.7.4优化与训练392
9.7.5运行394
9.8RNN实战:写诗机器人397
9.8.1语言模型397
9.8.2LSTM开发步骤1:网络架构401
9.8.3LSTM开发步骤2:数据加载402
9.8.4LSTM开发步骤3:搭建TensorFlow Graph403
9.8.5LSTM开发步骤4:解析LSTM RNN404
9.8.6LSTM开发步骤5:LSTM中的参数406
9.8.7LSTM开发步骤6:用sequence_loss计算RNN损失值406
9.8.8LSTM开发步骤7:学习速度可调优化器407
9.8.9LSTM开发步骤8:训练408
9.8.10开始写唐诗410
9.8.11写唐诗步骤1:用唐诗语料训练语言模型410
9.8.12写唐诗步骤2:作诗412
9.8.13写唐诗步骤3:作品举例414
9.9本章内容回顾415
第10章强化学习418
10.1场景与原理419
10.1.1借AlphaGo谈人工智能419
10.1.2基于价值的算法Q-Learning与Sarsa421
10.1.3基于策略的算法424
10.1.4基于模型的算法426
10.2OpenAI Gym427
10.2.1环境调用428
10.2.2实战:用Q-Learning开发走迷宫机器人432
10.3深度强化学习435
10.3.1DQN及改进435
10.3.2DPN、DDPG及A3C436
10.3.3实战:用DPN训练月球定点登陆439
10.4博弈原理444
10.4.1深度搜索与广度
|
內容試閱:
|
前 言
随着越来越多的人工智能技术的突破、市场上实际产品的研发与销售,机器学习成为了当下所有高科技企业在管理、技术、运维等所有层面被高度关注的技术领域。在所有企业的产品设计论坛、技术研讨会中,人工智能与机器学习总会成为大家关注的焦点。
但是,人工智能与机器学习所获得的关注与大家对该领域知识的了解却不成正比。以笔者自身的经历来说,在顶尖高科技企业的技术研讨与分享会中,很多次被问到:
机器学习与深度学习的区别是什么?
什么是有监督学习?
人工智能能不能应用在我们的产品中?
这些问题既可以用一两句话回答,也可以用一本书来阐述。无论如何,笔者能肯定的一点是:大家对机器学习充满兴趣,但平时又忙于工作和生活,无暇系统地学习这方面的知识。
机器学习作为一个知识体系而言确实是庞大的,系统学习它至少要以扎实掌握数学和计算机本科6~7门课程为基础。但是这些课程已经让很多在校学生备受折磨,更别提终日忙于工作与家庭、已毕业多年的企业管理与工程人员了。
如何让对数学久疏战阵或者本就不擅长数学的人快速领略和掌握人工智能与机器学习的全貌呢?
本书试图用通俗的语言讲解涵盖算法模型的机器学习。更进一步地,在深入浅出解析模型与算法之后,介绍使用Python相关工具进行开发的方法、解析经典案例,使读者做到能理解,能设计、能编码、能调试,真正将机器学习应用在自己的产品之中。
本书特色
1.内容全面
全面覆盖了机器学习的三大领域:有监督学习、无监督学习、强化学习。在分析它们的传统算法模型后,着重解析近年来取得突破的深度学习在人工智能方面的应用。
2.深入浅出
用生活化的语言描述算法与模型的原理与作用,并给出实践指导和案例解析。使得没有任何专业基础的读者在学习本书后能够独立设计与开发机器学习产品。
3.工具多样
理论内容全面,以至于没有哪个工具能够全部实现这些模型,因此在每一个模型的实践部分选取最合适的工具。总体来看,本书围绕scikit-learn与TensorFlow展开实践,并在需要时引入其他工具。
4.案例丰富
除了每个模型的小型实践,本书包括的较大案例是:金融预测、医疗诊断概率模型、月球登陆器、图像识别、写诗机器人、中国象棋博弈。
5.授人以渔
在运用到较深的理论知识或更细节的论证结果时,本书给出这些知识与结论的出处,确保读者能够追本溯源;在工具使用方面,不仅着眼于接口细节,更关注那些能使读者快速形成查阅该工具最新在线文档的核心知识的能力。
本书内容体系
虽然本书每章有明确的主题内容,但知识体系有轻微依赖关系,因此对于普通读者来说建议按编排顺序阅读。对于有特定需求的读者,可以按照下图寻找学习路径。
除了第2章,学习上图中任何一个模块前,都建议以其上方的章节为基础。第2章介绍的是后续其他章节里实践所依赖的Python基础工具,对于只关注模型场景与原理的读者可将其跳过。
从图中可以看到,除了基础的第1、2章,本书由3条学习线组成。
(1)第3、9、10、11章
第3章以scikit-learn为工具介绍有监督学习的传统模型;第9章是本书篇幅最大的一章,以TensroFlow为工具学习近年来发展最快的深度学习模型,因为其与第8章有少量关联,所以放在了第9章;第10章学习强化学习传统算法与深度学习算法;第11章简单介绍深度学习模型的迁移方法。
(2)第4、5章
用scikit-learn讲解无监督学习模型原理、算法与应用。无监督学习中最主要的两部分是聚类与降维,在讲解过程中比较了每个模型的优势与劣势。
(3)第6、7、8章
讲解概率类机器学习模型的原理与实战。第6章作为入门使读者领略概率模型的特点;第7章全面介绍贝叶斯类算法的基本知识和简单实践;第8章的重点是LDA主题模型,以第7章的内容为基础。
只要按照图中的顺序学习,几乎不需要任何基础就可以掌握图中所有机器学习领域的基本方法,为今后在这方面进行研究与工作打下坚实的基础。
本书读者
本书几乎适合任何对机器学习感兴趣的读者,比较典型的是:
产品设计经理。
技术管理者。
信息技术创业者。
数据分析员。
软件开发人员。
在校学生。
另外,如果您已经是机器学习领域的资深研究者,能看懂相关论文,或正准备在专业杂志上发表这方面的论文,可能这本书会不那么适合你。谨此说明。
感谢
感谢您的信任,如果阅读这本书能启发您获得新的灵感,那是我最大的荣幸。同时也因为本人水平有限,书中内容有疏漏之处也请赐教和包涵。
轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面。
下载资源:本书如提供示例代码及资源文件,均可在 下载资源 处下载。
提交勘误:您对书中内容的修改意见可在 提交勘误 处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。
交流互动:在页面下方 读者评论 处留下您的疑问或观点,与我们和其他读者一同学习交流。
页面入口:http:www.broadview.com.cn35518
|
|