新書推薦:
《
我们终将老去:认识生命的第二阶段(比利时的“理查德·道金斯”,一位行为生物学家的老年有用论
》
售價:HK$
91.8
《
祛魅:对世界祛魅是一个人变强的开始
》
售價:HK$
62.7
《
家族财富传承
》
售價:HK$
154.6
《
谁是窃书之人 日本文坛新锐作家深绿野分著 无限流×悬疑×幻想小说
》
售價:HK$
55.8
《
一个经济杀手的自白 第3版
》
售價:HK$
110.9
《
8秒按压告别疼痛
》
售價:HK$
87.4
《
津巴多时间心理学:挣脱束缚、改写命运的6种时间观
》
售價:HK$
77.3
《
大英博物馆东南亚简史
》
售價:HK$
177.0
|
編輯推薦: |
采用MBA个案模式,配合Python教学代码,由浅入深,结合实盘案例,举一反三。无须专业编程基础,懂Excel即可开始学习。
|
內容簡介: |
本书采用Python编程语言、Pandas数据分析模块、机器学习和人工智能算法,对足彩大数据进行实盘分析。设计并发布了开源大数据项目zc-dat足彩数据包,汇总了2010—2016年全球5万余场足球比赛的赛事和赔率数据,包括威廉希尔、澳门、立博、Bet365、Interwetten、SNAI、皇冠、易胜博、伟德、必发等各大赔率公司。介绍了如何使用Python语言抓取网页数据,下载更新zc-dat足彩数据包,并预测分析比赛获胜球队的取胜概率,同时提出了检测人工智能算法优劣的“足彩图灵”法则。
|
關於作者: |
何海群,网名:字王,CHRD前海智库CTO,《中华大字库》发明人,出版书籍20余部,在人工智能、数据分析等方面具有20年一线专业经验;zwPython开发平台、zwQuant量化软件设计师,中国“Python创客”项目和“Python产业联盟”发起人,国内首个Python量化课程:《Python量化实盘·魔鬼训练营》创始人,极宽量化开源团队的创始人。1990年,发明国内第一个VR数据手套并获得专利授权,被业界称为“中国VR之父”;1992年,论文《人工智能与中文字型设计》入选《广东青年科学家文集》,现已成为中文字库行业三大基础建模理论之一;1997年,出版国内首部网络经济专著《网络商战》;2008年,在北京联合创办国内首家4A级网络公关公司,服务过200余家国际五百强企业,被公关协会誉为:中国网络公关事业的开创者与启蒙者;2012年,发布国内首个自主研发的智能中文字库设计软件《x2ttf涂鸦造字》,全功能全免费公益软件;2016年,推出国内首套纯python开源量化软件:zwQuant,以及国内首个Tick级别开源金融大数据项目:zwDat金融数据包。研究成果有:“小数据”理论,快数据模型,黑天鹅算法,GPU超算工作站、MTRD多节点超算集群算法、“1+N”网络传播模型、人工智能“足彩图灵法则”等。
|
目錄:
|
第1章足彩与数据分析1
1.1 阿尔法狗与足彩1
1.2案例1-1可怕的英国足球3
1.3关于足彩的几个误区7
1.4足彩 大事件8
1.5大数据图灵(足彩)原则10
1.6主要在线彩票资源11
1.7主要在线足彩数据源15
1.8足彩基础知识17
1.9学习路线图18
第2章开发环境19
2.1数据分析首选Python19
2.1.1大数据,why Python19
2.1.2入门简单,功能强大21
2.1.3难度降低90%,性能提高10倍23
2.1.4 零对象编程模式24
2.2用户运行平台25
2.3程序目录结构26
2.4tfbDat足彩数据包27
2.5Spyder编辑器界面设置28
2.5.1开发环境界面设置28
2.5.2代码配色技巧29
2.5.3图像显示配置31
2.5.4重剑无锋32
2.6Notebook模式34
2.7模块库控制面板36
2.7.1模块库资源37
2.7.2模块库维护更新37
2.7.3系统关联38
2.8使用pip命令更新模块库39
2.8.1pip常用命令39
2.8.2进入Python命令行模式41
2.8.3pip安装模板41
2.8.4pip参数解释42
2.8.5pip-install参数选项43
第3章入门案例套餐45
3.1案例3-1第一次编程,hello,ziwang45
3.1.1简单调试46
3.1.2控制台复位47
3.2 案例3-2增强版hello,zwiang47
3.3案例3-3列举系统模块库清单49
3.4案例3-4常用绘图风格50
3.5 案例3-5Pandas常用绘图风格52
3.6案例3-6常用颜色表cors53
第4章足彩量化分析系统55
4.1 功能简介55
4.1.1目录结构56
4.1.2TFB安装与更新56
4.2TFB主体框架57
4.2.1模块构成57
4.2.2Top-Base极宽基础模块库57
4.2.3Top-Football极宽足彩专业模块库58
4.2.4tfbDat极宽足彩数据包59
4.2.5量化系统模块构成60
4.2.6案例4-1赔率文件切割61
4.2.7案例4-2批量切割数据文件64
4.3tfbDat数据结构66
4.3.1案例4-3tfb数据格式67
4.3.2gid基本比赛数据格式67
4.3.3xdat赔率数据格式69
4.4足彩基本数据分析73
4.4.1案例4-4比赛数据基本图表分析73
4.4.2案例4-5比赛数据进阶图表分析77
4.4.3案例4-6 比赛数据年度图表分析80
4.4.4案例4-7比赛数据时间细分图表分析81
4.5胜、平、负数据分析88
4.5.1案例4-8胜、平、负数据分析88
4.5.2@修饰符88
4.5.3胜平负分析90
4.6赔率数据分析91
4.6.1案例4-9赔率分析91
4.6.2扩充dr_gid_top10绘图函数92
4.6.3赔率对比93
第5章常用数据分析工具96
5.1Pandas数据分析软件96
5.1.1Python简介96
5.1.2案例5-1Pandas常用统计功能99
5.2科学计算104
5.3人工智能105
5.4NLTK语义分析107
5.5数据清洗统计分析109
5.6数据可视化109
第6章辅助工具114
6.1性能优化114
6.1.1numexpr矢量加速库115
6.1.2Numba支持GPU的加速模块库115
6.1.3Blaze大数据优化模块库115
6.1.4Pyston加速模块116
6.1.5PyPy加速模块116
6.1.6Cython116
6.1.7其他优化技巧117
6.2网页信息抓取117
6.2.1Requests人性化的网络模块118
6.2.2Scrapy网页爬虫框架118
6.2.3Beautiful Soup 4119
6.3其他工具模块120
6.3.1Logging日志模块120
6.3.2Debug调试工具121
6.3.3re正则表达式121
6.3.4并行编程122
6.4网络辅助资源123
6.5arrow优雅简洁的时间模块库125
6.5.1案例2-2,arrow入门案例126
6.5.2创建arrow时间对象128
6.5.3创建时间戳128
6.5.4arrow属性129
6.5.5replace替换和shift位移130
6.5.6format格式化参数130
6.5.7时间转换131
6.5.8短命令131
6.5.9人性化131
6.5.10范围和跨度132
6.5.11工厂模式133
6.5.12Tokens特殊字符133
第7章网络足彩数据抓取135
7.1500彩票网站数据接口的优势135
7.1.1案例7-1抓取赔率数据网页136
7.1.2网页数据实战操作技巧139
7.2网页解析的心灵鸡汤141
7.2.1BS4四大要素三缺一142
7.2.2Tag标签对象142
7.2.3案例7-2Tag标签对象142
7.2.4案例7-3Tag标签对象数据类型145
7.2.5NavigableString导航字符串149
7.2.6BeautifulSoup复合对象149
7.2.7Comment注释对象150
7.2.8案例7-4bs4常用查找功能150
7.2.9BS4节点遍历功能154
7.3足彩基本数据抓取155
7.3.1案例7-5分析网页比赛数据155
7.3.2案例7-6提取网页比赛数据157
7.3.3gid比赛基本数据结构159
7.3.4案例7-7提取比赛得分161
7.3.5案例7-8提取球队id编码164
7.3.6案例7-9抓取历年比赛数据167
7.3.7案例7-10流程图工具与Python171
7.3.8实盘技巧172
7.3.9案例7-11进程池并发运行174
7.4批量抓取足彩网页数据实盘教程177
7.4.1案例7-12批量抓取赔率数据177
7.4.2fb_gid_getExt扩展网页下载函数178
7.4.3bars节点数据包与pools彩票池178
7.4.4抓取扩展网页180
7.5足彩赔率数据抓取181
7.5.1gid与赔率数据网页181
7.5.2案例7-13提取赔率数据184
7.5.3赔率数据与结构化数据186
7.5.4瀑布流数据网页与小数据理论189
第8章足彩数据回溯测试191
8.1TFB系统构成192
8.1.1TFB系统模块结构192
8.1.2Top-Base通用基础模块库192
8.1.3Top-Football极宽足彩专业模块库193
8.2实盘数据更新194
8.2.1案例8-1实盘数据更新194
8.2.2实盘要点:冗余195
8.2.3实盘要点:耐心196
8.2.4实盘要点:数据文件197
8.2.5main_get函数197
8.3变量初始化199
8.3.1全局变量与类定义201
8.3.2彩票池内存数据库202
8.3.3内存数据库&数据包204
8.4回溯测试205
8.4.1案例8-3回溯206
8.4.2main_bt回溯主入口207
8.4.3案例8-4实盘回溯209
8.4.4彩票池与统计池211
8.4.5poolTrd下单交易数据212
8.4.6poolRet回报记录数据213
8.4.7实盘足彩推荐分析214
8.4.8实盘回报分析214
8.4.9全数据分析与足彩数据集215
8.5bt_main回溯主函数216
8.5.1bt_1dayMain单天回溯分析218
8.5.2赔率数据合并函数219
8.5.3单天回溯分析函数220
8.5.4单日回报分析221
8.5.5单场比赛分析223
8.6sta01策略的大数据分析224
8.6.1一号策略函数226
8.6.2超过100%的盈利策略与秘诀227
8.6.3统计分析228
8.6.4回溯时间测试229
8.6.5bt_main_ret总回报分析230
第9章参数智能寻优232
9.1一元参数寻优233
9.1.1一号策略参数寻优233
9.1.2一元测试函数234
9.1.3测试结果数据格式236
9.1.4案例9-2一元参数图表分析237
9.2策略函数扩展241
9.2.1扩展一号策略函数241
9.2.2案例9-3一号扩展策略242
9.2.3案例9-4sta10策略244
9.3二元参数寻优246
9.3.1案例9-5 sta10参数寻优246
9.3.2案例9-6二元参数图表分析248
9.4策略310准多因子策略252
9.4.1案例9-7数据预处理254
9.4.2案例9-8 策略310参数寻优257
9.4.3案例9-9策略310图表分析259
9.4.4案例9-10策略310264
第10章Python人工智能入门与实践266
10.1从忘却开始入门266
10.2Iris(爱丽丝)269
10.2.1案例10-1:经典爱丽丝270
10.2.2案例10-2:爱丽丝进化与矢量化文本272
10.3AI标准流程273
10.3.1机器学习与测试数据集合274
10.3.2机器学习运行流程274
10.3.3经典机器学习算法275
10.3.4黑箱大法275
10.3.5数据切割函数276
10.3.6案例10-3:爱丽丝分解277
10.3.7案例10-4:线性回归算法281
第11章机器学习经典算法案例(上)286
11.1线性回归286
11.2逻辑回归算法293
11.3朴素贝叶斯算法296
11.4KNN近邻算法299
11.5随机森林算法302
第12章机器学习经典算法案例(下)308
12.1决策树算法308
12.2GBDT迭代决策树算法311
12.3SVM向量机313
12.4SVM-cross向量机交叉算法316
12.5神经网络算法318
12.5.1经典神经网络算法318
12.5.2Sklearn神经网络算法320
12.5.3人工智能学习路线图320
12.5.4案例12-5:MLP神经网络算法321
12.5.5案例12-6:MLP_reg神经网络回归算法323
第13章机器学习组合算法326
13.1CCPP数据集326
13.1.1案例13-1:CCPP数据集327
13.1.2案例13-2CCPP数据切割328
13.1.3数据切割函数330
13.1.4案例13-3 读取CCPP数据集331
13.1.5数据读取函数333
13.2机器学习统一接口函数334
13.2.1案例13-4机器学习统一接口334
13.2.2统一接口函数336
13.2.3机器学习算法代码338
13.2.4效果评估函数339
13.2.5常用评测指标340
13.3批量调用机器学习算法341
13.3.1案例13-5 批量调用341
13.3.2批量调用算法模型344
13.4一体化调用345
13.4.1案例13-6一体化调用345
13.4.2一体化调用函数346
13.5模型预制与保存348
13.5.1案例13-7储存算法模型348
13.5.2模型保存函数350
13.5.3 模型预测函数 35013.5.4 案例13-8批量储存算法模型 351
13.5.5 批量模型储存函数 353
13.5.6 案例13-9 批量加载算法模型 353
13.6 机器学习组合算法 357
13.6.1 案例13-10 机器学习组合算法 357
13.6.2 机器学习组合算法函数 359
第14章 足彩机器学习模型构建 361
14.1 数据整理 36114.1.1 案例14-1 赔率数据合成 362
14.1.2 案例14-2 按年切割赔率数据 36514.1.3 案例14-3 累计切割赔率数据 365
14.2 年度足彩赔率模型 366
14.2.1 案例14-4 年度2016足彩赔率模型组 367
14.2.2 案例14-5 年度多字段足彩赔率模型组 370
14.3 累计足彩赔率模型 373
14.3.1 案例14-6 累计2016足彩赔率模型组 373
14.3.2 案例14-7 累计多字段足彩赔率模型组 376
14.3.3 足彩算法模型文件 379
第15章 足彩机器学习模型验证 381
15.1 年度赔率模型验证 381
15.1.1 案例15-1 年度赔率模型验证 381
15.1.2 案例15-2 多字段年度赔率模型验证 383
15.2 累计赔率模型验证 385
15.2.1 案例15-3 累计赔率模型验证 385
15.2.2 案例15-4 多字段累计赔率模型验证 386
15.3 年度组合模型验证 388
15.3.1 案例15-5 年度组合模型验证 388
15.3.2 案例15-6 多字段年度组合模型验证 391
15.3.3 案例15-7 全字段年度组合模型验证 391
15.3.4 测试数据对比分析 392
15.4 累计组合模型验证 393
15.4.1 案例15-8 年度组合模型验证 393
15.4.2 案例15-9 多字段年度组合模型验证 394
15.4.3 测试数据对比分析 394
第16章 结果数据分析 397
16.1 神秘的df9 397
16.1.1 案例16-1 调试模式 397
16.1.2 神秘的df9 400
16.2 盈利率分析 402
16.2.1 案例16-2 盈利率计算 402
第17章 机器学习足彩实盘分析 407
17.1 回溯主入口 408
17.1.1 案例17-1 策略sta01 409
17.1.2 结果文件解读 409
17.1.3 数据字段分析 411
17.2 机器学习与回溯分析 412
17.2.1 案例17-2 log回归策略足彩分析 414
17.2.2 log回归策略函数 415
17.2.3 案例17-3 30天log回归策略足彩分析 418
17.2.4 数据字段分析 420
17.2.5 足彩推荐 421
17.3 进一步深入 421
附录A Sklearn常用模块和函数 423
|
內容試閱:
|
前 言
从足彩到量化,再从量化到足彩。
生命总是在轮回中,不断完成自我突破与成长壮大。
本书《Python足彩大数据与机器学习实盘分析》,是笔者《Python量化三部曲》的补充部分。
《Python量化三部曲》
《Python量化三部曲》包括:
《零起点Python大数据与量化交易》(入门课程)。
《零起点Python量化与机器学习实盘分析》(重点分析sklean)。
《零起点Python量化与Tensorflow学习实盘分析》(重点分析Tensorflow)。
此外还有两部补充作品:
《零起点Python足彩大数据与机器学习实盘分析》。
零起点Python机器学习快速入门》。
最好的Python机器学习入门教程
本书的机器学习算法章节,可能是目前最好的Python机器学习入门教程:
独创的黑箱教学模式,全书无任何抽象理论和深奥的数学公式。
首次系统化融合sklearn人工智能软件和pandas数据分析软件,无需直接使用复杂的numpy数学矩阵模块。
三位一体的课件模式:图书 开发平台 成套的教学案例,系统讲解,逐步深入。
业内第一个系统化的sklearn函数和API中文文档,可作为案头工具书,随时查阅。
基于sklearn pandas模式,无需任何理论基础,全程采用MBA案例模式,懂excel就可看懂。
这些内容采用独创的黑箱模式,MBA案例教学机制,结合一线实战案例,介绍sklearn人工智能模块库和常用的机器学习算法。
这些章节是如此独特、精彩,在我们培训班的内部小范围使用当中,深受学员喜爱,于是,我们将本书当中机器学习相关的课程和案例单独抽取出来,配合部分Python入门课程,形成《零起点Python机器学习快速入门》一书。
进一步学习
本书的读者,如果有兴趣可以进一步学习《Python量化三部曲》的内容,虽然《Python量化三部曲》的内容是金融量化分析为主,但基本原理都是想通的,本质上都是数据分析,只是数据源不同,一个是金融数据,一个是足彩赔率数据。
对于《Python量化三部曲》三部曲的读者而言,本书也有很大的价值,特别是对于第一部入门课程的读者。
本书有多章关于网络爬虫的内容和具体案例,提取网络数据,这为希望自己编写自动交易程序的读者提供了一种基于web的操作接口,类似TopQuant.vip极宽量化社区转载tushare作者的博客:
《【转】tushare基于Python的股票实盘交易接口的实现与应用》
http:topquant.vipforum.php?mod=viewthread&tid=214
网络资源
本书的读者QQ群是:264880547(Top极宽足彩大数据)
本书有关的程序和数据下载,请浏览网站:TopQuant.vip极宽量化社区,网站【下载中心】有最新的程序和数据下载地址。
本书在TopQuant.vip极宽量化社区设有专栏,对本书和足彩有任何建议的,请在社区相关专栏发布信息,我们会在第一时间进行反馈和答复。
《零起点python》系列丛书
本书继续保持了《零起点python》系列丛书的一贯风格,简单实用,书中配备大量图表说明,没有一条数学公式,普通读者,只要懂word、excel,就能够轻松阅读全书。
IT零起点,无需任何电脑编程基础,会打字、会Excel,就能看懂本书,利用本书配套的Python软件包,轻松学会如何利用python,对股票、足彩数据,进行专业分析,量化投资分析。
投资零起点,无需购买任何专业软件,本书配套的zwPython软件包,采用开源模式,提供100%全功能、全免费的工业级数据分析平台。
配置零起点,所有软件、数据,全部采用苹果开箱即用模式,绿色版本,无需安装,解压即可,直接运行系统。
理财零起点,无需任何专业金融背景,采用通俗易懂的语言,配合大量专业图表,实盘操作案例,轻松掌握各种量化投资策略。
数学零起点,全书没有任何复杂数学公式,只有最基本的加减乘除,初中以上文化,即可看懂全书。
关于足彩的几个误区
近年来,大数据产业,人工智能行业风生水起,可国内足彩大数据的专业研究,还是处于冷门和偏门,这其中有很多关于足彩领域的误区。
很多主流学者,到现在都看不起足彩,认为是赌博,这个我们不讨论,最近国家级别的彩票大数据研究中心,也已经正式成立了,资本的力量是无穷的。
为此,笔者做了一个简单的小结,以正视听:
足彩虽然容易与赌球混淆,但却是最好的大数据研究对象,没有之一。
微软、百度、谷歌,目前都有专业团队,在做足彩大数据,并定期发布。
说白了,足彩相当于十倍配资的股票。
国内足彩赔率的确很低,差不多是全球最低的,比欧平低10%左右。
彩票的发明人和股票,据说都是同一个英国爵士。
必胜足彩交易所,成立当年获得了英国MBA商业创新大奖。
高盛多年前,就开始足彩套利业务,维基百科有介绍。
黑天鹅红牛吧足彩,是业内首家公开进行实盘测试的足彩大数据模型。
黑天鹅算法,在业内率先以盈利率,而不是胜率,测试足彩算法模型。
致谢
虽然很多网友在笔者博客留言,建议笔者早日完成足彩大数据这本书,但本书的创作和正式出版还是经历了许多波折。
如今本书终于出版,在此,要特别感谢电子工业出版社的黄爱萍和戴新编辑,感谢她们在选题策划和稿件整理方面做出的大量工作。
同时,在本书创作过程中,极宽开源量化团队和培训班的全体成员,提出很多宝贵的意见,并对部分课件程序做了中文注解。
特别是吴娜、余勤两位同学,为极宽开源量化文库和zwQuant开源量化软件编写文档,以及在团队成员管理方面做了大量工作,为他们的付出表示感谢。
何海群(字王)
北京极宽科技有限公司CTO
2017年2月25日
|
|