新書推薦:
《
史铁生:听风八百遍,才知是人间(2)
》
售價:HK$
57.3
《
量子网络的构建与应用
》
售價:HK$
112.7
《
拍电影的热知识:126部影片里的创作技巧(全彩插图版)
》
售價:HK$
112.7
《
大唐名城:长安风华冠天下
》
售價:HK$
89.7
《
情绪传染(当代西方社会心理学名著译丛)
》
售價:HK$
90.9
《
中国年画 1950-1990 THE NEW CHINA: NEW YEAR PICTURE 英文版
》
售價:HK$
236.0
《
革命与反革命:社会文化视野下的民国政治(近世中国丛书)
》
售價:HK$
93.2
《
画楼:《北洋画报》忆旧(年轮丛书)
》
售價:HK$
337.5
|
編輯推薦: |
本书适读人群:互联网公司的数据分析师、运营人员、产品经理,以及中层管理人员。
掌握基础图表的高级特性
梳理数据化运营的基本方法、原则、思维模式
深度量化分析方法(朴素贝叶斯模型、假设检验、方差分析、回归分析、时间序列分析模型等)
帮助你科学地决策
|
內容簡介: |
本书用于提升互联网公司员工的数据应用能力,即数据化运营能力。首先,从*常用的数据图表切入,帮助执行层正确地绘图,管理层正确地看图;接着,梳理运营中*基本的数据应用知识,涉及数据获取、数据清洗、数据认知、分析框架、指标体系、运营实验等内容。然后,介绍作者认为必要的统计学知识,包括假设检验、方差分析、回归分析和时间序列分解等,并引入了管理科学中的规划求解方法。*后,介绍了数据分析工具的发展趋势,并分享了作者近些年的工作及学习心得。
|
關於作者: |
胡晨川,统计学硕士,一个对数据分析充满热爱并努力成为数据科学家的年轻人。在数据分析工作上积累了些许经验。现任职于国内知名网上订餐平台饿了么。作者先后就读于浙江工商大学、云南财经大学及立信会计学院。个人微信公众号川术,希望通过工作经验的总结和知识的积累,形成切实可用的数据分析内容,帮助越来越多的人从数据分析中受益。
|
目錄:
|
第1章全面认识数据图表1
1.1详解数据图表的基本构成1
1.2控制数据图表中的信息量9
1.3真的需要作图吗10
第2章建立数据图表的认知14
2.1利用散点图探究数据间的关系14
2.1.1最基本的散点图样例15
2.1.2散点图的制作16
2.1.3散点图的变种1:添加平滑线19
2.1.4散点图的变种2:利用气泡图观察更多指标间的关系20
2.1.5散点图的变种3:用分类矩阵形成决策22
2.1.6散点图的局限性23
2.2利用柱形图将对比做到极致24
2.2.1利用累加柱形图对比数据结构的变化25
2.2.2多指标组合对比27
2.2.3用平均值优化单指标的对比29
2.2.4用瀑布图观察总量分解后的对比32
2.2.5如何正确对比数值指标与比率指标33
2.3用折线图观察时间序列数据35
2.3.1如何观察趋势36
2.3.2探寻趋势变化的原因38
2.4利用面积图观察数据结构的变化趋势44
2.4.1观察动态的数据结构变化:堆积面积图44
2.4.2用于队列分析:堆积面积图45
2.5用雷达图进行静态的多维对比48
2.6其他类型图表概述50
2.6.1使用饼图的6个坑50
2.6.2提升视觉冲击力:树状图52
2.6.3量化流程各环节间的转化率:漏斗图52
第3章数据图表进阶54
3.1数据图表到底是什么55
3.2如何正确地选择图表59
3.3数据图表中的细节60
3.3.1图表背景和绘图区背景60
3.3.2坐标轴65
3.3.3灵活使用辅助线68
3.3.4线性趋势线的应用69
3.3.5应用移动平均趋势线做时间序列的预测72
3.3.6添加信息增强线74
3.3.7用标注线指示必要的信息75
3.4能让图表升级的高级技巧76
3.4.1运用组合图表增加信息承载量76
3.4.2运用子母图增加图表中的信息量79
3.4.3条件格式中的几项实用功能80
3.4.4使用迷你图表压缩空间85
3.4.5用不等宽技术优化柱形图和条形图86
3.4.6使用Bullet图进行绩效评价的可视化89
第4章数据化运营的基础知识93
4.1最基本的数据获取能力94
4.1.1认知数据库的一般构造94
4.1.2能够阅读最基本的取数代码95
4.1.3用Excel获取数据98
4.2快速认知数据105
4.2.1仔细审核数据源的质量106
4.2.2提升数据集的质量107
4.2.3统一数据类型和单位111
4.2.4描述统计分析111
4.2.5利用相关系数理解数据之间的关系122
4.2.6通过多维交叉深入认知数据集125
4.3几套有用的分析思维框架132
4.3.166法则与SQVID原则133
4.3.2麦肯锡的七步成诗135
4.4创造指标,应用指标141
4.4.1什么是指标142
4.4.2如何设计高质量的指标143
4.4.3指标组合:综合指数143
4.4.4需要关注哪些核心指标144
4.5运营活动的量化148
4.5.1优秀的运营活动应具备哪些要素148
4.5.2需要哪些过程型和结果型指标149
4.5.3如何评价运营活动149
4.5.4从纵向与横向两个角度全面对比151
4.5.5一种更严谨的测试效果量化方法:DID154
4.5.6相似活动间效果的对比155
4.5.7关于运营活动量化的小结156
4.6数据化运营的思维方式156
4.7运营数据报告的必备要素167
4.8小结170
第5章快速提升量化分析能力171
5.1用朴素贝叶斯模型进行预测171
5.1.1利用全概率公式的一个例子174
5.1.2让大数定律给你自信175
5.1.3窥一斑而见全豹:中心极限定理176
5.2使用假设检验进行理性的推断177
5.2.1统计分布是一切推断的基础179
5.2.2以正态分布为例,阐述假设检验的过程181
5.2.3双侧检验与单侧检验183
5.2.4假设检验的细节补充184
5.3利用方差分析辨别方案的有效性185
5.3.1用户激活措施的有效性判断186
5.3.2运用置信区间增强数值估计的可靠性189
5.3.3两两比较寻找最精确的结论190
5.3.4理解方差分析的思维191
5.4浅谈回归技术的应用191
5.4.1因变量与自变量的相关关系是回归的基础191
5.4.2线性回归建模的详细过程192
5.4.3线性回归分析中的注意点204
5.5用时间序列分解模型观察波动204
5.5.1怎样观察时间序列数据205
5.5.2何为时间序列分解206
5.5.3时间序列分解的步骤解析208
5.5.4时间序列分解方法的应用局限性212
5.6如何优化调查问卷213
5.6.1态度型问题,增加选项以支撑量化分析214
5.6.2问题要有必要且贴合业务需求215
5.6.3设置过滤器,识别无效回答215
5.6.4避免双重问题和一重半问题216
5.6.5动态地调查,设置问题库以保障多次调查的质量216
第6章科学地决策217
6.1从数据中形成决策217
6.2线性规划是什么219
6.3线性规划建模的操作过程220
6.3.1建立逻辑清晰的表格220
6.3.2设置输出单元格、目标单元格与可变单元格之前的运算关系221
6.3.3设置线性规划建模参数222
6.4如何从数据中形成决策223
6.54类典型且实用的线性规划模型223
6.5.1资源分配模型224
6.5.2成本收益平衡模型226
6.5.3网络配送模型227
6.5.4混合模型229
6.6线性规划模型小结231
第7章应用优秀的工具233
7.1互联网数据分析工具的演进234
7.1.1流量时代234
7.1.2用户时代235
7.1.3订单时代235
7.2行为事件分析工具的简单介绍236
7.3数据分析平台简介及趋势238
7.3.1数据展现238
7.3.2数据处理238
7.3.3数据收集239
7.4值得推荐的小工具240
7.4.1团队协作工具240
7.4.2其他小工具241
第8章工作经验杂谈242
8.1这些年犯过的错误242
8.1.1迷信业务模型,浪费公司资源243
8.1.2活跃率陷阱244
8.1.3不加选择地进行数据追踪245
8.1.4为了KPI而做数据分析246
8.1.5忽略数据质量的保障机制247
8.1.6轻视业务执行,重视数据表现248
8.1.7不重视数据认知,盲目建模248
8.1.8只重视完成任务,忽略了团队成员的个人发展需求249
8.2认清数据分析的边界250
8.2.1数据库并不能记录一切250
8.2.2不可能分离多重因素影响251
8.2.3数据不能替代逻辑推理251
8.2.4预测的根基未必牢固251
8.2.5大多数人会因数据而变懒252
8.3我们需要读些什么书252
|
內容試閱:
|
前言序言
尊敬的读者,您能翻开本书,是我的荣幸。虽然书名中含有速成两字,但我相信理性的读者都不会期待真的有学习捷径。我发现,数据分析的入门者往往不能快速形成合适的知识框架,导致其走了许多弯路。因此,本书不遵从教科书逻辑,而从实际应用出发,相信能够提高读者的学习效率。总的来说,这是一本关于商业数据应用的书。希望本书的内容能给读者的工作和生活带来实质性的帮助。
为什么写本书
长久以来,我都有成为数据科学家的梦想。虽然朝着这个目标奋斗了几年,但是若问我数据科学家到底是什么,我依然没有明确的答案。两件事儿,是数据科学家必须做到的:一是运用合理的数据分析方法,从数据中形成商业决策;二是能让越来越多的人正确地理解并应用数据分析方法。这两件事儿,也就成为我的奋斗目标。所以,当电子工业出版社的编辑联系我写作本书时,我欣然应允了。
谁适合阅读本书
让读者正确地理解并应用数据分析是本书的主要目的。广义地说,本书的内容浅显,适合所有对数据分析感兴趣的人。但依我的初衷,本书是写给互联网公司的运营、产品和管理者的。毕竟,我的工作经验均来自互联网背景,因此认知会有一定的局限性,故而这些内容不一定适用于所有行业。
如何阅读本书
首先,建议读者在阅读本书的同时上手操练。本书内容所涉及的实践操作,全部基于Excel 2016。Excel上手简单、功能全面且运行稳定,它的实用性无须多言。
本书的内容结构比较怪异。先通过前三章解决如何正确地作图这个问题。为什么要将作图放在最前面呢?因为,运营和产品人员要在工作中制作大量图表,管理者要阅读大量图表;若图表做得不正确,难免出现信息扭曲,导致管理者决策失误。所以,作图者应该正确地作图,管理者应该正确地看图。因此,作者从作图切入,进而展开本书的内容,比较符合实际。
接着,在第4章介绍了运营中最基本的数据应用知识。本章涵盖的内容较多。作者的写作逻辑是缺什么补什么,即以作者的认知为基础,填补作者认为本书目标读者所欠缺的数据知识(涉及数据库基本结构、数据获取、数据清洗、数据认知、建立分析框架、构建指标体系、运营活动量化等)。
第5章介绍一些简单实用且必不可少的统计学知识。通过这些知识,读者能够培养自己的量化分析思维,并能体会到统计学的强大。第6章篇幅不长,但希望能为读者打开管理科学这扇大门,即应用运筹学中的规划求解方法。让读者体会到:做决策绝不仅是定性分析,它可以一步步量化获得最优解。
第7章简单介绍了数据分析的工具和运营工具。里面的部分内容由GrowingIO创始人张溪梦先生和神策数据创始人桑文锋先生执笔。第8章写了一些作者近年的心得体会,希望这些经验能帮助读者少走弯路。
作者建议初次阅读本书的读者先按章节顺序快速通读。在通读之后,若在工作中遇到了某些难处,可以有针对性地精读某一部分。另外,本书中所提及的参考书目,希望读者重视,这些书都是很好的学习资源。
建议读者关注作者的微信公众号川术。作者会不定期地分享自己的感悟。本书中的数据都是模拟的,建议读者将本书所提的方法应用在自己的数据中。若有强烈的需要,读者可以在作者的微信公众号留言。
感谢
首先,感谢出版方电子工业出版社,给予我机会将自己的经验分享给大家。接着,感谢本书的编辑郑柳洁及其他工作人员,在本书的撰写和出版过程中给予的极大帮助。然后,要感谢我的老师、朋友和同事们,没有他们,就没有我经验的积累和认知的提高。还要感谢本书的推荐人和其他专家,是他们的指导和关怀,让我能高效地前进。最后,感谢我的家人,尤其是我有孕在身的妻子,在每一个伏案写作的夜晚,给予我莫大的理解和无微不至的照顾。
推荐序1
随着信息经济生态的加速形成,数据的力量正在被不断激发。智能设备、物联网、云计算等技术帮助人类构建着一个日益丰富的数据世界,其越来越完整地反映出我们所在的现实世界的面貌,并且通过对数据的进一步分析和归纳,探寻其中蕴含的规律,使我们对世界的认知能够达到过去几千年从未企及的深度。
一直以来,阿里云致力于为客户提供普惠的计算能力和服务能力,我们希望通过阿里云提供的技术和平台,帮助客户把握DT时代的入口,让客户的数据得以不断沉淀,能够产生更大的价值。今天,我们很欣喜地看到,越来越多的企业拥有了数据资产,拥有了通往未来无限想象的可能。但是我们也清楚地认识到,只有让数据产生商业价值,数据才能真正为社会、为消费者、为各行各业产生力量。
在浩如繁星的数据之下,一双能够理解和利用数据的深邃明眸显得尤其珍贵,在《数据化运营速成手册》中,我看到了一个热爱数据分析工作的年轻人,如何不断回顾、总结、提炼、打磨自己的工作场景,尽他所能地融合统计科学、商业思维、视觉工具等多领域知识,以最具象的方式与我们分享他的所思所得。他分享的知识也许并非前沿,操作指南也并非殿堂级的严谨,但却很有温度。这些内容从最具体的工作中来,带我们到最普遍也是最实用的应用场景中去,帮助我们在日常工作中感知和发掘数据的价值,相信会吸引并帮助更多的人认识和使用数据。
大数据时代的帷幕刚刚拉开,对于数据资源这座宝贵的矿藏,我们今天的所见也许只是九牛一毛,未来还有无限的可能等待我们去挖掘。但是我相信,与应用相结合,让数据产生商业价值,永远是数据的生命所在。希望有更多像晨川一样对数据抱有热忱的年轻人加入进来,共同探索如何让数据最有效地为商业需求服务,从中激发和传播数据的能量,推进新的变革,期待与你们同行。
阿里巴巴集团资深副总裁、阿里云总裁,胡晓明
推荐序2
和很多互联网公司的CEO一样,我也本能地重视数据。在数据化运营的蛮荒时代,所谓的运营工作也许只有一个简单的访问计数。即使这样,无论是个人网站主、网店店主,还是博客作者都会忍不住刷屏,恨不得听到网站运行的每一个脉动。
后来,我们有了Google Analytics这样的工具,脚本一载入,就像拥有了上帝视角,把网站的角角落落和用户的起起落落都看得一清二楚。我们曾经认为这已经是传统商业难以企及的运营条件,它能够帮助我们打败对手,建立长久的竞争优势。但互联网商业发展的日新月异,让它的运营水平也跟着一起神速推进。很快事情就不再那么简单,数据运营工作的复杂度和专业度每年都在翻倍,仿佛昨天还在学习一元二次方程,今天就已经是微积分的难度。互联网行业的发展速度在提供创富神话的同时,也给我们的学习能力下了最后通牒。
我们已经无法凭借直觉经验和抓大放小这样的简单原则来应用数据化运营。任何一项网络服务都面临着复杂的数据观测、分析和应用需求,从用户获取、激活、留存、转化和再传播,每一个环节都能够派生出上百个数据点来提供不同维度的指标,我们面临遴选指标、跟踪和汇报指标,以及建立PDCA改进行动机制的高难度协作。这既不是一个人能够埋头做完的活儿,也不是人多就力量大的任务。有效的数据化运营工作考验团队的领导力,识别重要任务的能力,沟通和协作的能力;同时也必然需要有团队成员专注在这个环节,完整掌握这一组专业能力。晨川的《数据化运营速成手册》正是从他的专业岗位经验出发,为从业人员提供的一本实务指南。
本书的亮点还在于作者对有效学习的理解,以及构建知识框架的基本方式和专业读者的实践需求。从基础图表这个具象的事物开始,再升级到图表的高级特性。然后再介绍数据化运营的基本方法和原则,再抽象到更深入的数据化运营思维模式。这种浅深浅深的节奏也是我特别认可的学习模式。本书也留出了相当的篇幅跳出了基本的数据化运营工作,延伸到有深度的量化分析和决策科学领域,这对有意愿更深入研究和开发数据化运营工具与模型的专业人员也有启发作用。对于CEO来说,我们一直说重视数据,养成基于数据设定目标和决策的习惯,但是这一切需要掌握了基本的数据技能后才能奏效。如果你不够了解数据,自然不会真正信任它。
晨川在明道工作时,用他的专业和热情帮助明道建立了数据化运营的基本框架。如今,他又能为行业留下实务著作,我有必要对他致以双重的感谢,并真诚地推荐读者静下心来,开启这项重要能力的学习。
明道创始人,任向晖
推荐序1
随着信息经济生态的加速形成,数据的力量正在被不断激发。智能设备、物联网、云计算等技术帮助人类构建着一个日益丰富的数据世界,其越来越完整地反映出我们所在的现实世界的面貌,并且通过对数据的进一步分析和归纳,探寻其中蕴含的规律,使我们对世界的认知能够达到过去几千年从未企及的深度。
一直以来,阿里云致力于为客户提供普惠的计算能力和服务能力,我们希望通过阿里云提供的技术和平台,帮助客户把握DT时代的入口,让客户的数据得以不断沉淀,能够产生更大的价值。今天,我们很欣喜地看到,越来越多的企业拥有了数据资产,拥有了通往未来无限想象的可能。但是我们也清楚地认识到,只有让数据产生商业价值,数据才能真正为社会、为消费者、为各行各业产生力量。
在浩如繁星的数据之下,一双能够理解和利用数据的深邃明眸显得尤其珍贵,在《数据化运营速成手册》中,我看到了一个热爱数据分析工作的年轻人,如何不断回顾、总结、提炼、打磨自己的工作场景,尽他所能地融合统计科学、商业思维、视觉工具等多领域知识,以最具象的方式与我们分享他的所思所得。他分享的知识也许并非前沿,操作指南也并非殿堂级的严谨,但却很有温度。这些内容从最具体的工作中来,带我们到最普遍也是最实用的应用场景中去,帮助我们在日常工作中感知和发掘数据的价值,相信会吸引并帮助更多的人认识和使用数据。
大数据时代的帷幕刚刚拉开,对于数据资源这座宝贵的矿藏,我们今天的所见也许只是九牛一毛,未来还有无限的可能等待我们去挖掘。但是我相信,与应用相结合,让数据产生商业价值,永远是数据的生命所在。希望有更多像晨川一样对数据抱有热忱的年轻人加入进来,共同探索如何让数据最有效地为商业需求服务,从中激发和传播数据的能量,推进新的变革,期待与你们同行。
阿里巴巴集团资深副总裁、阿里云总裁,胡晓明
推荐序2
和很多互联网公司的CEO一样,我也本能地重视数据。在数据化运营的蛮荒时代,所谓的运营工作也许只有一个简单的访问计数。即使这样,无论是个人网站主、网店店主,还是博客作者都会忍不住刷屏,恨不得听到网站运行的每一个脉动。
后来,我们有了Google Analytics这样的工具,脚本一载入,就像拥有了上帝视角,把网站的角角落落和用户的起起落落都看得一清二楚。我们曾经认为这已经是传统商业难以企及的运营条件,它能够帮助我们打败对手,建立长久的竞争优势。但互联网商业发展的日新月异,让它的运营水平也跟着一起神速推进。很快事情就不再那么简单,数据运营工作的复杂度和专业度每年都在翻倍,仿佛昨天还在学习一元二次方程,今天就已经是微积分的难度。互联网行业的发展速度在提供创富神话的同时,也给我们的学习能力下了最后通牒。
我们已经无法凭借直觉经验和抓大放小这样的简单原则来应用数据化运营。任何一项网络服务都面临着复杂的数据观测、分析和应用需求,从用户获取、激活、留存、转化和再传播,每一个环节都能够派生出上百个数据点来提供不同维度的指标,我们面临遴选指标、跟踪和汇报指标,以及建立PDCA改进行动机制的高难度协作。这既不是一个人能够埋头做完的活儿,也不是人多就力量大的任务。有效的数据化运营工作考验团队的领导力,识别重要任务的能力,沟通和协作的能力;同时也必然需要有团队成员专注在这个环节,完整掌握这一组专业能力。晨川的《数据化运营速成手册》正是从他的专业岗位经验出发,为从业人员提供的一本实务指南。
本书的亮点还在于作者对有效学习的理解,以及构建知识框架的基本方式和专业读者的实践需求。从基础图表这个具象的事物开始,再升级到图表的高级特性。然后再介绍数据化运营的基本方法和原则,再抽象到更深入的数据化运营思维模式。这种浅深浅深的节奏也是我特别认可的学习模式。本书也留出了相当的篇幅跳出了基本的数据化运营工作,延伸到有深度的量化分析和决策科学领域,这对有意愿更深入研究和开发数据化运营工具与模型的专业人员也有启发作用。对于CEO来说,我们一直说重视数据,养成基于数据设定目标和决策的习惯,但是这一切需要掌握了基本的数据技能后才能奏效。如果你不够了解数据,自然不会真正信任它。
晨川在明道工作时,用他的专业和热情帮助明道建立了数据化运营的基本框架。如今,他又能为行业留下实务著作,我有必要对他致以双重的感谢,并真诚地推荐读者静下心来,开启这项重要能力的学习。
明道创始人,任向晖
|
|