新書推薦:
《
SDGSAT-1卫星热红外影像图集
》
售價:HK$
457.7
《
股市趋势技术分析(原书第11版)
》
售價:HK$
227.7
《
汉匈战争全史
》
售價:HK$
102.4
《
恶的哲学研究(社会思想丛书)
》
售價:HK$
109.8
《
不止江湖
》
售價:HK$
101.2
《
天才留步!——从文艺复兴到新艺术运动(一本关于艺术天才的鲜活故事集,聚焦艺术史的高光时刻!)
》
售價:HK$
158.7
《
双城史
》
售價:HK$
110.9
《
冯友兰和青年谈心系列:不是问题的问题(哲学大师冯友兰和年轻人谈心,命运解读)
》
售價:HK$
57.3
|
編輯推薦: |
(1)3位作者均是有多年数据分析和运营经验的专家,操盘过很多大项目,经验丰富。
(2)从方法、技术、业务、实践4个维度全面构建数据化运营的系统方法论。
(3)包含多个商业实践案例,对搭建数据监控指标体系、数据分析、数据挖掘、ABtest、埋点策略、用户画像建模等常见数据运营方式做了详细讲解。
|
內容簡介: |
本书以互联网企业中常见数据运营场景为切入点,以工作中实际面临解决的问题为案例,从方法、技术、业务、实践4个维度讲述数据运营的场景及应用方式。书中从实践出发,结合工作中数据运营经验,以应用案例为主线,通过业务分析+代码实践这种更“接地气”的方式讲述数据的应用。书中对于搭建数据监控指标体系、数据分析、数据挖掘、ABTest、埋点策略、用户画像建模等常见数据运营方式做了详细的介绍。
|
關於作者: |
作者简介
赵宏田
毕业于中国地质大学(武汉)和武汉大学,获工学和经济学双学士学位,现在某跨境电商从事大数据开发相关工作。拥有丰富的数据分析和数据化运营经验,负责过经营分析、SEOSEM流量数据仓库建设、竞品爬虫、企业BI搭建,以及多家公司用户画像项目的从0到1搭建。业余时间喜欢对工作中关键点进行总结和积累,开源项目的贡献者,知乎专栏作者,撰写了大量专业文章,广受好评。
博客地址:https:zhuanlan.zhihu.compythoncrawl
开源贡献地址:https:github.comHunterChao
江丽萍作者简介
赵宏田
毕业于中国地质大学(武汉)和武汉大学,获工学和经济学双学士学位,现在某跨境电商从事大数据开发相关工作。拥有丰富的数据分析和数据化运营经验,负责过经营分析、SEOSEM流量数据仓库建设、竞品爬虫、企业BI搭建,以及多家公司用户画像项目的从0到1搭建。业余时间喜欢对工作中关键点进行总结和积累,开源项目的贡献者,知乎专栏作者,撰写了大量专业文章,广受好评。
博客地址:https:zhuanlan.zhihu.compythoncrawl
开源贡献地址:https:github.comHunterChao
江丽萍
统计学硕士,某知名互联网医疗公司数据分析师。从事经营分析及数据运营多年,曾在不同行业以研究员、项目经理、咨询顾问、数据分析专家的身份参与大量的数据运营项目,拥有丰富的互联网数据运营项目经验。曾在某公司成功带领小组打通公司层面数据,对关键业务条线从业务流、数据流进行流程化梳理;推动公司数据产品实现由0到1的突破。希望能将数据分析与业务运营结合的更加紧密,以数据驱动运营,以数据推动业务。
李宁
中国商业联合会数据分析专业委员会特聘专家,现就职于某知名外卖订餐平台,担任数据专家。先后在艾瑞、携程从事数据相关工作。乐于分享,维护着微信公众号“数据自由之路”(dataFreeLife),分享自己在数据和运营方面的经验和心得,同时是知乎、36大数据和51CTO等知名媒体的专栏作家。曾多次被行业内的各种数据峰会邀请担任分享嘉宾,并以评审专家身份参与由中数委牵头的《中国大数据人才培养标准(第1版)》的编审工作。
|
目錄:
|
目 录
前 言
基 础 篇
第1章 概述:数据运营基础002
1.1 大数据时代002
1.2 企业数据应用方式004
1.3 数据运营的岗位职责007
1.4 数据运营应掌握的技能009
1.5 本章小结013
第2章 业务:数据驱动运营014
2.1 如何用数据驱动运营014
2.1.1 定义数据分析目标014
2.1.2 目标分解与聚焦016
2.1.3 数据运营重点019
2.2 流量运营分析021
2.2.1 流量运营规划021
2.2.2 流量分析023
2.2.3 解读PV、UV027
2.2.4 跳出率分析029
2.2.5 漏斗图分析030
2.2.6 AB测试032
2.3 用户运营分析033
2.3.1 用户分群034
2.3.2 用户行为分析040
2.3.3 用户生命周期价值047
2.4 本章小结051
?第3章 报表:数据管理模板052
3.1 个性化数据管理报告—Excel054
3.1.1 创建报告的准备工作054
3.1.2 报告自动化步骤055
3.1.3 从数据源表到数据转化表056
3.1.4 报告正文展示062
3.1.5 自动化报表脚本064
3.2 搭建数据分析报告模板—PPT066
3.2.1 业务指标梳理(搭建运营监控指标体系)067
3.2.2 分析思路与框架078
3.2.3 图表展现079
3.2.4 数据与结论080
3.2.5 报告布局与排版081
3.2.6 PPT随Excel模板自动更新084
3.3 本章小结085
应 用 篇
?第4章 理论:数据分析方法088
4.1 数据分析理论模型088
4.1.1 4P营销理论089
4.1.2 5W2H分析法090
4.1.3 PEST分析方法092
4.1.4 SWOT093
4.1.5 逻辑树095
4.2 数据分析方法与运用场景095
4.2.1 多维分析095
4.2.2 趋势分析097
4.2.3 综合评价法101
4.2.4 转化分析103
4.2.5 数据挖掘方法106
4.3 可视化:常用图表的特点及适用场合106
4.3.1 环形图107
4.3.2 矩阵图108
4.3.3 组合图112
4.3.4 文字云118
4.4 AB Test的原理与实现125
4.4.1 AB Test的原理126
4.4.2 AB Test的埋点与报表部署128
4.4.3 AB Test的分析方法129
4.4.4 AB Test的常见误区132
4.5 埋点策略与实现134
4.5.1 utm来源埋点135
4.5.2 页面PV埋点137
4.5.3 单击埋点native139
4.5.4 单击埋点hybrid141
4.5.5 业务埋点142
4.5.6 曝光埋点144
4.5.7 埋点常见问题145
4.6 本章小结146
?第5章 案例:竞品数据对标分析148
5.1 网络爬虫基础知识148
5.1.1 开发环境准备149
5.1.2 Web前端基础149
5.1.3 解析网页152
5.1.4 数据存储159
5.2 网站结构分析166
5.3 Scrapy爬虫架构168
5.3.1 items模块170
5.3.2 pipelines模块171
5.3.3 settings模块172
5.3.4 爬虫模块173
5.4 数据爬取与解析174
5.5 项目优化与改进177
5.5.1 爬虫脚本部署在服务器端178
5.5.2 分布式爬虫的实现178
5.6 反爬手段及应对机制179
5.6.1 禁止IP请求180
5.6.2 禁止非浏览器访问180
5.6.3 ajax加载目标数据181
5.6.4 需要登录后才能访问182
5.6.5 手机App页面数据抓取182
5.7 本章小结184
?第6章 案例:某互联网医疗产品用户特征分析185
6.1 应用背景与分析维度185
6.2 基于用户细分的行为分析186
6.3 用户来源渠道分析190
6.4 基于前端展示的用户行为分析191
6.5 产品改进与运营建议195
6.6 本章小结195
?第7章 案例:RFM用户价值模型应用196
7.1 应用背景与目标196
7.2 基于规则的划分198
7.3 基于聚类方法的划分203
7.4 本章小结209
?第8章 案例:用户流失分析与预测210
8.1 应用背景与目标210
8.2 问题分析与模型构建211
8.3 数据处理与结果212
8.3.1 确定用户流失周期212
8.3.2 抽取训练数据建立决策树模型214
8.3.3 线上部署脚本定期监测流失用户221
8.3.4 流失用户分析224
8.4 问题定位与解决方案226
8.5 本章小结229
?第9章 案例:站内文章自动分类打标签230
9.1 应用背景与目标230
9.2 问题分析与模型构建231
9.3 案例中主要应用的技术232
9.3.1 数据预处理232
9.3.2 TF-IDF词空间向量转换233
9.3.3 文章关键词提取234
9.3.4 朴素贝叶斯分类235
9.4 数据处理与模型检验235
9.4.1 文本分词处理(数据分类与数据预处理)236
9.4.2 数据结构处理238
9.4.3 计算文本的TF-IDF权重矩阵240
9.4.4 用朴素贝叶斯方法分类文章242
9.5 本章小结245
提 高 篇
?第10章 应用:用户画像建模248
10.1 用户画像简介248
10.1.1 什么是用户画像249
10.1.2 用户画像模型及应用场景250
10.1.3 数仓架构及项目流程254
10.2 用户画像管理257
10.2.1 模块化开发257
10.2.2 存储方式259
10.2.3 更新机制259
10.3 业务背景262
10.3.1 案例背景介绍262
10.3.2 数据仓库相关表介绍262
10.4 用户画像建模267
10.4.1 业务需求梳理267
10.4.2 用户标签体系及开发内容268
10.4.3 用户画像开发流程274
10.4.4 时间衰减系数279
10.4.5 标签权重配置280
10.5 用户画像数据开发282
10.5.1 建立用户属性画像283
10.5.2 建立用户行为画像289
10.5.3 建立用户偏好画像303
10.5.4 建立群体用户画像308
10.5.5 画像效果验收313
10.5.6 画像数据质量管理314
10.6 用户画像应用方式317
10.6.1 业务精细化运营317
10.6.2 数据分析319
10.6.3 精准营销319
10.6.4 用户个性化推荐322
10.7 本章小结323
|
內容試閱:
|
前 言为什么要写这本书作为互联网大数据行业的从业者,笔者将自己在这个行业中所掌握的知识、在日常工作中遇到的问题以及积累的项目经验整理成书,在这里和大家分享。希望通过本书能给读者一些新的理解和应用的思路,如果书中的内容能让你有些许收获,能够解决你工作中的一两个问题,那将是笔者的荣幸。
本书特色本书从实践出发,结合工作中数据运营经验,以应用案例为主线,通过业务分析+代码实践这种更“接地气”的方式讲述数据的应用。书中对搭建数据监控指标体系、数据分析、数据挖掘、AB Test、埋点策略、用户画像建模等常见数据运营方式做了详细介绍。
根据读者的阅读习惯,本书由浅入深地分为基础篇、应用篇和提高篇三部分。
基础篇讲解数据运营常见场景、运营方式与数据运营人员的工作职责。
应用篇讲解数据分析方法与应用方式,并通过5个实际数据分析挖掘案例帮助读者深入理解数据运营方式。在内容编排上先提出案例应用背景和目标,再阐述分析方法和建模流程,最后完成数据的处理和业务上的应用。
提高篇讲解当下热门的“用户画像建模”,从建模流程、标签开发到画像应用,并辅以案例,讲解如何用HQL语言建立一个图书电商场景的用户标签体系,以帮助读者更深入地理解用户画像是如何建模打标签的。
本书没有过多复杂的理论公式,所讲案例操作步骤详细,可作为数据分析运营人员在解决实际问题中参考的“action book”。
本书适用对象对数据分析及数据挖掘感兴趣的大专院校师生及其他初学者对互联网行业数据分析、用户画像建模感兴趣的数据运营人员互联网行业的产品运营人员及产品经理各行各业的数据分析师如何阅读本书本书以互联网企业中常见的数据运营场景为切入点,以工作中实际面临的问题为案例,从方法、技术、业务、实践4个维度讲述数据运营的场景及应用方式。全书共分10章,各章的主要内容如下:
第1章介绍企业中数据的应用方式、企业数据职能架构与组成、数据运营人员的工作职责和应掌握的技能。
第2章介绍数据运营规划,常见的运营场景以及如何结合数据展开用户运营和流量运营工作。
第3章讲述如何结合业务搭建数据监控指标体系,从搭建模板到自动化数据报表,做好日报、周报、月报、专题分析报告等日常数据运营工作。
第4章是本书的重点章节,讲述了数据分析中常用的方法及其应用场景,包括常见营销理论、数据分析思路、AB Test分析以及埋点策略与分析。对数据分析感兴趣的人员可着重看此章节。
第5~9章是数据分析挖掘中的几个具体案例,从数据运营的实际应用场景出发,以案例的形式讲述了如何在某些常见的业务需求背景下,分析项目需求,厘清思路,展开数据分析并输出报告和结论。案例中的关键步骤都附上了详细的代码说明。
第10章是本书的重点章节,先介绍了什么是用户画像、应用场景、开发流程,然后以案例的形式讲解了用户画像建模过程中的需求分析、建立模型、打标签、计算标签权重、画像数据管理、用户画像应用等环节,并为案例附上了详细的代码说明。想要了解如何在用户画像建模过程中建模打标签的人员可着重看此章节。
勘误和支持由于笔者水平有限,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。为此,读者可通过邮箱(892798505@qq.com)或微信(administer-00001)反馈有关问题,笔者将尽全力为读者提供解答。书中的源代码可以从Github网站(https:github.comHunterChaobook)下载。
致谢在本书的编写过程中,得到了许多朋友的帮助,感谢天善智能创始人梁勇的支持与帮助,感谢为本书撰写推荐的朋友们,感谢你们的支持及专业的建议。
感谢机械工业出版社华章公司的杨福川副总编,本书从2017年4月开始筹划,从确定基本框架到后期的写作,杨总编不断地给笔者以指导,感谢杨总编的帮助与支持,与他的合作总是十分愉快!感谢机械工业出版社编辑李艺老师,李艺老师用严谨的态度孜孜不倦地帮助我们修改稿件。
谨以此书献给众多互联网运营人员和数据分析师们!
|
|