原标题:从0到1手把手教你如何搭建数据化运营运营体系
最近几年,随着移动互联网的快速发展大数据化运营的概念也越来越火,很多公司都在提数据化运营化管理鈈少人对数据化运营运营的理解,局限于数字统计、原因分析等其实这些只是数据化运营运营工作的一小部分,数据化运营最终是为产品服务的数据化运营运营,重点在运营数据化运营只是工具。
“数据化运营运营”有两层含义:
●狭义指“数据化运营运营”这一工莋岗位它跟内容运营、产品运营、活动运营、用户运营一样,属于运营的一个分支从事数据化运营采集、清理、分析、策略等工作,支撑整个运营体系朝精细化方向发展近年来,越来越多的互联网企业开设了“数据化运营运营”这一工作岗位主要分布在一线运营部門。与数据化运营分析师这一岗位不同的是数据化运营运营更加侧重支持一线业务决策。
●广义指“用数据化运营指导运营决策、驱动業务增长”的思维方式即数据化运营化运营。属于运营的一种必备技能或者思维方式泛指通过数据化运营分析的方法发现问题、解决問题、提升工作效率、用数据化运营指导运营决策、驱动业务增长。
综上所述数据化运营分析是数据化运营运营的一项必备技能。
通俗點说数据化运营运营搞清楚以下5个问题:
1、我们要做什么?——目标数据化运营制订;
2、现状是什么——行业分析,产品数据化运营報表输出;
3、数据化运营变化的原因——数据化运营预警,数据化运营变化的原因分析;
4、未来会怎样——数据化运营预测;
5、我们應该做什么?——决策与数据化运营的产品应用
我们找了100篇数据化运营运营招聘JD(职位描述)文本的基础上,使用R对其进行分词并且繪制了词云。
通过这个词云不难看出“数据化运营分析”是数据化运营运营的核心工作,右边的表格展示了排名靠前的关键词及其出现嘚频次
「数据化运营分析」这个词在100个JD中出现了106次,遥遥领先接下来是分别是「分析报告」、「提供数据化运营」、「数据化运营报表」等词,这也说明提供数据化运营报表、分析报告是数据化运营运营的重要工作搭建「数据化运营指标」、及时「发现问题」、提供「解决方案」也是JD中的高频词汇,这样看数据化运营运营岗位的具体职责就一目了然了
总结起来,我们将其归纳为数据化运营规划、数據化运营采集、数据化运营分析三大层次:
●数据化运营规划:收集整理业务部门数据化运营需求搭建数据化运营指标体系;
●数据化運营采集:采集业务数据化运营,向业务部门提供数据化运营报表;
●数据化运营分析:通过数据化运营挖掘、数据化运营模型等方式罙入分析业务数据化运营;提供数据化运营分析报告,定位问题提出解决方案。
三、数据化运营运营的常见误区
1、数据化运营多就一萣能推驱动业务发展吗?
数据化运营多并不意味着能驱动业务发展存在很多因素导致数据化运营并不能很好地应用于业务中。
●因素1:數据化运营质量问题
一方面很多公司在采集数据化运营时,会采集到很多脏数据化运营比如模拟器刷量、羊毛党刷量,如果未做反作弊识别很难将这部分数据化运营过滤掉;另外一方面,在采集数据化运营时没有做到标准化、规范化上报,那么在做数据化运营挖掘汾析时就很难得到有效信息。而数据化运营的准确性和稳定性是数据化运营科学管理的基础如果无法满足这两点,在业务决策上就会存在很多问题
●因素2:数据化运营跟业务关联性不大
数据化运营只有跟业务有足够强的关联性,才有价值我们本身有很多指标,大概超过70多个但是在日常分析时,经常用到的也就那么几个其他的或者访问非常少,或者会随着时间推移慢慢被弃用。
●因素3采集数據化运营很容易,用起来难
腾讯做了很多年数据化运营分析积累了很多经验,有一整套自己的分析系统在数据化运营应用方面自然没問题。但是很多传统企业像运营商移动、联通、电信,保险公司、银行对在这块的困惑就特别多他们有很多数据化运营,但不知道该怎么用那盲目的采集数据化运营,其实根本没有多大意义
2、分析报表能不能出一个最优的解决方案
相信大家每周或者是每天,都在给這样的分析报表但是,我们的分析结果真的是一个有针对性的业务的最优解决方案吗?结果往往是否定的这里边也存在几个问题。
●问题1:分析维度单一不足以支撑结论。
分析维度有很多比如说版本、渠道、地域,以及设备属性和特定行为特征等目前来看所有嘚APP分析,基本上就是从版本渠道这两个维度去分析的;还有自定义事件,如果只是基于事件ID去分析它没有足够的参数去做限定,那么吔很难去支撑决策分析结果
●问题2:数据化运营质量干扰分析结果。
分析结果能否有效反映业务发展情况并给出有效优化策略的关键因素之一便是数据化运营质量如果数据化运营质量不过关,那么基于数据化运营给出的分析结果也会大打折扣我们接触的很多app,都或多戓少有过被刷量的情况这种数据化运营不仅给公司造成财务上的浪费,同时也会影响正常数据化运营造成数据化运营分析的困难。
四、如何构建一个完整的产品数据化运营运营体系
以某IM即时通讯产品为例:
// 第1步:制订产品目标 //
这是数据化运营运营的起点,也是产品上線运营后进行评估的标准以此形成闭环。制订目标绝不能拍脑袋可以根据业务发展、行业发展、竞品分析、往年产品发展走势、产品轉化规律等综合计算得出。制订目标常用SMART原则来衡量
指工作指标要具体可评,不能笼统例如我们制定产品基础体验的产品目标,如果昰提升产品体验则不够具体,每个人的理解不一致当时我们的基础产品目标则是提升新用户次日留存,则非常具体
指绩效指标是数量化或者行为化的,验证这些绩效指标的数据化运营或者信息是可以获得的;提升新用户次日留存率则需要给出具体的数值。
指绩效指標在付出努力的情况下可以实现避免设立过高或过低的目标;新注册用户的次日留存率,也不是拍脑袋得出的当时我们基于新用户次ㄖ留存率的历史数据化运营和游戏用户的新注册用户留存率的行业参考数值,制订了一个相对有挑战性的目标从新注册用户次日留存率從25%提升到35%。
是与工作的其它目标是相关联的;绩效指标是与本职工作相关联的;新用户的次日留存率和用户行为息息相关,例如用户对語音工具的认可程度用户对平台的内容喜好程度等,所以新用户的次日留存和产品的性能、内容受欢迎程有较强的相关性
注重完成目標的特定期限。产品目标可以这样制订:在2013年12月31日前将新注册用户的次日留存率从25%提升到35%。新用户次日留存率的提升意味着更多用户嘚活跃转化,带动整个用户活跃数量的增长
// 第2步:定义产品数据化运营指标 //
产品数据化运营指标是反应产品健康发展的具体的数值,我們需要对数据化运营指标给出明确定义例如数据化运营上报方法、计算公式等。例如上文的次日留存率可以定义为:次日留存率是一個比率,分母是当天新注册并在当天登录客户端的帐户数分子是分母当中在第二天再次登录客户端的帐户数。
注意这里的细节第一天囷第二天,需要有明确的时间点例如0点到24点,计算为一天;问题来了一个新用户在第一天的23点注册并登录客户端,到第二天的凌晨1点丅线;按照上面的定义这个用户或许将不会被记录为次日留存用户,因为这里没有定义清楚数据化运营上报细节
定义是第二天再次登錄客户端,上面案例的用户在第二天是没有登录行为的但他确实是连续两天都在登录状态的用户。
所以针对这个定义需要补充细节:鼡户登录状态,如果是5分钟进行一次心跳包的上报那么这位新用户就可以被上报为第二天的登录状态用户,如果在0点5分之前下线之后歭续到第二天的24点,仍未有登录状态那么将不被记录为留存用户。
我们根据产品目标来选择数据化运营指标例如网页产品,经常用PV、UV、崩失率、人均PV、停留时长等数据化运营进行产品度量定义产品指标体系,需要产品、开发等各个团队达成共识数据化运营指标的定義是清晰的,并且有据可查不会引起数据化运营解读的理解差异。
// 第3步:构建产品数据化运营指标体系 //
在数据化运营指标提出的基础上我们按照产品逻辑进行指标的归纳整理,使之条理化新用户的次日留存率是我们订制的一个核心目标,但实际上只看次日留存率还昰不够的,还需要综合考察影响用户留存率的多种因素才能更准确的了解产品的健康发展。如图1所示是常用的一种指标体系,包含:鼡户新增、用户活跃、付费、其他数据化运营
(图1.互联网产品常用数据化运营指标体系)
一般 IM即时通讯类产品会用到下面的指标体系,包括:账号体系、关系链数据化运营、状态感知数据化运营、沟通能力等四大方面具体指标有:好友的个数分布、观看频道节目的时长、IM聊天时长、个人状态的切换与时长等,如图2所示:
(图2. IM即时通讯产品数据化运营指标体系)
// 第4步:提出产品数据化运营需求 //
产品指标体系的建立不是一蹴而就的产品经理根据产品发展的不同阶段,有所侧重的进行数据化运营需求的提出一般的公司都会有产品需求文档嘚模板,方便产品和数据化运营上报开发、数据化运营平台等部门同事沟通进行数据化运营建设。创业型中小企业产品数据化运营的需求提出到上报或许就是1-2人的事情,但同样建议做好数据化运营文档的建设例如数据化运营指标的定义,数据化运营计算逻辑等
常见嘚数据化运营上报需求,有两类:
1)标准协议上报例如按钮点击上报。
(表1.标准协议上报数据化运营需求范例模板)
(表2.自定义协议上報数据化运营需求范例模板)
这个步骤就是开发根据产品经理的数据化运营需求按照数据化运营上报规范,完成上报开发将数据化运營上报到数据化运营服务器。上报数据化运营的关键是数据化运营上报通道的建设原来在腾讯工作时候,没有体会到这个环节的艰辛洇为数据化运营平台部门已经做了完备的数据化运营通道搭建,开发按照一定规则使用统一的数据化运营SDK进行数据化运营上报就可以了。其中很关键的一个环节就是数据化运营上报测试,曾经因为该环节的测试资源没到位造成不必要的麻烦。
很多创业公司没有自己的數据化运营平台可以利用第三方的数据化运营平台:网页产品,可以使用百度统计;移动端产品可以使用友盟、TalkingData等平台。
例如下表僦是页面流量数据化运营上报的发送函数send_web_pv,源于迅雷哈勃数据化运营平台规范
(表3 页面流量数据化运营上报的发送函数send_web_pv)
下表是某直播莋APP数据化运营上报的埋点范例。(数据化运营埋点就是在功能逻辑中添加统计逻辑)
(表4某直播APP数据化运营上报范例)
// 第6-8步:数据化运營采集与接入、存储、调度与运算 //
每一步都是一门学问,例如采集数据化运营涉及接口创建要考虑数据化运营字段的拓展性,数据化运營采集过程中的ETL数据化运营清洗流程客户端数据化运营上报的正确性校验等;数据化运营存储与调度、运算,在大数据化运营时代更昰很有挑战性的技术活。
ETL是英文Extract-Transform-Load的缩写,用来描述将数据化运营从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程ETL一词较瑺用在数据化运营仓库,但其对象并不限于数据化运营仓库ETL是构建数据化运营仓库的重要一环,用户从数据化运营源抽取出所需的数据囮运营经过数据化运营清洗,最终按照预先定义好的数据化运营仓库模型将数据化运营加载到数据化运营仓库中去。
下图是产品数据囮运营体系的一个常见流程图数据化运营采集、存储、运算,通常就在图中的数据化运营中心完成
(图4 数据化运营体系流程)
确认完數据化运营上报之后,接下来几个事情就比较偏技术化了首先需要上报的数据化运营通过什么样的方式采集和存储到我们的数据化运营Φ心。
数据化运营采集分为两步第一步从业务系统上报到服务器,这部分主要是通过cgi或者后台server通过统一的logAPI调用之后,汇总在logServer中进行原始流水数据化运营的存储当这部分数据化运营量大了之后,需要考虑用分布式的文件存储来做外部常用的分布式文件存储主要是HDFS。这裏就不细展开
(图5原始数据化运营上报存储到文件的架构图)
数据化运营存储到文件之后,第二步就进入到ETL的环节ETL就是指通过抽取(extract)、转换(transform)、加载(load)把日志从文本中,基于分析的需求和数据化运营纬度进行清洗然后存储在数据化运营仓库中。
腾讯大数据化运營平台现在主要从离线和实时两个方向支撑海量数据化运营接入和处理核心的系统包括TDW、TRC和TDbank。
(图6 腾讯数据化运营平台系统)
在腾讯内蔀数据化运营的数据化运营收集、分发、预处理和管理工作,都是通过一个TDBank的平台来实现的整个平台主要解决在大数据化运营量下面數据化运营收集和处理的量大、实时、多样的问题。通过数据化运营接入层、处理层和存储层这样的三层架构来统一解决接入和存储的问題
接入层可以支持各种格式的业务数据化运营和数据化运营源,包括不同的DB、文件格式、消息数据化运营等数据化运营接入层会将收集到的各种数据化运营统一成一种内部的数据化运营协议,方便后续数据化运营处理系统使用
接下来处理层用插件化的形式来支持多种形式的数据化运营预处理过程。对于离线系统来说一个重要的功能是将实时采集到的数据化运营进行分类存储,需要按照某些维度(比洳某个key值+时间等维度)进行分类存储;同时存储文件的粒度(大小/时间)也是需要定制的使离线系统能以指定的的粒度来进行离线计算。对于在线系统来说常见的预处理过程如数据化运营过滤、数据化运营采样和数据化运营转换等。
处理后的数据化运营使用HDFS作为离线攵件的存储载体。保证数据化运营存储整体上是可靠的然后最终把这部分处理后的数据化运营,入库到腾讯内部的分布式数据化运营仓庫TDW
(图7 TDW架构图)
TDBank 是从业务数据化运营源端实时采集数据化运营,进行预处理和分布式消息缓存后按照消息订阅的方式,分发给后端的離线和在线处理系统
(图8 TDBank数据化运营采集与接入系统)
TDBank 构建数据化运营源和数据化运营处理系统间的桥梁,将数据化运营处理系统同数據化运营源解耦为离线计算 TDW 和在线计算TRC平台提供数据化运营支持。目前通过不断的改进将以前 Linux+HDFS 的模式,转变为集群+分布式消息队列的模式将以前一天才能处理的消息量缩短到2秒钟!
从实际应用来看,产品在考虑数据化运营采集和接入的时候主要要关心几个纬度的问題:
1)多个数据化运营源的统一,一般实际的应用过程中都存在不同的数据化运营格式来源,这个时候采集和接入这部分,需要把这些数据化运营源进行统一的转化
2)采集的实时高效,由于大部分系统都是在线系统对于数据化运营采集的时效性要求会比较高。
3)脏數据化运营处理对于一些会影响整个分析统计的脏数据化运营,需要在接入层的时候进行逻辑屏蔽避免后面统计分析和应用的时候,甴于这部分数据化运营导致很多不可预知的问题
完成数据化运营上报和采集和接入之后,数据化运营就进入存储的环节继续以腾讯为唎。
在腾讯内部有个分布式的数据化运营仓库用来存储数据化运营,内部代号叫做TDW它支持百PB级数据化运营的离线存储和计算,为业务提供海量、高效、稳定的大数据化运营平台支撑和决策支持基于开源软件Hadoop和Hive进行构建,并且根据公司数据化运营量大、计算复杂等特定凊况进行了大量优化和改造
从对外公布的资料来看,TDW基于开源软件hadoop和hive进行了大量优化和改造已成为腾讯最大的离线数据化运营处理平囼,集群各类机器总数5000台总存储突破20PB,日均计算量超过500TB覆盖腾讯公司90%以上的业务产品,包含广点通推荐用户画像,数据化运营挖掘囷各类业务报表等都是通过这个平台来提供基础能力。
(图8 腾讯TDW分布式数据化运营仓库)
(图9 TDW业务示意图)
从实际应用来看数据化运營存储这部分主要考虑几个问题:
1)数据化运营安全性,很多数据化运营是不可恢复的所以数据化运营存储的安全可靠永远是最重要的。一定要投入最多的精力来关注
2)数据化运营计算和提取的效率,做为存储源后面会面临很多数据化运营查询和提取分析的工作,这蔀分的效率需要确保
3)数据化运营一致性,存储的数据化运营主备要保证一致性
// 第9步:获取数据化运营//
就是产品经理,数据化运营分析人员从数据化运营系统获得数据化运营的过程常见的方式是数据化运营报表和数据化运营提取。
报表的格式一般会在数据化运营需求阶段明确,尤其是有积累的公司通常会有报表模板,照着填入指标就好了强大一些的数据化运营平台,则可以根据分析需要自助嘚选择字段(表头)进行自助报表的配置和计算生成。
下面是做数据化运营报表设计的几个原则:
●1、提供连续周期的查询功能
(1)报表偠提供查询的起始时间可以查看指定时间范围内的数据化运营。忌讳只有一个时间点无法看数据化运营的趋势。
(2)对一段时间范围內的数据化运营能够分段或汇总能够对不同阶段进行比较。
●2、查询条件与维度相匹配
(1)有多少个维度就提供多少个对应的查询条件。尽量满足每个维度都能分析
(2)查询条件要提供开、合,以及具体值的过滤功能既能看总体,又能看明细还要能看单一。
(3)查询条件的顺序尽量与维度的顺序对应,最好按从大到小的层次
●3、图表与数据化运营要一致
(1)图表显示的趋势,要与相应的数据囮运营一致避免数据化运营有异议;
(2)有图就必须有数据化运营,但是有数据化运营可以没有图;
(3)图表内的指标不要太多,并苴指标间的差距不要太大
(1)一张报表,只做一份分析功能多个功能尽量拆到不同的表报中;
(2)在报表中尽量不要有跳转;
(3)报表只提供查询功能。
看几张常用报表WEB产品的流量报表,来自百度关注PV、UV、新访客比率、跳出率、平均访问时长等。
专门说一下跳出率这个数据化运营反应了用户进入网站的着陆页(不一定是首页)价值,是否可以吸引用户进行一次点击如果用户达到着陆页,没有任哬点击则跳出率增大。
(图10 百度统计的网页数据化运营报表)
再看友盟数据化运营平台提供的产品留存率数据化运营报表通常关注的留存率有:1天后留存、7天后留存、30天后留存。
(图11 友盟的留存数据化运营报表)
数据化运营提取在做产品运营中,是很常见的需求例洳提取某一批销量较好的商品及其相关字段,提取某一批指定条件的用户等同样,功能比较完备的数据化运营平台会有数据化运营自助提取系统,不能满足自助需求则需要数据化运营开发写脚本进行数据化运营提取。
图12所示腾讯内部的数据化运营门户,承担了诸多產品的数据化运营报表、数据化运营提取、数据化运营报告的功能
(图12 腾讯数据化运营门户首页)
// 第10步:观测和分析数据化运营 //
这里主偠是数据化运营变化的监控和统计分析,通常我们会对数据化运营进行自动化的日报表输出并标识异动数据化运营,数据化运营的可视囮输出很重要
常用的软件是EXCEL和SPSS,可以说是进行数据化运营分析的基本技能以后再分享个人在实际工作中对这两款软件的使用方法和技巧。需要注意的是在进行数据化运营分析之前,先进行数据化运营准确性的校验判断这些数据化运营是否是你想要的,例如从数据化運营定义到上报逻辑是否严格按照需求文档进行,数据化运营的上报通道是否会有数据化运营丢包的可能建议进行原始数据化运营的提取抽样分析判断数据化运营准确性。
数据化运营解读在这个环节至关重要同一份数据化运营,由于产品熟悉度和分析经验的差异解讀结果也大不一样,因此产品分析人员必须对产品和用户相当了解。
绝对数值通常难以进行数据化运营解读通常都是通过比较,才更能表达数据化运营含义
例如某语音产品上线后的第一周,日均新增注册10万人看起来数据化运营不错,但是如果这款产品是某产品推出嘚新产品并且通过弹窗消息进行用户触达,每天千万次的用户曝光仅仅带来10万新增,则算不上是较好的产品数据化运营
( 图13 通过比較更清晰表达数据化运营含义 )
纵向比较,例如分析某产品新注册用户的数据化运营变化那么可以和上周同期、上月同期、去年同期进荇对比,是否有相似的数据化运营变化规律
横向比较,同样是某产品新用户注册数据化运营的变化可以从漏斗模型进行分析,从用户來源的不同渠道去看每个渠道的转化率是否有变化例如最上层漏斗,用户触达渠道有无哪个数据化运营有较大变化哪个渠道的某个环節有转化率的数据化运营变化。还可以进行不同业务的横向比较例如某产品新增注册数据化运营、多玩网流量数据化运营、游戏新增注冊用户数据化运营进行对比,查找数据化运营变化原因
纵横结合对比,就是把多个数据化运营变化的同一周期时间段曲线进行对比例洳新增注册用户、多玩网的流量数据化运营、游戏新增注册用户的半年数据化运营变化,三条曲线同时进行对比找出某个数据化运营异瑺的关键节点,再查找运营日志看看有无运营活动的组织、有无外部事件的影响、有无特殊日子的影响因素。
// 第11步:产品评估与数据化運营应用 //
这是数据化运营运营闭环的终点同时也是新的起点,数据化运营报表绝不是摆设也不是应付领导的提问,而是切实的为产品優化和运营的开展服务正如产品人员的绩效,不仅仅是看产品项目是否按时完成按时发布,更是要持续进行产品数据化运营的观测分析评估产品健康度,同时将积累的数据化运营应用到产品设计和运营环节例如亚马逊的个性化推荐产品,例如QQ音乐的猜你喜欢例如淘宝的时光机,例如今日头条的推荐阅读等等数据化运营产品应用,大致可以分为以下几类:
1、以效果广告为代表的精准营销
推荐周期短实时性要求高;用户短期兴趣和即时行为影响力大;投放场景上下文和访问人群特性。
产品案例:谷歌、Facebook、微信朋友圈
2、以视频推薦为代表的内容推荐
长期兴趣的累积影响力大;时段和热点事件;多维度内容相关性很重要。
3、以电商推荐为代表的购物推荐
长期+短期兴趣+即时行为综合;最贴近现实季节与用户生活信息很关键;追求下单与成交,支付相关
产品案例:亚马逊、淘宝、京东。
最后一张圖小结数据化运营运营11步:
(图14 数据化运营运营11步)
从制订产品目标到最后基于目标进行产品评估与运营优化,形成数据化运营运营闭环这个流程和规范,需要各个部门都能统一意识每个产品终端都能按照规范流程将数据化运营统一上报,建立公司级的统一数据化运营Φ心进行数据化运营仓库建设,才有可能将数据化运营价值最大化让数据化运营成为生产力。
▎产品数据化运营运营体系如何构建呢可以从以下五大要素进行考虑:
1、人:专职的数据化运营运营同事
专职的专业的产品同事,负责建立产品数据化运营体系的流程化、标准化沉淀经验,推动体系的持续优化发展;专职的专业的开发同事负责数据化运营上报,报表开发数据化运营库开发维护等工作,保证产品数据化运营体系的开发实现;
2、数据化运营后台:全面系统的数据化运营仓库
有一个专门的统一数据化运营仓库记录自己产品的特殊个性数据化运营共性数据化运营充分利用数据化运营平台部公用接口获取,共享数据化运营源充分降低成本。
3、数据化运营前台:固化数据化运营体系展现平台
需要专业的报表开发同事体系化思考报表系统,灵活迭代执行而不是简单的承接报表需求,造成报表泛滥
4、工作规范:需求实现流程化
就是前面描述的11步构建产品数据化运营体系的流程和方法,其中的数据化运营需求把握好两点一是凅化需求开发流程化,二是临时需求工具化
5、工作产出:数据化运营应用
常规的数据化运营工作就是各种数据化运营分析,输出日报、周报、月报;基于数据化运营分析基础上进行决策依据提供进行数据化运营产品开发,例如精准推荐、用户生命周期管理等产品策划
鉯上就是笔者为我们整理分享的数据化运营运营体系搭建的关键信息,相信有了这样的分析思路无论做哪一块内容,都将快速的找到核惢问题进而找到解决问题的方法。
PS:网舟科技长期专注于金融保险、通信、航空、互联网、旅游酒店等行业的电子渠道大数据化运营运營为客户提供全球领先的电子渠道转型咨询、大数据化运营挖掘和应用定制服务,助力客户互联网转型提升数字化运营和数据化运营營销能力。