阿里数据官网(阿里数据)
随着业务规模的扩大,相关数据量增加,数据指标数量增加。如果没有指标体系,就很难衡量产品/活动的效果,也很难判断整体的业务发展。本文通过拆解阿里的指标规范,为建立数据指标体系提供一些参考。
在OneData成立之前,阿里数据有3万多个指标,其中,即使名字相同,定义也不一致。即使是中型公司,也是如此。随着数据量的增加,数据指标会越来越多,缺乏指标体系的管理会出现各种各样的问题。
一、指标不规范带来的问题1. 在数据指标概念=0时,业务方按“我觉得”来办事,难以衡量效果
产品设计和运营的同学通常是:我觉得用户会喜欢我们的新功能,我觉得新的活动会有好的效果…..
领导会问,这种“感觉”有依据吗?如何衡量用户对这个新功能的喜欢程度?如何判断活动的效果,有多少人参与或者转化了多少?
这样的问题,其实设计师们也是稀里糊涂,一脸傻逼,不问设计原因,问的就是回答其他竞品也有这个功能,所以我们也这么做...
你认为你被抓住了吗?
但大量产品人员已经意识到传统的盲目设计、抄袭设计时代已经过去,数字化产品时代已经到来,开始尝试用数据指标辅助商业决策。所以我开始进入下一个阶段…
2. 此时数据指标概念=0.5,有单点数据指标,但难以看出整体业务问题
在这种情况下,我们通常使用我们想到的任何业务指标。
举个例子,当你看到厕神、友盟等数据分析厂商通常使用GMV、日活用户、月活用户、PV、UV、页面停留时长等数据时,所以产品设计师会先抄进去,具体使用时再想一些指标,然后一个一个加进去。
以网约车为例。今天的GMV减少了50%。是什么原因造成的?
分析师回答:受疫情影响,乘客订单量下降20%。
这是平台目前的指标。30%呢?有什么问题?
于是分析师查了一下数字,发现网约车司机数和接单司机数下降了30%,于是他急忙描述了临时想到的这两个指标的业务含义,经过一系列沟通协调,临时增加了R&D。
这种做法有什么问题?
指标修改成本大。研发团队需要重新进行数据采集、清洗、存储工作。取值定义不清晰,数据不准确。指标缺乏定义规范,各部门理解难度大。会产生一些重复指标,如指标名称相同,含义不同,例如都叫注册司机,一种定义的是注册手机号成功即为注册司机;一种定义的是加盟成功了的是注册司机。存储、计算、研发成本高:没有统一的规范管理,造成了重复计算的资源浪费;数据的层次和粒度不清晰,使得重复存储严重。二、理解OneData指标规范
既然指标体系不提前设计会有很多问题,那么指标体的设计流程是怎样的呢?如何保证指标体系设计的规范性?
我们先来看看阿里是如何制定指标规范的:
基于维度建模,构建了总线矩阵,以及业务域、数据域、业务流程、度量/原子指标、维度、维度属性、修饰符、修改类型、时间段、派生指标等。被定义了。
1. 业务域
比数据域维度更高的业务划分方法适用于超大型业务系统,业务板块之间的指标或业务重叠度较小。比如专车业务板块包括乘客和司机,电商业务板块包括商城和返利模块。
2. 业务过程
业务流程可以概括为不可分割的行为事件,如以下计费、支付、评估等业务流程/事件。
看到这一系列名词,很多人可能开始不知所措,业务领域还是可以理解的。简单来说,就是不同业务的分类;业务流程也很好理解,相当于画了一个业务流程图。
那么数据域到底神圣在哪里?
3. 数据域
它是密切相关的数据主题和业务对象的概念分类的集合,目的是促进数据管理和应用。
简而言之,data domain类似于我们的计算机桌面。我们需要创建不同的文件夹来存储数据。这些文件夹称为数据域。
你怎么理解维度,维度属性,装修?有什么用?
4. 维度
它是一个测量环境,用来反映业务的一类属性。这些属性的集合构成了一个维度,可以从谁-哪里-什么时候-什么级别来查看。
5. 维度属性
属性属于维度,相当于维度的具体描述。例如,用户维度中的性别是男性还是女性。
6. 修饰词
指统计维度以外的指标的业务场景。
7. 修饰类型
修饰语的抽象划分。
简而言之,维度和修改可以理解为原子指标的一些限制性条件,懂sql的人会更懂。通常,在编写sql时,它们被放在where语句的后面。
8. 度量/原子指标
Atom和measurement含义相同,某个业务行为事件下的measurement是业务定义中不可分割的指标,比如注册数。
9. 时间周期
用于指定数据统计的时间范围或时间点,如最近30天、自然周、截止到今天等。
10. 指标类型
包括原子指示器和派生指示器。
原子指标 = 行为事件+度量派生指标 = 一个原子指标+多个修饰词+时间周期
例如:原子指数=完成票数,派生指数=上周完成的iOS乘客数,其中时间段=上周,修饰符=iOS,维度=乘客数,原子指数=完成票数。
三、制定自己的指标体系规范
接下来参考阿里的onedata数据标准,构建网约车系统中的数据指标。
业务背景:用车业务是网约车整体业务中的一个核心,处于多次循环迭代中,存在指标定义不规范,业务方频繁提出新增指标,技术修改难度大等问题,所以目前需要从业务整体角度重新构建指标体系。业务目标:标准化指标体系,提升指标提取工作效率。行动:在构建指标体系的过程中,首要动作要明确指标分类和约束指标命名方式,使各个指标能够做到见名知意、减少沟通成本,这里我们参照阿里对指标的划分,来规范建设指标体系。1. 调研业务需求与分析业务流程
1)研究业务需求
充分的业务调研是指标体系构建的基础。数据指标体系建设项目启动前,需要了解具体业务,与各业务方详细梳理关键业务流程。
需求收集可以分为两种:定量收集和定性收集。发放定量调查问卷,广泛收集业务需求。进行定性的用户访谈,深入挖掘业务应用场景和核心需求。详细的需求收集和分析方法。《需求收集与分析》这篇文章之前已经写过了,这里不展开,供参考。
2)分析业务流程
根据阿里巴巴onedata的最佳实践,业务流程可以概括为一个不可分割的行为事件。梳理数据的逻辑关系和流向,首先要了解用户的业务流程,以及业务流程中涉及的数据系统。
以下面的网约车系统为例,梳理司机和乘客的业务流程和数据指标。
乘客流程可以分为:注册/落地、下单、服务、支付、评价/客服投诉。
核心流程中生成的业务指标:
注册/登陆阶段:新用户数、用户数、不同渠道用户数下单阶段:下单量、新用户下单量、老用户下单量、不同城市下单量数据、不同车型下单量数据、下单成功用户数决策阶段:议价订单数、非议价订单数、决策阶段用户主动取消订单数、决策阶段超时取消数、数加价完成订单数、减价完成订单数服务阶段:下单成功用户数、订单时长、下单成功率、完单量、完单率、完单用户数支付阶段:订单金额、订单平均金额、订单优惠金额、计费差额评价阶段:好评率、差评率
驱动业务流程可以分为:
业务流程中产生的核心业务指标:
注册/登陆阶段:注册用户数、新增用户数加盟阶段:提交审核用户数、审核通过用户数、新注册司机、累计注册量、老司机量、新司机量接单阶段:在线司机数、听单司机数、有效听单司机数、中标司机数、中标率、日均中标司机数决策阶段:决策阶段司机取消订单数服务:服务平均距离、平均时长、空驶平均距离、空驶平均时长评价:司机好评率、司机差评率、平均星级提现:司机余额、提现次数、提现金额
定义了用户的业务流程后,需要根据分析决定的业务划分数据域,将具体的业务流程拆解到对应的数据域下。
2. 划分数据域
数据:密切相关的数据主题的集合,以及业务对象的概念分类,目的是促进数据管理和应用。
这相当于对数据进行分类,类似于我们的电脑桌面设置不同的文件夹来存储数据。我们的数据是针对不同的业务人员的,比如营销、运营、客服、风控等等,他们的业务模块差别很大。
而我们的技术人员要给他们提供各种数据指标,查找效率低,服务器计算成本高(你想想在电脑搜索框里查一个文件名有多慢),业务人员很难及时得到数据。没办法,那我就把数据做个分类,这样我们以后就可以快速找到数据,横向展开数据。
所以在划分数据域时,我们还应该注意:
能涵盖当前所有的业务需求能拓展新业务进入已有数据域,或者拓展新的数据域
这相当于在计算机上命名一个文件夹。它包含所有当前文件(数据)。当一个新文件生成时,它可以放在一个现有的文件中,或者方便地创建一个新文件。
根据各模块的业务需求和业务流程分析,可以划分数据域。通常数据域可以按照企业部门来划分,比如客服、运营、市场等。也可以按照业务流程或业务板块的功能模块来划分。
例如,网络汽车共享系统中的汽车服务域可以划分为下表所示的数据域,数据域可以根据实际的业务流程进行归纳和抽象。
3.定义指标规范-构建总线矩阵。我们梳理了业务域、数据域和业务流程的总体框架,然后设计了指标规范。
简单理解就是我们设计了文件夹的一级、二级、三级目录结构规范。现在我们必须设计文件命名结构规范。
常用的指标基本都是根据个人理解来命名的,没有特别的规范,比如日/月用户、近一个月的下单量、已完成订单量等。但是随着数据指标的增加,有限条件下的指标很多,比如北京快递最近7天的订单量。这个指标是怎么设计的?有没有一套标准的指标设计?
如上图所示,设计指标时,需要明确业务域=汽车服务,数据域=服务域,业务流程=订货,维度=城市,属性=北京,时间段=近7天,修改量=快递,计量/原子指数=订货数量。通过增加原子指标上的约束条件,可以规范衍生指标的生成=北京快递最近7天的订单量,提供一套定义指标的通用标准,方便不同业务部门的人理解指标的含义。
以网络拼车系统中的服务域为例,制定如下总线矩阵,将业务流程分为下单、派单、决策、开始行程、订单完成。
矩阵是仓库架构师用的,产品人员很难理解。其实类似于数学中的矩阵和排列组合。一个原子索引可以获得数千个不同维度约束组合的派生索引。
本文从数据产品的角度总结了如何基于阿里OneData构建网络约车指标体系。通过业务分析、数据域划分和总线矩阵构建,建立了一套指标设计规范。通过建立指标规范,可以提高R&D和业务方的指标获取效率,为后续的自助分析奠定基础。
在设计索引规范的过程中,发现会产生成千上万的索引。这些指标中哪些能真正为商务当事人提供指引?
下一篇文章将讲解如何根据GSM模型和AARRR模型确定核心业务指标,以及如何设计指标字典。
#专栏作家#
大鹏,微信官方账号:一个数据人的私订。人人都是产品经理专栏作家,也是《数据产品经理实践手册》的作者。
本文由人人作为产品经理原创发布。未经许可,禁止复制。
来自Unsplash的图像,基于CC0协议。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。系信息发布平台,仅提供信息存储空间服务。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。
本文来自网络,若有侵权,请联系删除,作者:丁阳一,如若转载,请注明出处: