大数据指标波动有多大

    作者:接地气的陈老师更新于: 2021-09-22 17:00:31

    数据分析一问:指标波动有多大,才算是大!随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

    “分析下今天的波动”是数据分析师最常听到的任务。也是最头疼,最纠结,最难搞清楚,还得天天搞的任务。

    大数据指标波动有多大_缓存技术_分布式存储_神经网络_课课家

    本文转载自微信公众号「接地气学堂」,作者接地气的陈老师。转载本文请联系接地气学堂公众号。 

    “分析下今天的波动”是数据分析师最常听到的任务。也是最头疼,最纠结,最难搞清楚,还得天天搞的任务。

    • 下降1%,算不算波动大
    • 下降5%,算不算波动大
    • 下降10%,算不算波动大
    • 下降50%,算不算波动大

    为啥有时候下降了50%,业务却没反应,可下降了1%业务急的吱哇乱叫!!!

    今天我们系统讲解一下

    1指标波动的本质

    举个简单的例子,体温37.4度VS体温36度,只有3.9%的波动,可真要在测温点被发现体温37.4度,估计马上被保安请出去。为啥?因为人们怕的不是5.5%波动,而是怕新冠!体温37.4度表明:有可能有病毒!这才是人们真正怕的东西。

    所以:指标波动不可怕,指标波动代表的业务含义才可怕!脱离业务含义谈指标波动就是耍流氓。理解这一点,才能继续讨论。

    2指标波动的三类业务含义

    第一类:硬指标波动。

    有一些指标是刚性考核业务部门的。比如

    考核销售:业绩、回款

    考核商品:库存、毛利

    考核客服:接听、投诉

    这些指标是刚性考核业务结果,意味着:必须达成指定数量,否则即使差1%都是问题。因此,常把它们称为:硬指标。这点在销售上表现最明显,定好的业绩目标,哪怕只差0.5%,没达标就是没达标,奖金一分没有!

    背刚性指标的部门,对波动最敏感,并且锱铢必较的就是他们。硬指标不达标可能直接意味着挨骂、扣钱。所以硬指标波动特别受关注。

    第二类:软指标波动。

    诸如注册用户数、用户点击率、转化率一类指标。

    这些指标往往是通往业务结果的过程,就像得先有注册用户,才有后边的浏览、加入购物车、消费一样。软指标上升下降不见得是问题,有可能是一种新的业务形态(如下图),有可能是偶然发生的变化。因此,软指标的变化不会直接引发业务动作。人们更多关心:这种变化到底是好是坏,会不会对硬指标有潜在的影响。这种纠结的情绪,会让分析格外麻烦。

    注意:硬指标和软指标的区分,不是一成不变的。比如很多互联网公司会考察“用户增长”,这时候注册用户数就是个硬指标,逼着推广部门完成。因此区分硬指标和软指标,要看部门具体KPI要求。

     第三类:边缘指标波动。

    诸如满意度、知名度等指标。这些指标有共同特点:

    1、本身是抽样调查得来的,非全量统计。意味着抽样方法、问卷方法、调查时间等非业务动作,也可能影响到结果。它不能直接反应业务问题。

    2、与硬指标、过程指标关系不大,或难以直接验证结果。比如满意度,满意度高是不是意味着100%购买,不见得;满意度低,是不是意味着不买?也不见得。

    3、人为操作影响大。比如换一种抽样方式,立马结果变化。比如硬砸一波广告/优惠,数值立马提高。

    这种不准确、没啥用、易操控的指标,也会有波动,也会引起人们的关注。但是明白了这些指标的逻辑,大家会发现,想把丫波动控制住简直太容易了,只要搞搞数字游戏就可以。

    了解了三大类型以后,在应对指标波动的时候,就有方向感:硬指标>软指标>边缘指标,按这个顺序抓重点,不要面对一屏幕指标高了低了,急的直挠头。

    有了主次之分,就能进一步考虑判断大小标准。

    3判断波动大小的标准

    第一步:剔除伪波动。

    有很多波动是自然波动。

    比如周末、节假日、工作日之间的交易额区别。

    比如产品上市、热销、退市的用户数变化。

    比如公众号发文以后7天内阅读衰减。

    这些指标天生会有变化形态。平时多总结经验指标形态,就能发现规律(如下图):

    发现规律以后,只要符合规律的波动,一律是伪波动!伪波动即使波动数值再大也不用慌,都是常事。但是逆规律而动的,则是:事出反常必有妖!无论波动大小,都是重大变化,都得小心观察。

    第二步:量化主动行为。

    有很多波动是业务主动引发的。

    比如做促销,拉一波销量

    比如搞培训,加强工作能力

    比如做清仓,把库存尽快甩出去

    这些指标的变化,本身是由业务引起的。

    面对这种情况。首先要收集清楚:到底业务在干啥。不然分析了半天,人家来一句:“我早知道了”“就是我干的”这就贻笑大方了。

    其次,要收集清楚,每一个业务动作的目标和结果,这样能方便评估“指标波动是否达成业务预期”。这是个重要的评价标准,一定要标红加粗记下来。主动行为且指标波动达成预期的情况下,业务是不会纠结的。达不成预期的时候,他们就会很想知道:“到底差在哪里?”这时候拿着业务期望值找差距,就很重要(如下图)

    对于达成业务期望的,无论波动范围多大,都属于可接受。既然是主动引起的增长/下跌,肯定是指标变化越大越好。对于未达成期望的,要看期望值差距,差距部分才是要分析的波动值。

    第三步:量化外部影响。

    有很多波动是可收集的外部行为导致的。比如政策限制、天气、对手等等。注意:外部因素有很多不能收集到数据,落实影响。也有很多,即使知道了影响,也没法干啥事——总说下雨影响业绩,那也不能烧香求龙王吧。

    因此,对外部影响,评估其波动大小,不要看一天的绝对数,而是要测算该影响预计持续时间,推算在这个时间内,总共产生的影响值,这个数值才是衡量波动的标准。

    第四步:其他意外波动。

    是否有既不符合规律,又没有业务主动动作,又没有外部因素,数据本身也没有问题,但是就是发生波动的情况?

    有!这个时候应首先定位波动发生点:

    • 全局性波动,还是局部波动
    • 持续性的,还是突发性的
    • 波动数值,大还是小

    判断问题大小的标准:

    • 全局性>局部问题
    • 持续性>短期问题
    • 数字越大,问题越大

    锁定问题点后,可以结合指标的属性,思考对策(如下图)。

    • 针对硬指标波动:只要硬指标未达标,就是重大问题。考虑采取措施,保住指标
    • 针对软指标波动:只要关联的硬指标没崩,就不是重大问题。不纠结一朝一夕的波动,集中精力发现深层原因。
    • 针对边缘指标波动:不用害怕!想扭过来分分钟的事。

    这样区分以后,就有了清晰的处理方向。该用雷霆手段就果断下手,该慢慢看的就慢慢看。不然不分轻重缓急,只是自己在慢悠悠的“拆解数据-拆解数据-拆解数据”,不是被嫌弃“小题大做”“我早知道了”就是人家业务已经把问题处理完了,这边数据分析报告还没好呢。

    4为什么永远有人纠结波动

    小结一下:想沉着冷静的应对指标波动,需要的是以下两点:

    业务部门知道自己要做什么:

    1、清楚哪些是硬指标、软指标,哪些是边缘指标

    2、清楚自己的行为能对指标影响到什么程度

    3、清楚短期、中期、长期自己能干啥

    4、清楚自己的短期做的事是否达成了效果

    数据部门,要知道到底发生了什么:

    1、哪些是业务主动行为,他们想做到多少

    2、哪些是规律性的变化,范围在什么水平

    3、哪些可量化外部因素,到底能带来多大变化

    4、哪些是异常变化,存在于什么位置

    而遗憾的是,现实的情况常常是:

    业务部门只会闷头干活。对自己要干多少、能干多少、已经干了多少,从来没量化过。看到一点指标波动就如惊弓之鸟(如下图)

    数据部门一不懂指标业务含义,二不知业务在干什么,三不知规律如何量化。只会拿个指标和性别、年龄、地域、渠道等等一通交叉,摆出一堆柱子,哪根短了就大喊:“波动都是因为这根短了!”还美其名曰:“多维度拆解法”,还写成文章在网上到处毒害新人……

    所谓盲人骑瞎马,大概就是这个感觉。至于指望着“从头、腾、阿公司,请一个高级数据科学家,建立人工智能大数据模型,一张嘴就天知地知”,则已经是病入膏肓指望着救命仙丹的想法了。

    1、量化业务目标与业务行为

    2、梳理业务逻辑并归纳为报表

    3、总结历史经验与发展趋势

    4、评估现状,测算差距

    这些基础、简单、细节的工作,才是应对“指标波动焦虑”的最好办法。有同学可能会问:软指标部分,到底要咋分析,才能解读出深层次含义。

    大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

课课家教育

未登录