[网摘]数据的“忽悠”功能

作者:sujie_alex  于 2013-1-24 10:26 发表于 最热闹的华人社交网络--贝壳村

作者分类:网文|通用分类:网络文摘

 

@cnsns 前言:1.本文作者@数据化管理 黄爷,长期跟数据打交道,用于管理,有丰富的数据实施经验,微博大号;2.“忽悠”到处都是,如何养成数据化思维,比只看数据更有意义。

本人在新浪微博(http://t.sina.com.cn/chemyhuang)玩了一年有余,基本上见证了各时期的大事件,最大的感受是很多脖友为了博眼球,增加粉丝,不惜说假话,移花接木,歪曲事实。对他们我的评价是:语不惊人誓不休,为赋新词强说愁。很多脖友为了证明自己观点的正确性,不惜创造“数据”。

比如某著名脖友的微博:50%白领认为,房租上涨影响了生活质量(2010年7月23日的微博)。首先,50%这个数据可能是创造出来,没有标明来源。其次如果我是已经买了房产的白领,房租上涨多少对我来说没有丝毫影响,相反如果我有好几套房,我可能因为房租收入高了反而提高生活质量。第三房租上涨了多少会影响生活的质量,10%?20%?当然不可否认这个微博达到了吸引眼球的作用!

对于企业的管理人员来说,这种“假”数据是深恶痛疾。原因不言而喻:造成资源浪费,决策失误,贻误战机等等。简单总结一下“有问题数据”的几个方面来源,帮助大家早日练成火眼金睛。(注:有问题的数据并不代表一定是假的数据)

一、随意编造假的数据来忽悠客户或老板

这种情况随处可见,对于某些人或组织来说,数据的严肃性根本就是一句空话,他们是要什么数据就编什么数据,他们是的名字叫”编“委。对于这种情况,我们一定要多问几个为什么,问清楚数据源就可以了。记住“无数据(源)就没有真相”。

这种情况还有个极端就是创造“数据”。比如报纸的发行量永远是世界上最难解的谜题,我也不知道答案。我只知道:

1、媒体自己公布的发行量实际上是他们的最高发行记录,一般来讲大家习惯去掉“最高”二字

2、当年某些报纸为了创造最高发行量,直接把报纸从印刷厂拉倒垃圾站,这种情况是公然而无耻的作假,后被禁止

3、前几年北京地铁流行买一份1元的报纸送你一瓶价值1~2元的饮料,也是为了变相的创造最高纪录。对外宣传是为了让大家“试看”个人博客:http://chemyhuang.blog.163.com/

二、定向取值问题

这是比一更具有隐蔽性和欺骗性的手段。何为定向取值?就是先假定一个结论,然后选取最利于这个结论的人群进行市场调查或研究,最后号称这个规律或结论具有普遍性。比如平均工资,我要让他高,就去写字楼访问,我要让他低,那就如劳务市场吧!这种方法是一种骗人的伎俩,要不得,可是很多人很热衷!

把这种方法用到极致的是市场调查公司和政府机关。比如某年某地区某高官说要在半年内将房价降价多少以上,半年以后他们真的做到了,可是老百姓并没有感到房价下降的趋势,为什么呢?原来他们玩了个数字游戏,半年前的样本是城区的房价平均,半年后加上了郊区的房价后取平均。很简单吧!鄙视这种行为。

市场调查公司我认为基本上是做良心品质。很多企业的老板会要求市调公司按照他们的结论来采样调查,然后用这个数据去公关或说服消费者。好的调查公司这种业务是不接的。可是现在的无良公司很多,对于这种市场调查数据最好是能了解到调查公司是那家,自己分析判断。

当然遇到好的调查公司的调查数据(意味着调查数据是真实的),有些企业也可以定向取结论。比如(此事例是为了说明问题,假设的数据,千万不要当真),比如某种牙膏宣传:使用该品牌的牙膏后将使蛀牙减少23%,这个数据是市场调查后的数据。当然这个数据对你一定是有诱惑力的。因为你认为减少的反义词就是没减少!可你是否知道他的背后有可能是这样的:23%的人蛀牙减少,40%的人没有任何反应,37%的人蛀牙反而增多了(当然这种可能性不大)。

三、系统误差

个人博客:http://chemyhuang.blog.163.com/

前两种情况都是数据人为误差,有的时候数据分析还有系统误差出现。好的调查公司的数据很多时候也是有问题的,这个倒不一定是定向取值的问题。举说明例。假设你要在一个公司内部调查一下大家对新来的总经理的看法,选项有三个:喜欢,没感觉,不喜欢。并且要求匿名投票,收回选票后数据显示如下:喜欢-70%,没感觉-20%,不喜欢-10%。由于是匿名投票你可能认为这个数据没问题了吧(假设没有拍马屁的现象)。

我的回答是不一定。因为很可能还有很多员工根本就没有投票。他们不投票的原因有可能是不知道,忙没来得及投等,还有就是这些弃权票很可能都是要投“不喜欢”的人,他们不想表达自己的真实想法,所以他们有目的的放弃了投票。想想联合国大会的弃权票吧,有点这个意思的吧。

四、眼见为虚

如果上面的几点还不能忽悠你,那再来个数据加图表,双重忽悠。让你觉得有图有真相。看看下面这两张图,你喜欢那张?

发现不同了吗?其实上面两张图的数据源一模一样,市场占有率都是从05年的23.5%增长到2010年24.8%,仅仅增长了1.3%。第一张图初一看市场占有率增长得气势如虹,第二张毫无亮点!有些公司更缺德,把左边的数据比率还給隐藏起来,名为保护公司机密!如果那样你就彻底被忽悠了。

这两张图各有用处,比如第一张可以給消费者看,第二张在向董事局要钱的时候可以給董事看!但是这样都是不对的,正确的做法是挑一个适当的比例尺。

我们来看看这种情况是不是随处都有,比如最新一期淘宝网的数据魔方上的一张图,大家看看是不是似曾相识(右边这张图):

Y轴的值一般EXCEL会自动调整,当然也可以人为调整,但如果调整过大(比如本例)就一定要醒目的标注出来,否则就有误导之嫌!

数据障眼法很多,特别是在中国这个盛产山寨和骗子的地方,所以各位,还是擦亮你的眼睛的。助理早日练成火眼金睛。

数据化管理的相关博客:

什么是数据化管理

如何发现销售报告中有错误的数据

超级数字天才:用数字思考变聪明的案例

几张非常有用的销售分析图表

友情提醒:本文的版权归原作者所有。如果用于商业目的,请与他/她联系chemyhuang@163.com。如果网络转载,请注明出处!谢谢你的支持!更多原创文章:http://chemyhuang.blog.163.com。在新浪、搜狐、网易,腾讯微博搜索“数据化管理”可以方便的找到作者本人。

高兴

感动

同情

搞笑

难过

拍砖

支持
1

鲜花

刚表态过的朋友 (1 人)

评论 (0 个评论)

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

sujie_alex最受欢迎的博文

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2013 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2024-3-27 13:43

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部