狡猾的谎言——我们是如何被事实和数字欺骗的?
谎言能欺骗人,但你知道不说谎也能欺骗人么?
今天我就来聊一类“真实的谎言“,这类谎言它说的每一个事实都是真的,每一个数字都是正确的,但它却能成功地欺骗我们。
如今,赤裸裸的谎言媒体和企业都已经不敢再明目张胆地使用,但今天所说的这类狡猾的“真实谎言”却大量地充斥着每个人的生活,先来几个例子大家感受一下——
一位自媒体作者的简介里写道:2006《时代周刊》年度人物、2008感动中国组委会特别大奖,你会不会觉得他已经到了自媒体金字塔的顶端?事实上2006时代周刊年度人物是“You”,即所有网民;而2018感动中国组委会特别大奖是——“全体中国人”
如果我给你一个组数据——市一中的升学率为49.3%,市二中的升学率为40%,你会把你的孩子送到哪个学校读书?
当然是市一中!对不起,你选错了!看一看下面一张表,不管是文科升学率还是理科升学率,市一中都没有市二中高,但它的总体升学率却高于二中,你没看错,数据就是这么神奇!
这个图,你是否觉着这个指标有涨有跌,总体表现较为平稳?
但事实上,真实的表现是2020年比2019年增长了一倍!
以上案例就是卫夕总结的“真实的谎言”的九种类型——1.公众号2倍增长——“小样本谎言”;
2.丁俊晖视频——“选择性展示谎言”;
3.贸易战汇报——“描述倾向谎言”;
4.时代周刊自媒体——“偷换概念谎言”;
5.美国枪支数——“平均数谎言”;
6.手掌大小与寿命——“相关当因果谎言”;
7.升学率选择——“辛普森悖论谎言”;
8.正副市长工资——“不恰当对比谎言”;
9.指标走势——“视觉误导性谎言”
下面魔术师卫夕就带你一起来揭开这些狡猾谎言背后的真面目——
一、小样本谎言
“我在过去9年里只收到过2张交通罚单”,你会不会认为我是一个极其遵守交通规则的司机?
然而事实是我上周三才拿到驾照开始开车。
小样本谎言是指用并不能代表整体的极小样本试图描述整体状况,这是一种基于真实数据说谎的典型方式,常见于多种实际场合——
注意:小样本谎言并不局限于用小样本来夸张倍数,也存在用小样本扩大整体范围,下面三句话大家感受一下——
1.自2002年韩日世界杯失利后,中国队在世界杯赛场上不败纪录已经延续17年
2.纵观漫长的世界杯史,中国队总共也仅输过三次
3.即使是巴西队这样的世界强队在世界杯比赛中也仅战胜过中国队一次
二、选择性展示谎言
选择性展示是最为常见的用事实欺骗人的方法,甚至没有之一,因为它实在是太常见了,英文中有一个词叫“Half-truth”,即给你看的部分是真的,但它只是事实的一部分,下面这张图很好地阐释了选择性展示——
我通常不看图书扉页上来自类似《纽约时报》的书评,为什么呢?
因为我知道书商的一个常见操作是——把《纽约时报》书评中好的部分挑出来,即便整个书评对这本书持否定态度:
比如书评写的是“这是一本在情节上引人入胜的小说,但它恶俗的价值观和对女性的蔑视只能让其成为三流作品……”,书商只会在封面上印上“这是一本在情节上引人入胜的小说”——《纽约时报》,所以大家要警惕来自外媒的书评,尤其是那些只有一句话的书评。
2007年,高露洁被英国广告标准管理局(ASA)下令禁止使用“超过80%的牙医推荐高露洁”这句宣传语,原因是因为它存在明显的误导,这个数据本身是独立而准确的,但它给消费者的感觉是——“剩下20%的牙医推荐其他品牌”,而事实上可能是——“90%的牙医推荐田七”(我随便说的,那份报告的确是牙医不止推荐一个品牌)
再看另一个例子,一些制药厂商在宣传时可能会说“我们这款胃药和其他同类型的胃药相比,长期服用也不会对胃造成副作用”,它宣称确实属实,但它没有告诉你的是——对胃是没有负作用,但是对肝有。
为什么很多人说:百度的财报新闻要去腾讯看,而腾讯的财报要去百度看,就是因为发在自家网站的新闻通常只会选择性展示财报中的利好。
现在,我终于理解我那经常看《参X消息》的高中地理老师为什么天天那么激动了!
三、描述倾向谎言
语言天然有着神奇的魔力,当我们的叙述方式发生微妙变化的时候,意思也就完全不同了,而这一点经常被很多语言大师所运用——
曾国藩率领湘军与太平天国作战,曾多次吃败仗,于是曾国藩上书朝廷,奏折提到“屡战屡败”,但被他的幕僚李元度看到之后将“屡战屡败”改为“屡败屡战”,这次改动被传为佳话,因为它显示其奋勇无畏的作战精神,然而现实中却被大量的人和企业用于刻意地欺骗。
胡适先生说“历史是任人打扮的小姑娘”,而事实又何尝不是呢,比如:
“三陪女白天去大学上课”,“女大学生晚上去当三陪女”,这其实描述的是同一件事,但从不同的角度叙述则含义完全不一致了。
当年罗永浩之所以要和做测评的王自如约战优酷,就是因为老罗认为王自如在测评T1的时候用了大量不易察觉的倾向性的表述将锤子T1描述成一款不合格的产品。
“我能在祈祷的时候抽烟吗?”、“不能!”;
“那我能在抽烟的时候祈祷吗?”、“可以”。
四、偷换概念谎言
偷换概念谎言其实源于我们对于书面表达的迷信,不同于我们日常使用的口头表达,书面表达体系长期用于严肃场合因而形成了一种天然的可信度,于是它就常被用来编织真实的谎言——
公众号“吓脑湿”举过一个例子——有人这样描述自己的互联网运营工作:
“他开始打造自己的私域流量,建立了一个庞大的私域流量池,并转化成社群,在着重提升社群活跃度的同时,用心做好社群运营。”
而实际上是——
“他用微信加好友,加了很多好友之后把他们拉进一个微信群,平时没事就在群里发些段子和沙雕图,偶尔发发广告”
如果我这么说——“我一个表妹是一个极其优秀和突出的女生,她大学毕业就成功进入一家世界五百强工作,而作为新人的她在第一年就成功化解了该公司的一个分支机构两次公关危机”
你会不会想了解一下这个优秀的年轻女生到底是如何做到的?甚至想让她给你即将毕业的弟弟传授一下经验......
而事实是,我表妹毕业后只是在麦当劳找到了一份收银的工作,而她的确成功调解过两次就餐顾客的投诉和纠纷。
下次碰到类似的谎言,你只需要对他说——“说人话!”
五、平均数谎言
马克吐温说过一句名言——“有三种谎言:谎言,该死的谎言和统计数据”,平均数也是统计数据中极具迷惑性的常用术语。
平均数谎言常见于各类不专业的媒体,比如腾讯2019年Q1发财报,显示员工人数5.46万,而腾讯的薪酬支出为116亿,由此媒体计算并制造出“腾讯员工平均月薪7万”的新闻,不仅大众炸锅,很多腾讯员工也直呼自己被平均了。
平均数只是描述一个总体的一个指标,当这个总体分布相对均匀的时候,平均数是有意义的,而当其分布及其不均匀时,用平均数试图描述每个人状况就不适合了,这时候中位数和众数在某种意义上更能体现分布,中位数指整体有一半比这个数高,另一半比这个数低,众数是指整体中分布最多的数。
我们看一个实际例子,假如你们宿舍5个人,毕业十年后,一个人失业,月工资0;
一个人当老板,一个月100万;
另外三人一人月入6万,另外两个人月入2万;
所有人月薪为0、2、6、2、100万,这时候平均数为22万、中位数为6万,众数为2万,显然,中位数6万和众数2万这两个数更能描述你们宿舍的实际情况。
嗯,马云可真有钱,我和王健林加起来还没有他多。
六、把相关当因果的谎言
在很多媒体在报道数据的时候经常一个误导读者的方式就是把相关关系错当成因果关系,的确这两个关系在现实中特别容易混淆。
观察到经常看电视的孩子最暴力,就直接下结论说电视使孩子们变得更加暴力,而可能存在的另一个原因是暴力的孩子更喜欢看电视。
中世纪欧洲一直认为虱子能预防风伤感冒,因为观察到感冒的人身上通常没有虱子,而事实上是虱子对体温特别敏感,如果人发烧了,虱子就离开了。
在医学界一个典型的案例——医学观察发现使用激素替代疗法的治疗冠心病的女性复发率率明显低于平均水平,于是很多医生认为这个疗法肯定比其他疗法更好,但之后的随机医学试验证实恰恰相反,这个疗法效果甚至还不如普通疗法,那么这是为什呢?
原来是因为该疗法前沿且价格高昂,而接受这一疗法的女性通常社会地位和财富地位相对较高,而她们的饮食习惯的健康程度和运动量也高于普通人,因而复发率低于普通人。
为了讲清楚因果和相关这个问题,我举一个栗子——比如某个地方车祸次数和黑熊袭击从数据表现上极其相关,大家可能第一时间想到的是黑熊袭击导致了车祸的发生,但事实上他们可能有四种关系:
所以之后不要看到相关的数据就认为他们之间一定是因果关系,我们要认真分析背后可能的具体原因和逻辑关系,国外有一个神奇的网站(https://tylervigen.com/)专门收集那种不可能有联系的虚假相关关系,比如这个:
“世界非商用太空发射次数和美国社会学博士授予量呈高度关系”
不要看到“刘姥姥一进荣国府,贾宝玉初试云雨情“,就瞎想贾宝玉的口味可真重!七、辛普森悖论谎言
回到开头的升学率的例子,一中在文科理科升学率都低于二中的情况下,总升学率却高于二中,很多人不理解,这其实是统计学上一个经典的悖论——辛普森悖论,它是英国统计学家E.H.辛普森于1951年提出的一个经典统计学现象,即总体结论和部分结论恰好相反。
那么这是为什么呢?是因为总体和部分在结构上呈现了大的差异,而这个差异有时候也会被人来制造谎言,1991年,科罗拉多大学的统计学家 Michael L. Radelet统计了1976-1987年美国佛罗里达州的谋杀案的数据,总体结果如下:
从结果上看,白人的死刑率为11%,黑人的死刑率为7.9%,看起来在审判上并没有种族歧视,然而真相并没有这么简单。
我们如果按凶手和被害人的种族进行细分,结论就完全不一样了,具体如下:
不管被害人是白人还是黑人,只要凶手是黑人,死刑率就明显高于凶手是白人的情况;
更让人发指的是,当被害者为黑人而凶手为白人的死刑率居然为0,即这种情况一个都没有判。
那么如何避免陷入辛普森悖论呢?
答案是警惕总体结论,通过科学合理的分组来查看具体细致的数据。
八、不恰当的对比
不恰当的对比也是用事实和数据说谎的一个常见方式,即把两个看起来差不多而事实上有重要差异的数据进行比较从而得出它想要的结果——
统计学家经常举的例子——在美国对西班牙的美西战争中,美国海军的死亡率为0.9%,而同期纽约市民的死亡率为1.6%,因此这个数据被美国海军引用作为征兵广告,以此证明去当美国海军甚至比坐在家里还安全。
聪明的读者一定猜到了这个对比极具误导性的,能入伍的都是身体健康的成年男性,而纽约市的全体居民则包含老幼病残。
华为在宣传它的手机P30 Pro的时候,把手机的ISO和佳能的两款单反进行了对比,于是网友在知乎上发布“自行车在拥堵时候的速度是兰博基尼的N倍”进行反讽。
三星也好不到哪里去,当华为的P30 Pro的主摄像头在专业影像网站DXOMark上的评分超越三星S10+时,三星无耻地发了一张下面的图,把后置摄像头和前置摄像头的评分加起来,以显示依然超过华为——
再看一个例子——2019年7月20日,周杰伦在一众粉丝的努力下登上了微博超级话题榜首,但微博CEO来总却发了一条帖子来说明这个事件对微博的流量并没有提升,而且来总有证据——
事实上来总说的降低的0.2%的这个对比其实就并不恰当,因为来总说的下降对比的是周六和周五的数据,而微博的流量特征是周末本来比平时低,因此更科学的对比方式是对比这周六和上周六的流量,来总可能无意说谎,但直接对比是不恰当的。
所以,如果哪天的你上司跟你说:“我昨天连续赢了柯洁三局!”,你不要惊叹于他的棋艺,他或许是和柯洁打了三盘王者荣耀。
九、视觉误导谎言
视觉误导是指把数据变成图表过程中玩的猫腻,图表严格意义上都没有错,但它呈现给你的方式会误导你得出错误的结论,我们来看几种典型的视觉欺骗——
1.并不从0开始的Y轴
这是图片欺骗最低级最容易识别的手段,但现实中却被使用的最为广泛,目的是为了让图片走势更突出——
小米在小米9的发布会上的这张图,乍一看小米9跑分遥遥领先,但仔细一看,Y轴还是被截断了:
看起来小米9跑分是Mate20跑分的两倍多
2.刻意伸缩的Y轴
刻意拉长缩短,为的是突出或者缩小数据变化,我们来看一个典型的案例,一些反对气候变化的人士绘制了一张一百年来全球平均温度的图——
3.意味深长的饼图
饼图原本是让我们清楚地看到各个部分的比例,但如果把饼图放倒,就会发生意想不到的效果,下面这张图来自爱奇艺的官方微博,直观看爱奇艺占据了图片的半壁江山:
如果我们把图片还原,爱奇艺的领先效果就没那么明显了——
这个技巧是如此普遍,以至于乔帮主曾经也在发布会上也使用过——
有没有发现苹果的份额19.5%比“其他”21.2%还要大
4.并不恰当的示意图:
这张图片来自微软Edge浏览器官网,它把它的速度和Chrome和Firefox进行了对比,Edge的浏览速度的确领先,但在图上的领先比例被明显夸大了。
好了,以上就是卫夕总结的基于事实和数据的七种谎言,这些谎言是如此狡猾以至于不仔细分辨普通人甚至难以察觉,而在组织这篇文章过程中卫夕其实还积累了很多十分骚气的案例,由于篇幅原因没能逐一呈现。