“我对最近发布的关于房价的统计数据有些质疑。”中国社会科学院财贸所研究员夏杰长在昨日(2008年1月27日)召开的“财政与民生”学术讨论会上表示,一个实事求是、基于事实的统计数据是国家实行房地产宏观调控的基础性条件,“但是,最近听了关于房地产价格的发布会以后,我感觉小数点是不是点错了。房价到底是涨了7.6%还是76%,到底上涨了多少?”
——摘自某公开报道
小数点是一个数学符号,主要作用在于用在十进制中隔开整数和小数部分。我国自古以来就有用十进位制计数的习惯,一些实用的计量单位通常采用十进制,所以很容易产生十进分数即小数的概念。
第一个把这一概念用文字表达出来的是魏晋时期的刘徽,他在计算圆周率时用到了尺、寸、分、厘、毫、秒、忽7个单位,忽以下统称“微数”。也许令刘徽再也没想到的是,小数点并不仅仅相差十倍,而是“差之毫厘、谬之千里”,容易给读者在看统计数据时产生恍惚;当然,不排除统计数据制造者们原本就有这种不良企图在内。
在2008年1月27日召开的《中国财政政策报告2007/2008》首发式暨财政与民生学术研讨会上,中国社会科学院财贸所研究员夏杰长表示,他确实对住宅和民生问题的一些基础数据感到困惑。
他举例说,当时他已在北京的东南西北四城转了好几天,无论是新房、老房还是二手房,还是搜房网上发布的房价数据,许多楼盘2006年末的房价都只有每平方米8000元,到2007年就普遍上涨到16000元到18000元。可是统计部门的数据表明房价只上涨7.6%,而他怀疑应该是76%。他戏称这些统计数据在这里点错了一个小数点。否则,如果真的只是上涨7.6%,应该说这个幅度是政府、房地产企业、买房者三者都能接受的合理价格,政府也就用不着进行房价调控了,炒房者也不会去炒房了,因为这样做是会亏本的 1。
应该说,上述道理显而易见,可是统计部门为什么只得出房价上涨7.6%的结论来呢?很难理解。这固然有可能出现夏教授所说的那种点错小数点的低级错误,但除此以外,还会有哪些可能呢?
追根溯源,小数点在统计数据中的作用,主要是给读者一种“精确”的感觉,哪怕这项统计数据根本是错的,也能起到这种效果。
例如在一个班级50名同学中,如果统计每位同学在校用餐的时间,最短的是3分钟,最长的是40分钟,那么把所有同学的用餐时间加起来除以总数,就能得到一个非常精确的数字,假如是6.125分钟。
初看起来,6.125分钟精确到小数点后面第三位,非常“精确”了。可是读者请不要忘了,当初在统计这个数字时每个人所报的3分钟、40分钟本身就很不精确,即使不能说每个人都不精确也可以说绝大部分人不精确。而现在却要想在这种“不精确”的统计样本上计算出“精确”的结果来,这不是笑话吗?
有人会说,当初上报用餐时间时,必定会有些同学是多报了,有些同学是少报了,两者之间是可以相互抵销的。确实,一定会是有些人多报了、有些人少报了,可是,谁也无法保证这些多报、少报的误差正好会相互抵销,这只是一种设想;相反,如果所有的人都多报或所有的人都少报呢?这也是完全可能的。
所以,如果你真的看到某学校统计的学生平均用餐时间为6.125分钟的话,千万不要为该学校的统计数据如此“精确”而感动。实际上它同样“不精确”,甚至比“不精确”的6分钟还要差得更远。
话题稍微延伸开来一点:在各种各样的统计数据中,越是精确的数字往往越不精确,这就牵涉了模糊数学的概念。
例如,联合国推算2011年10月31日的全球人口总数已达到70亿,基本上算是正确的了。可是如果某份报告一定要说那个时刻的全球人口总数实际上是70.00015639亿人(具体到某个非常确定的人数)或其他什么数,就是不可信的。因为无论是谁,也无论你采用怎样先进、科学的统计方法,都不可能搞到这样精确的数字。与此相似,某个国家、某个县市、某个少数民族的人数等等,也都不可能如此精确。
又例如,如果老师问学生中华民族有多少年悠久历史,这位学生回答“5000年”就算是正确的。可是如果有位学生偏偏要回答“5000.16年”就是错误的。虽然这里他精确到了小数点后面第2位,并且振振有词地解释说,两个月以前刚刚学过历史,老师当时就说中华民族有5000年历史了,而现在又过去了2个月,所以还应该再加上2个月(折合成0.16年)才对。这种振振有词,就不能否认这种小数点有问题。
明白了这一点,读者就可以在关注相关统计数据尤其是各种媒体报道的统计数据时,明白哪些统计数据是不可信的了。
例如,全球第一个到达北极的人是美国人罗伯特·埃迪温·皮尔里(Robert E.Peary),具体时间是1909年4月6日。为了让全世界的人都相信他是第一个到达北极的,他肯定地说,他到达的北极位置是北纬89度57分11秒,距北极点大约5公里。
如果单纯从这个数字看,取得这样的成绩确实非同凡响,可是如果继续追问,他是通过什么办法知道自己是位于这个点的呢?
要知道,11秒(纬度)的距离只有30米,即使在今天借助于卫星定位系统这种现代化手段,也无法达到这样的精确结果,更不用说100年前的科技水平了。而皮尔里的同行承认,即使在最理想的情况下,皮尔里利用当时他手中的工具,也只能把他的定位精确到6分(纬度),相当于地面上的10公里。
这样一分析就明白,皮尔里的这个精确数字完全是他编出来的,目的是让人确信他是第一个到达北极的人。可弄巧成拙的是,他的这种过于精确反而让人产生诸多疑点。
话说回来,有小数点的统计数据一般更容易得到别人认可是确实的。
举个例子来说,你在某个地方迷了路,问别人到达某个建筑物怎么走?一个人告诉你说,从这里往前开车5公里然后左拐1公里就到;另一个人告诉你说,从这里往前开车5.2公里然后左拐1.5公里就到了,你会相信谁呢?一般人会相信后者,原因就是他数据中的小数点让你在潜意识中更相信他说的是对的(虽然实际上谁对谁错并不确定)。
有这样一条规律:与整数相比,非整数(包括含有小数点的数字、分数、百分数等)更容易得到公众认可。对此,搞统计的人当然比普通读者更清楚,所以他们更喜欢在统计数据中使用小数点和百分号。而这时候的读者呢,就要提高一份警惕了,想一想这些带有小数点和百分号的统计数据是否真的确凿可信?其中是不是有什么不可告人的目的?多问几个为什么,就可能避免上当受骗。
推而广之:人们的潜意识中通常会认为“整数”是错误的——为什么会那么“巧”、正好是“整数”呢?
例如,你去超市买牙膏,很少有标明价格正好是3元或4元整数的,通常都带有小数点(即几元几角)。一个有趣现象是,同样一支牙膏如果标价是3.8元则会比标价3元时卖得更好,虽然这里商家已经多卖了0.8元。而标价3.95元则比标价4元卖得更快,虽然最终结账时根据四舍五入规则,仍然要收取你4元钱的。
实际上,商家在这里就是很好地利用了人的这种潜意识。
德国《图片报》(Bild-Zeitung)曾经有篇报道说,标准的家庭妇女每天要为她的丈夫工作1小时50分钟13秒,其中熨烫衬衫4分钟、整理床铺2分30秒、清理下水道口头发1分钟、盖上卫生间中的镜子15秒等等。可以说,这种精确到秒的数据,无论通过什么方式得到,都无法证明它就是非常“精确”的。即使这些数字确实会以“精确”的面貌呈现在读者面前,也难逃上述小学生平均用餐时间的粗糙。
不过话又说回来,并不是所有带小数点的数字都是粗糙的或含有误导成份。道理很简单,小数点之所以有存在必要,是因为它具有特殊功能,尤其是在差之毫厘、谬之千里的情况下,小数点不但不可或缺,而且还要强调精确到小数点后面多少位才行。如果没有小数点,就会因为原有数据的误差,导致最终数据相差十万八千里。
例如,美国劳工部2006年8月16日表示,美国正在考虑将消费价格指数(CPI)的数据,从原来的小数点后面1位精确到小数点后面3位。究其原因在于,消费价格指数是老百姓最关注的经济指标之一,也是美国联邦储备委员会决定是否需要提高利率的主要参考指标(通货膨胀指数)中最重要的数据。
有鉴于此,CPI指数如果只精确到小数点后面1位,很可能会误导市场,从而给市场带来波动风险。所以美国劳工部决定从2007年1月起,把CPI指数的统计数据精确到小数点后面3位。
那么,这一变化究竟会造成什么影响呢?举例来说,如果美国某月的CPI是1.949%,下个月是1.991%,精确到小数点后3位,环比增幅是0.215%。如果只要求精确到小数点后1位,那么上个月就是1.9%,下个月是2.0%,环比增幅就变成了5.26%。
显而易见,从0.215%到5.26%两者的差别非常大,要相差20多倍,而实际上它们原本是同一个数。这样的小数点无疑会误导公众和市场。
研究表明,在1986年到2005年间,如果美国的月度CPI只精确到小数点后面1位,这时公布的CPI不符合消费者预期的情形高达24%;而如果精确到小数点后面3位,不符合消费者预期的CPI只有不到1%。这是促使美国劳工部要求左移小数点位置的主要原因。
需要提醒注意的是,统计数据中的小数点并不是越精确越好,类似于这种CPI精确到小数点后面3位,消费者就会感到市场通胀水平并没有自己想象的那么严重的情形并不普遍。究其原因在于,即使非常精确的统计数据,也会由于小数点的出现产生误导作用。
例如,2007年末我国平均每户家庭人数3.17人 2,这个数字应该是很精确的。可是如果房地产开发部门以此为依据来建造住房,假设大多数家庭都是三个人或四个人(3.17介于3和4之间),就会有相当一部分住宅不符合市场需求。
不用说,这3.17的平均数没有考虑到地区差别、城乡差别,即使考虑了上述因素,读者看看周围就知道,3人家庭或4人家庭大约只占总数的一半。也就是说,如果按照非常精确的户均人口3.17人的平均数去建造住宅,最终适销对路的户型只有一半左右。剩下的户型要么不符合3人家庭或4人家庭的需求,要么只能让业主委曲求全。
相反,如果房地产开发商建造房屋时能够在当地每户家庭平均人数的基础上(这时候肯定是有小数点的),继续考察1人户、2人户、3人户、4人户、5人户等各占多少,房地产开发的针对性会更强。
【解读点睛】
小数点精确到多少位,初看起来只关系到精确度问题,实际上对读者的心理感觉影响是很大的。换句话说,小数点会影响你的判断力。
1 王宇新:《夏杰长:房价统计数据小数点是不是点错了》,腾讯财经,2008年1月28日。
2 数据来源:《中国统计年鉴2008》,国家统计局编。