32 数据打架:公说公有理,婆说婆在行(1 / 1)

俗话说,两虎相争,必有一伤。这话用于“数据打架”无疑会失灵。数据发生争斗,受伤的显然不会是两个数据中的任何一方,而很可能是无辜百姓。因为混乱的统计信息,会干扰政府与公众对信息的判断,影响决策层对民生问题的规划。由于数据的发布完全由调查统计者说了算,因而真假难辨的数据又是对公众知情权的漠视。

——摘自某公开报道

统计数据打架,严格地说并不是统计数据本身在“打”架,而是统计数据的调查、发布者,由于采用的统计手段、统计目的不同,从而导致统计数据相互不一、悬殊过大、漏洞百出甚至自相矛盾。

要了解统计数据为什么会打架,首先要了解我国统计数据都有哪些分类,以及怎么发布的。归根到底,只有不同部门之间发布的统计数据才更可能相互矛盾;同一部门发布的统计数据如果前后不一,这种自毁形象的低级错误,还是较少见的。

总体来看,我国日常发布的统计数据可以分为两大类:一类是统计数据,另一类是管理数据。它们的区别是:统计数据是由国家统计部门发布的,涵盖生产、消费、投资、价格等领域,主要目的是用来反映实体经济;管理数据是由管理部门搜集和发布的,主要目的是加强本行业、本部门管理。

我国统计数据发布的原则是:谁搜集、谁发布。具体地说是,国家统计局发布由全国统计局系统搜集到的数据;国务院其他部门如财政、税务、文化、教育、卫生、科技等部门,分别发布由各部门自己搜集到的数据。

统计数据打架的情形比比皆是。例如,大到国家统计局和国家财政部公布的全年税收数据,小到各地方、各部门公布的楼市数据,统计数据之间互相矛盾、打架甚至数据相差多少倍的情形,不但在所难免,而且可以说司空见惯。

统计数据打架的原因之一,在于调查样本和统计方法不同,从而导致调查结果悬殊过大,甚至相差好多倍。

统计数据打架的背后,有许多耐人寻味的东西。因为谁都知道,统计方法决定着统计数据的来历,而统计方法的选用有许多讲究,最主要的是要根据统计目的而定。

在目前的中国,究竟有多少种统计标准谁也说不清,但通过各种数据打架事件,却能让人隐隐约约了解到其背后的利益诉求。通俗地说就是,生产这些统计数据的人是坐在哪条板凳上、为谁说话的。

例如在房地产价格统计领域,统计房屋价格的方法有“加权法”和“平均法”等,在测算水源质量时有“一票否决法”和“权重法”等。不同的统计方法得到的结果不一样,看上去似乎都有理,但实际上面对的都是“上面”(领导)而不是“下面”(公众),本末倒置了。

例如,广东省某市测算该市2006年的饮用水源达标率高达97.8%,采用的是“权重法”,即如果在28项指标中有1项不合格,就算做1/28不合格;而广东省环境保护局测算该市的饮用水源达标率只有67.9%,采用的则是“一票否决法”,即如果在这28项指标中有1项不合格,就算做全部不合格。

再例如,广州市国土资源和房屋管理局得到的统计数据是,2007年3月广州市的房屋平均价格比上月有大幅度下降,采用的是“平均法”;而国家发展和改革委员会、国家统计局得到的统计数据是,广州市当月的房屋平均价格比上月有大幅度上升,采用的则是“加权法” 1。

这方面最典型的一则案例是,中国社会科学院2008年12月16日发布的《社会蓝皮书》表明,我国2008年城镇失业率已攀升到9.4%,大大超过国际公认的7%的警戒线。而2009年3月国家人力资源和社会保障部公布的数据表明,我国2008年的城镇登记失业率是4.2%,离7%的警戒线还有一段不小的距离。

显而易见,对于公众来说,这前后相差一倍的两个数据,一个是城镇调查失业率,一个是城镇登记失业率,这两者之间究竟有什么不同很难搞清楚。而实际上,中国社会科学院9.4%的数据是根据实地抽样调查得到的,符合国际惯例,也更接近于现实;而国家人力资源和社会保障部4.2%的城镇登记失业率,是坐在办公室里依据从下往上一级级报表汇总得到的数据,当然离现实有一段距离了 2。

不用说,政府发布的统计数据大多是民生数据,与一般科研数据允许学术探讨的氛围不同。这些民生数据既要回应民意,又要为政府决策担责。所以,公布相关统计数据时要求做到准确、科学、通俗是最基本要求,根本就不能用“1000个读者就有1000个哈姆雷特”这样的艺术逻辑来忽悠公众。

进一步追问:不同统计机构的调查样本和统计方法为什么会不一样呢?这除了观念问题外,还很可能有不可告人的目的在内。

例如,仍然以城镇失业率为例。一个是调查数据,一个是登记数据,即使这两个统计数据都是真实可靠的,数据打架仅仅是方式方法上的不同,那么公众也仍然有理由问,这么多年下来为什么就不能从这两个指标中选一个更理性、更通俗并且与国际接轨的统计手段来一致对外呢?

说穿了还是某种利益在作怪,是权力诉求在博弈。正如全国人大常委会委员朱永新一针见血所说的那样:“统计数据变化莫测,要政绩的时候是一个数字,要补助的时候又是一个数字。” 3

从某种意义上说,统计数据打架比没有统计数据更糟糕。

道理很简单,如果没有这项统计数据,公众可能还不会对此留下什么印象,不致于造成恶劣影响;而统计数据打架,尤其是这些统计数据又都出自不同“权威部门”,公众就会认为这种统计根本没有公信力,并且担心任何一种偏信都会违背现实,据此作出的政府决策根基不稳,所以最终只好信也不是、不信也不是。

在国外也有统计数据打架的时候。每当遇到这种情况,决策部门通常有一条基本原则,那就是采信弱势数据,信忧不信喜,防患于未然。

由此推及到我国,在遇到统计数据打架时,统计部门有必要真诚地出面解释这究竟是什么原因造成的,让公众明辨是非;并且要进行反思,看统计指标是不是有值得改进或需要补充、解释的地方。

归根到底,发布统计数据的目的是让公众看得懂、用得上、无歧义。如果达不到这种效果,这样的统计数据不要也罢。

例如,2010年7月国家计划生育委员会公布的《省级人口个案库数据质量评测结果》表明,2000年到2009年间我国20个省的人口出生总数比计划生育统计报表数据要高出12%。特别需要指出的是,与其他“数据打架”不同,这两个数据都出自计划生育部门,所以被人形容为“数据内讧”。

北京大学社会学教授郭志刚坦言,当他听说人口计划生育统计数据漏报率为12%时并没有“吓一跳”,因为过去一直流传这个数据是“30%”的。事实上,这些数据一直是糊涂账,就连不懂统计工作的老百姓也知道,在超生就要罚款的政策下,个人因为超生故意不报甚至举家迁移、地方政府为编报政绩故意瞒报超生人数,早就已经司空见惯 4。

再例如,自从2008年末我国政府出台应对全球金融危机的4万亿元人民币经济刺激计划后,公众对经济数据的关注度达到空前状态。而进入2009年后,我国经济增长速度在全球一枝独秀;与此同时,一些统计指标却不断反复,并且出现明显矛盾和打架现象,这时候就非常需要统计部门用令人信服的数据、证据来解释了。

以2009年5月的统计数据为例,当时的宏观背景是,我国居民消费价格总水平(CPI)、工业品出厂价格指数(PPI)已经连续4个月在负数区间运行,进出口连续下滑、用电量连续下降、企业利润连续回落、民间投资连续不振,可是当月全国工业增加值却依然增长8.9%,这究竟是为什么,就很值得统计部门出面解释。

公众非常有必要知道,这种大范围的统计数据背离,究竟意味着经济复苏的基础不稳定,还是统计数据有假?是经济结构调整导致的,还是进一步凸现了我国经济的深层次矛盾?尤其是历来被证明与经济增长正相关的用电量数据,为什么会在当月GDP数据增长6%以上的情况下突然掉头向下?

补充说明一下。用电量指标一直被认为是最能真实反映宏观经济变动情况的先行指标,20世纪80年代以来,我国GDP与用电量及装机容量的相关系数都在0.98,也就是说,经济总量指标与电力总量指标呈高度正相关,从来没有出现过负相关,即一个指标在增长、另一个指标却在下跌的情形。

直到2009年3月,我国的月度用电量依然出现一度增长迹象,当时还把它作为经济已经触底回升的证据到处宣扬呢,可是仅仅一个月过去后的4月份,用电量就回到下降通道中去了(同比减少3.55%)。而直到这时候,前5个月的用电量和GDP增长基本上是背道而驰的,这种统计数据背离就令人感到看不懂了。

那么,这时候统计部门有没有出来进行解释呢?确实有,但这种解释难以令人信服,甚至越听越糊涂。

例如,首先是国家统计局发言人出面表示,这种背离是“正常”的。明明是非常“反常”的,读者才看不懂,怎么现在又变成非常“正常”的了呢?发言人含糊其词地说,这种现象无法直接用统计数据来解释。好,既然无法直接用统计数据解释,那就不解释了罢,可是他马上又话锋一转表示,出现这种背离并不是我国特有的,日本和美国也曾经出现过这种现象 5。

紧接着是国家统计局、国家发展和改革委员会相关负责人认为,出现这种背离的原因之一是“产业调整”。但遗憾的是,这种澄清依然无法解释“产业结构调整是一个长期过程、不可能实行突变”这样一个简单事实。更不用说,我国的产业结构调整才刚刚开始,而不是已经顺利完成了 6。

有意思的是,与上述两种解释不同的是,全国人大常委会人口资源环境委员会副主任、国家电力监管委员会前副主席邵秉仁认为,用电量和经济数据发生背离,主要原因在于地方统计数据打架。他举例说,当时他刚刚去过两个省份作调研,从这两个省份的情况中就完全能得出这样的结论。

例如,其中一个西部省份2009年一季度的用电量下降9.9%,可是经济总量却增长了10.8%。对此地方政府解释说,这经济增长主要是由灾后重建拉动的。可是继续看灾后重建的相关数据,灾后重建主要依靠的是建筑材料,而建筑材料中的钢材并不是当地主导产业(这表明与发电量无关),水泥用量也在下降,这些都和一季度全国建材用量略有下降的宏观背景相一致。

邵秉仁了解到这些情况后疑惑地说:“实实在在的两个数据——用电量和运输量,是做不了假的。”“我不知道当地到底是怎么增长的。” 7

一般认为,根据我国的行政绩效考核机制,尤其是一些地方政府错误地理解中央政府的“保增长”政策,所以会千方百计通过统计数据造假来追求GDP数据“增长”,这很符合政治逻辑。

不过话说回来,任何事情都是辩证的。也就是说,坏事也可以变成好事。从这个角度看,统计数据打架并不是一无是处,至少可以让公众看清哪些数据是与政绩考核关系紧密、有“必要”值得造假的。

例如,广州市国土资源和房屋管理局公布的数字是,2008年9月广州市的一手楼价环比下降9.2%;而国家发展和改革委员会的统计数据显示,当月广州市一手楼价的环比下降幅度只有1.4%。

这又是一个典型的数据打架案例,而且数据悬殊要相差好几倍。其实当时不仅是广州,也不仅是楼市,全国各地的多个领域都出现这种数据打架现象,所以能为公众进一步探究这种现象提供最佳样板。

分析表明,这些打架的数据无不反映着数据生产者的功利性。

例如,2007年2月广州市长强调广州市的中小户型房屋价格一定要下降,接着出台了力控房价上涨的“广七条”措施。随之而来的是,2007年4月广州市国土资源和房屋管理局发布的统计数据就称,广州市3月份的新建商品住房平均价格每平方米7029元,比2月份的7729元下降了700元或9.1%,媒体甚至把它当做政府运用行政手段干预房价的成功范例,称之为“只要政府下决心,就没有降不下的房价!” 8

可是且慢,正当公众为政府调控房价收到立竿见影之效乐观时,几天后就看到国家发展和改革委员会发布的统计数据表明,2007年3月广州市新建商品住房销售价格同比上涨8.6%,环比上涨1.2%。

两个数据如此悬殊究竟为什么呢?原来,国家发展和改革委员会认为上涨8.6%的依据是,直接按照抽样调查计算房价的平均价,然后进行同质化数据处理,所以更接近公众的心理感觉;而广州市国土资源和房屋管理局发布的环比下降9.1%的依据是,把当月全市10个区的所有发生交易的楼房价格除以交易总面积,并且在这次统计中首次纳入地处远郊、房价较低的花都区数据,直接拉低了房价 9。

由此可见,要消除统计数据打架现象,不但要从官方统计标准中剔除那些不科学部分,而且更要严格执行《统计法》,摒弃各部门自身利益考量,尽心尽力维护政府部门的公信力。否则,最后的结果必然是没有谁会再把这些统计数据当回事。

【解读点睛】

统计数据打架,受伤的并不是当事人(数据),而是一脸无辜的第三者——你我他。混乱的统计信息干扰着政府判断,也愚弄着公众。

1 椿桦:《标准不一,统计数据难免“打架”》,广州日报,2009年4月8日。

2 王红茹:《城镇失业率出现不同统计数据引发争议》,中国经济周刊,2009年4月17日。

3 崔丽:《要政绩时是一个数,要补助时又是另外一个数,统计数据岂能说变就变》,中国青年报,2008年12月28日。

4 吴鹏:《统计数据又打架遭质疑,专家建议公开数据来源等》,新京报,2010年7月22日。

5 2009年7月27日,国家统计局网站上发表一篇题为《发达国家的统计数据“打架”现象》的文章,在历数了几个案例后认为,出现统计数据打架现象虽然并不排除统计数据失真,但两者之间并不存在必然关系,更多时候反映的是统计数据背后的经济问题。

6 马光远:《经济数据打架统计部门应真诚解释》,东方早报,2009年6月21日。

7 熊剑锋、王敏:《电监会前副主席邵秉仁:某些地方经济数据可能不实》,第一财经日报,2009年6月4日。

8 沈晓杰:《中国房价的三个矛盾和一个案例》,中国经济周刊,2007年5月第17期。

9 毛建国:《楼价数据打架也许更能逼近真相》,新民晚报,2008年11月4日。