1 统计口径:读懂统计数据的基本前提(1 / 1)

(浙江省)从全省2007年1至10月经济统计数据看,全省完成实到外资77.41亿美元,但按商务部统计口径仅48.34亿美元,不被商务部统计的数据高达29.07亿美元,占上报数的37.6%。

——摘自某公开报道

阅读统计数据,必须从关注或明确统计口径开始。只有首先明确这个统计指标的口径,才能判断这些数据究竟离实际有多远;口径不同的统计数据不能放在一起相互比较,否则不但不能真正发挥作用,而且还会产生误导,影响个人判断和政府决策。

所谓统计口径,是指这些统计数据的来源或包括范围。用最通俗的话说就是,这些统计数据是从哪个“口径”出来的。当然,不同的统计口径后面反映着不同数据的质量高低,甚至还有不同的政治利益或不怀好意在内。

读者平时听得最多的不是“统计口径”而是“统一口径”,这两者既有联系也有区别。统计口径按理说应当是统一的,因为只有统一口径的统计数据,相互之间才有可比性;然而,并不是所有统计口径都是统一的,也就更谈不上这些统计口径是科学的了。明白了这一点容易发现,读者平时难以理解的统计数据往往或多或少存在这些问题。

凭空讨论统计口径比较难理解,下面举一个有关流动人口方面的统计数据,就能一清二楚地了解其中奥秘了。

在我国,流动人口的人数、流向和规律,是政府决策的重要依据。然而在过去20多年里,我国并没有统一的流动人口统计口径,所以各部门得到的流动人口数据不但各不相同,而且非常悬殊。

在国外,通常没有“人口流动”、“流动人口”这样的指标,只有“人口迁移”、“迁移人口”概念。为什么呢?因为人口流动是我国的独有现象,流动人口是我国独特的人口群体。

人口流动和人口迁移有什么不同?根据国际人口科学联盟主持编写的《多种语言人口学辞典》解释,所谓人口迁移是指“在一个地区单位同另一个地区单位之间进行的地区移动和空间移动的一种形式,通常它包括从原住地或迁出地迁到目的地或迁入地的永久性住地变动”。

不难看出,人口迁移必须具备两个条件:一是时间上的“永久性”(确切地说,应当是“长期性”,并不是说人口迁移后就不能再发生第二次迁移了);二是空间上的“足够远”。

在我国,虽然人口迁移同样存在,可是由于受户籍制度影响,读者平时看到或听到的更多是人口移动,其主要区别在于户口是不是跟着人走。如果这种时间和空间上的移动,户口也跟着走,就称为人口迁移,这样的人称为迁移人口;如果户口不跟着动,就称为人口移动,这样的人称为移动人口。

所以,在进行国内外人口迁移或人口移动数据对比时,就必须弄清其中的统计口径有什么不同。否则,同样的数据就不但没有可比性,而且会闹出许多笑话来,用于政府决策则会坏了大事。

我国的户口管理部门通常设置在街道、乡镇一级派出所,所以当在街道、乡镇以上行政范围空间位置移动时,才可能牵涉迁户口 1,这时伴随着迁户口产生的就是人口迁移;而在人口流动方面由于没有户口迁移作标志,所以统计口径上必须有一个明确的“空间”和“时间”界定,否则就无法正确反映流动人口规模。

举例说,一个人从屋里的一个房间进入另一个房间,或者从楼上跑到楼下,或者因为房屋拆迁暂时居住在儿子(女儿)家过渡,这些虽然实际上都发生了时间和空间移动,就不能算“人口流动”。

不用说,这种“空间”和“时间”界定既不能太大也不能太小,否则就无法准确反映人口迁移和人口流动状况。目前我国各部门有关人口流动规模的统计数据相差甚远,一个重要原因就在这里。

例如,我国从1982年开展第三次人口普查以来的每一次人口普查和全国1%的人口抽样调查,在涉及人口流动数据搜集方式上时有改变,统计口径也有变化,尤其是2005年那次变动更大 2。例如1982年、1990年流动人口的“时间”、“空间”界定为“跨县(市、区)”、“一年以上”,就把同一个县(市、区)内不同乡镇(街道)之间的人口流动排除在外了;而不同乡镇(街道)之间的人口流动比例实际上非常高(约占流动人口总数的30%)。

而1995年1%人口调查的统计口径,“空间”就缩小为“跨乡镇(街道)”,“时间”则缩短到“半年以上”。根据这一口径,推算出全国流动人口总数为7073万人,约占全国总人口的6%,比1982年的1.75%、1990年的1.89%提高了2倍多。显然,6%的统计数据更接近于事实 3。

且先别为这种“进步”高兴。实际上,过去历次统计中并没有引起足够重视、这时候在人口流动中所占比重已经非常大的“人户分离现象”依然没有得到严格区分,严重损害了流动人口统计数据质量。

所幸的是在2000年人口普查中,在继续保持“跨乡镇(街道)”、“半年以上”统计口径的同时,已经有效区分了两者。在此前提下,当年的统计数据是,2000年全国城市市区范围内的市内“人户分离”规模为3600万人,流动人口10175万人(其中县内流动人口3100万人、省内跨县流动人口3375万人、跨省流动人口3700万人)。

而到了2005年全国1%人口抽样调查中,调查对象与过去只调查“常住人口”不同的是,还包括“户口在本户、2005年10月31日晚未居住在本户的人。”这样,就较好地在全面了解这个地区流入人口的同时,比较容易了解流出人口情况。同样的道理,对城市里的“人户分离”情况来说,既能了解到过去“人在户不在”的情况,也可以了解到“户在人不在”(简称“空户”、“空挂户”)的情况。而随着我国进入老龄化社会,这种“人户分离”情形将会越来越突出。

与此同时,从2005年1%的人口抽样调查开始,还把“时间”和“空间”的界定标准分开来统计,并且增加了“半年以下”统计口径,这样就为完整分析统计数据提供了更多素材。

读者如果了解到上述各次人口数据统计口径方面的差别,就能更好地理解和利用这些统计数据了。

例如,以2005年的1%人口调查数据为例分析,既要考察流入人口又要考察流出人口;要尽量把城市市区范围内的“人户分离”人口从流动人口数据中分离出来,因为这实际上是两个不同概念;在考察统计口径的“时间”界定方面,时间标准越小越好,时间标准越小表明其中包括的短期流动人口数据越真实 4。

毫无疑问,每一次统计口径的改变都会直接影响统计数据质量以及数据大小,牵涉到方方面面的利益。

例如,在本案例中,浙江省从2008年开始按照国家商务部的口径统计利用外资数据,从而成为全国沿海地区最后一批与国家商务部统计口径并轨的省市之一。单纯从统计数据看,浙江省按原口径所得到的统计数据是2007年1月至10月完成实到外资77.41亿美元,而按照商务部的统计口径该数据就只剩下48.34亿美元 5。

再例如,针对国际能源署发布的数据认为“中国2009年消费22.52亿吨石油当量,比美国石油消费总量21.70亿吨高出4%,从而成为全球第一大能源消费国”的说法,国家能源局综合司在2010年7月20日举行的“上半年能源经济形势新闻发布会”上表示,国际能源署公布的数据不但不可信,而且该组织可能对我国近几年来的能源发展状况一知半解 6。厦门大学中国能源经济研究中心认为,无论什么组织发布什么报告,都必须以我国统计口径为主,世界能源署的统计数据不排除采用另一套统计口径,“如果统计口径不一致就没有可比性”。

统计口径不一致,当然就没有可比性,这显而易见。但如果有关专家能够指出国际能源署和我国国家能源局的统计口径在哪里不一致,或者最好能折算成同一口径进行比较,就有说服力了。

记者对此研究发现,原来,世界能源署采用的当量单位为“石油当量”,我国国内统计中普遍采用的是“煤当量”,所以两者之间的数据无法直接比较。但只要根据我国GB2589-1990《综合能耗计算通则》中的规定进行换算,就可以发现世界能源署统计的能源消费量为942912.4亿MJ 7,我国国家统计局的统计数据为908535.6亿MJ,相差3.78%,我国仍然是高于美国的。

由于不同的统计口径会直接决定统计数据大小,所以经常有统计部门会人为利用这种统计口径调整来调节自己的目标数据。

例如,2008年北京奥运会前夕,美国驻华使馆出于关心工作人员健康考虑,在新使馆落成之际,在使馆内的一栋大楼上建立了一处空气监测站,用来监测当地空气中可深入肺部的悬浮颗粒(PM2.5)数据,监测结果每小时在推特网上发布一次。自从有了这一举动后,北京环保部门的检测数据便屡屡受到质疑,主要原因之一就是口径不同。

2011年10月31日是我国新发布的《环境空气PM10和PM2.5的测定重量法》正式实施前一天,有心人发现,当天美国驻华使馆监测到的北京空气质量指数为307(PM2.5 8细颗粒物浓度为257),属于“危险” 9级别;而我国国家环境保护局公布的当天北京空气污染指数为132,属于“三级轻微污染”,两者数据几乎相差一倍 10。

需要指出的是,我国监测的这个数据不是PM2.5而是PM10,这是两个完全不同的统计口径。打个比方说,PM1如果是我们吃饭时碗里的小沙粒,PM2.5就是小石子,PM10就是小石块,PM100就是大石块了。毫无疑问,体积越小的石子(沙粒)越容易被吃进肚子里去。

世界卫生组织认为,大部分PM10颗粒会因为体积较大被挡在鼻腔和口腔外,而PM2.5则会被人体直接吸入到肺部深处,从而导致发生一系列呼吸疾病和心血管疾病,增加人的死亡风险。所以PM2.5才是与健康更直接的污染指数,在当今全球主要国家以及亚洲的日本、泰国、印度等都是把PM2.5列入空气质量标准的。可是我国新颁布的法规仍然把它排除在外,监测的是PM10而不是对人体危害更大的PM2.5,这种统计口径不一,就有点令人费解了。

据北京市环境保护局介绍,我国是有能力也有设备监测PM2.5,并且已经有这方面监测数据的,“但是我们不能随意公布……主要原因就是PM10还未达标,年均值超过国家标准的20%。”并且明确说,只有当这个数值达标了,接下来才能考虑监测并公布PM2.5指标。 11

至此,统计口径不一的原因已经很清楚了。正如中国科学院科技政策和环境政策研究专家袁志彬所说:政府之所以不采用PM2.5标准,是担心数据公布后会让社会产生不安定因素;但实际上,官方数据和解释的公信力出现问题才是最大的不安定因素 12。

道理很简单:任何统计数据只有符合公众感受才可信。北京的空气是不是有污染、污染有多严重,每个北京市民的肺其实都是“一杆秤”。

统计口径调整背后有许多陷阱。例如,我国某省会城市2006年的地方财政收入是278亿元,邻近省会城市却有742亿元,于是该省通过调整统计口径,一下子就把2007年的地方财政收入迅速“增加”到716亿元人民币,这样看起来就非常接近于后者2007年的数据788亿元了。

除了人为调节外,不同部门的统计口径往往不同,这也会导致不同部门之间得到的统计数据相差极大,令人莫衷一是。

例如,2008年出现在国家财政部递交给第十一届全国人大二次会议审议的预算报告中的税收收入数额是54220亿元,而此前国家统计局公布的数据为57862亿元,两者相差3642亿元 13。

这两者的统计口径有什么不同呢?国家财政部新闻发言人解释说,这主要是国家财政部公布的税收收入中涵盖所有税种;而国家统计局根据的是国家税务总局统计的税收收入快报数,其中包括各级国家税务部门和地方税务部门征收的国内税收收入(不包括耕地占用税和契税)以及海关代征的进口货物增值税和消费税,并且扣除了税务部门办理的企业所得税和增值税等退税。

从统计口径看,虽然国家财政部的统计口径更宽,但由于退税在账务上表现为直接冲减收入,这就使得国家财政部公布的税收收入反而要比国家税务总局公布的小。

毫无疑问,任何统计口径的不同都有客观原因,有的有道理,有的不但没道理而且背后还有不可告人的目的。但无论如何,这都会给非统计专业人士造成诸多困惑,直接引发对统计数据真实性的质疑,而这是读者在解读统计数据时必须特别注意的。

从统计数据使用者角度看,不同部门的统计口径应该统一,虽然做到这一点可能有一定难度,但“办法总比困难多”——有关部门如果能真心实意地为社会各界正确理解、合理利用数据提供方便,就一定会找到一个既科学又统一还便于公众理解的统计口径来。

可喜的是,根据国家统计局统一部署,我国从2012年开始全面推行企业“一套表”联网直报制度,即由各生产企业和流通企业直接向国家统计局报送数据,省市县统计机构共享这些数据。

具体地说是,在基层企业上报表格的一瞬间,中央、省、市、县(区)统计局都能同时看到这上报的每一笔数据及其IP来源,任何部门对数据进行修改都会留下痕迹。

这种做法,由于直接剥离了企业原始数据在各级统计机构间的逐级汇总和上报,不但能避免不同部门在统计口径、报送日期上的不同,还能做到互动、透明,好比是把原来的数据“录播”变成了“直播”。

不用说,这样做的最大好处是,至少在统计部门内部统一了统计口径(显然还无法统一统计部门与其他部门的统计口径),从而有助于避免各种人为干扰;甚至,还能因为其中含有逻辑审核程序避免笔误。

正因如此,国家统计局局长马建堂称之为“中国统计流程再造”。

【解读点睛】

统计口径是统计数据的入门。了解统计数据必须先了解统计口径,否则就无法对统计数据作出合理解释,也就更谈不上正确利用了。

1 一般是这样,但并不绝对。随之而来的是,人口迁移也并不必然就一定要跨乡镇(街道)。但这种说法比较容易理解,并且也基本上接近于事实。

2 1987年的1%人口抽样调查统计口径和其他各次普查、调查相比有其特殊性,所以基本上没有多少可比行,这里避而不谈。

3 北京市1997年的外来人口普查资料表明,当年北京市全部外来人口中,来北京时间不超过半年的“短期”外来人口比例达36.37%,而这样高的比例过去就并没有包含在全国统计普查和抽样调查中。

4 段成荣、孙玉晶:《我国流动人口统计口径的历史变动》,人口研究杂志,2006年第4期。

5 浙江省德清县对外贸易经济合作局:《2008年利用外资统计口径调整对湖州市的影响及建议》,德清县外经贸政务网,2008年2月26日。

6 马继鹏:《国家能源局回应“被最大”——统计口径有差别》,国际金融报,2010年7月21日。下同。

7 MJ是mega joule(兆焦耳)的缩写,能量单位。1千瓦小时(1度电)=3.6兆焦耳。

8 根据国家环境保护部2011年9月8日发布的《环境空气PM10和PM2.5的测定重量法》解释,悬浮在空气中直径100微米以下的颗粒物称为总悬浮颗粒物,其中对人体危害最大的是直径小于10微米的浮游状颗粒物,即可吸入颗粒物。直径小于等于10微米的可吸入颗粒物称为PM10,直径小于等于2.5微米的称为PM2.5(又称细颗粒物)。

9 “危险”是美国国家环境保护署设立的空气质量最差等级。它们按空气清洁程度分为6个等级:好、一般、对敏感人群不健康、不健康、很不健康、危险。

10 吴亭:《北京环保局:空气质量数据不能看美国使馆监测》,北京晨报,2011年11月1日。

11 赵喜斌:《北京环保局:美国使馆不愿意跟我们比对空气监测设备》,北京晚报,2011年11月3日。

12 黄冲:《近七成受访者感觉空气监测数据和直观感受不符》,中国青年报,2011年11月8日。

13 俞岚:《税收数据差3600亿,财政部称是“统计口径不同”》,中国新闻网,2009年3月7日。