《灰色收入与居民收入差距》之二:收入差距真相
【网络版专稿】
二、调查分析:我国城镇居民真实收入和收入差距
1.对高收入居民的收入水平估计过低
目前,我国的收入分配状况信息主要来自国家统计局的城镇和农村住户抽样调查。迄今为止,这两项调查是国内样本量最大、跟踪历史最久、权威度最高的调查。但是有迹象说明,目前国内各类收支调查,包括上述调查在内,都在不同程度上低估了高收入阶层居民的收入水平,从而低估了收入差距。
其主要原因有二:一是对高收入户调查特别困难,拒访率高,导致样本中真正的高收入户大量遗漏、覆盖率过低;二是高收入户对其收入的记载和陈述失真程度大,低报收入的情况相当普遍。特别是当涉及从非正常渠道获得的收入时,通过常规方法的收入调查几乎无法获得真实信息。所谓从非正常渠道获得的收入,指的是非法收入、违规违纪收入、按照社会公认的道德观念其合理性值得质疑的收入,以及其他来源不明的收入。在本文中这些收入将统称为灰色收入。(注3)
对高收入居民收入水平估计过低的一个证据,是高收入居民的收入水平与直观感觉差距很大。根据统计数据,2005年城镇10%最高收入家庭的人均可支配收入还不到2.9万元,这与目前家用汽车、商品住宅等高值商品的普及率、房地产市场上的强劲购买力以及其他方面高收入居民表现出来的消费、投资能力不相称。
对高居民收入水平估计过低的另一个证据,是根据居民家庭人均收入推算的收入总额占国民总收入(GNI)的比重过低。根据国家统计局2005年城乡居民收支调查,城镇居民人均可支配收入11089元(注4)、农村居民人均纯收入3255元。城乡人口分别按5.62亿和7.45亿人计算,城乡居民收入总额为8.66万亿元,仅占当年GNI的47%。这个比例不仅低于世界上大多数国家,而且也低于国家统计局资金流量表中住户部门可支配总收入占国民总收入的比例。以《中国统计年鉴2006》公布的2003年资金流量表数据为根据,2003年住户部门可支配总收入为7.41万亿元,占2003年国民总收入的55%。这两个比重相差8个百分点。
此外,根据对世界上56个国家数据的分析,绝大多数国家的居民可支配收入总额占GNI的比重都在50%-70%之间(例如,印度、英国、德国都是65%,巴西59%,智利69%,美国73%)。少数比重低于50%的国家大体上分为两类,一类是少数欧洲福利国家,有大量国民收入进入社会保障账户,不计为居民可支配收入;另一类是像沙特阿拉伯这样有丰厚石油收入但未转化为普通居民收入的国家。中国不属于两者中任一种情况,说明很可能是低估了居民收入。与居民家庭人均收入数据相比,资金流量表提供的数据可能更真实。但可惜,后者没有分收入等级的数据。
对高收入居民收入水平估计过低的第三个证据,是根据收入调查计算的居民储蓄不足以解释储蓄存款和各项投资的实际增长。按照2005年城乡居民收入和消费统计数据计算,城镇居民人均可支配收入与消费性支出的差额是2550元,农村居民人均纯收入与消费性支出的差额是700元。推算城乡居民2005年储蓄总额为1.95万亿元。
而事实上,2005年仅城乡居民在金融机构的储蓄存款就增长了2.15万亿元。同年全国新发行各种债券1.6万亿,其中个人认购部分占相当比重。在直接投资中,仅农村个人固定资产投资就接近4000亿元,城镇居民的直接投资肯定超过农村。如果再加上居民在股票市场上的投资、在海外的储蓄和投资以及手存现金的增加,居民实际储蓄会大幅度超过统计推算得到的储蓄。
上述情况说明居民收入可能被大幅度低估了。而这会严重影响对国民收入分配实际状况的判断。但是,仅仅根据以上粗略的推算,我们还不能得出具体结论。因此对居民收入分配的真实状况进行调查和研究是十分必要的。
2.关于居民真实收入的调查:方法和样本分布
要对居民真实收入进行调查和推算难度很大。在本项研究中,我们试图通过社会学的调查方法取得一系列居民消费特征参数,并用以对现有的居民收入数据进行校正,从而对各收入阶层的真实人均收入进行初步的推断。
经验证明,关于涉及个人隐私的问题,通过正规渠道收集信息有很多困难并产生较大的失真,但通过非正式的个人渠道常常可以获得比较真实的信息。这是社会学调查经常使用的方法。例如,费孝通著名的《乡土中国》就主要是通过对自己家乡亲朋友好的调查形成的。
基于这个想法,本项研究通过一批专业调查员,于2005年和2006年分两次对他们各自居住地属于不同职业、不同收入阶层的亲属、朋友、关系密切的同事和邻里进行个别访问,总共在全国范围获得2147份城镇居民家庭实际收入和消费情况的问卷。问卷中包括不同来源的全部家庭收入基本情况,以及各方面生活消费支出的情况。由于调查员熟悉调查对象的家庭基本情况并有良好的信任关系,并且基于对原始数据严格保密的承诺,所收集的数据应该说比较真实地反映了被调查者的实际收入和消费状况。
需要说明,这项调查的目的并不是要用调查样本家庭的收入状况推算我国城镇居民的总体收入分布状况,而是采集不同收入等级居民的收入和消费特征参数,用以检验和校正现有的城镇居民收入数据。相对于中国庞大的人口规模而言,这项调查样本数量有限,而且调查所采用的特定社会学方法不同于常规的统计抽样方式,因此不能用来直接推断全国总体的收入水平和收入分配状况。这项调查的目的只是取得被调查者真实可信的收入和消费数据,分别计算不同收入水平居民的恩格尔系数和其他若干消费特征参数,并参照统计局住户调查各样本组别的消费特征参数分别组成参照组,使用这些参数与收入水平之间的对应关系对现有的统计局各组别居民收入数据进行检验和校正。
经济学已有的大量研究证明,居民的恩格尔系数(食品消费占全部生活消费支出的比重)与他们的收入水平之间存在相当确定的关系,收入水平越高,恩格尔系数越低。因此在满足一定样本量的情况下,一定的恩格尔系数能够反映一定的真实收入水平。在参照组的消费特征参数及其与收入水平的关系真实可信的情况下,如果参照组与对象组具有相同的平均恩格尔系数,但两者的平均收入水平存在显著差异,则说明对象组的平均收入可能偏离了真实水平。据此,我们可以就对象组数据失真的程度进行推断和校正。
按照这一方法,本项研究并不要求调查样本的收入分布对全国总体收入分布状况具有代表性,而只要求不同收入水平各样本的收入和消费数据真实可信,因而能够在此基础上建立消费特征参数与收入水平之间可信的对应关系。
本项调查样本取自全国27个省市自治区的城镇居民,包括27个省会城市和直辖市、22个地级市、以及14个县级市、区和县。考虑到我们重点关注的高收入居民在大城市的分布比较集中,因此调查样本覆盖了全国大多数大城市(省会城市和直辖市),同时适当兼顾了中小城市和县镇。调查总共取得问卷2 147份。经过多项检验,剔除了可信度不足的问卷93份,获得有效问卷2 054份。调查样本的地域分布情况见表1。调查对象的职业、工作单位和学历分布见表2。
表1 调查样本的地域分布
省份 |
样本数 |
省份 |
样本数 |
省份 |
样本数 |
省份 |
样本数 |
北京 |
94 |
黑龙江 |
44 |
河南 |
48 |
贵州 |
43 |
天津 |
43 |
上海 |
128 |
湖北 |
127 |
云南 |
50 |
河北 |
83 |
江苏 |
76 |
湖南 |
43 |
陕西 |
117 |
山西 |
43 |
浙江 |
103 |
广东 |
164 |
甘肃 |
100 |
内蒙古 |
63 |
福建 |
104 |
广西 |
70 |
宁夏 |
54 |
辽宁 |
122 |
江西 |
63 |
重庆 |
58 |
新疆 |
44 |
吉林 |
54 |
山东 |
63 |
四川 |
146 |
合计 |
2147 |
注:本项调查主要由上海勺海市场调查公司执行。调查地点包括如下城市和县:北京、上海、太原、济南、西宁、银川、乌鲁木齐、南昌、西安、长沙、沈阳、武汉、石家庄、长春、天津、重庆、郑州、哈尔滨、兰州、广州、南宁、杭州、呼和浩特、福州、成都、南京、贵阳、昆明、贺兰县、松江县、上饶市、武宁县、定陶县、聊城市、泰安市、盐城东台、徐州郊区、惠州市、湛江市、广州郊区、舞钢市、大城县、保定市、阳新县、万盛县、双桥县、丰都县、攀枝花市、青白江县、蓟县、白山市、海拉尔市、乌盟市、平湖市、嘉兴市、兰溪市、余姚市、宁海市、奉化市、厦门市、泉州市、漳州市、诏安市、福清市。
表2 调查对象的职业、工作单位和学历分布
职业 |
分布 |
工作单位 |
分布 |
学历 |
分布 |
专业技术人员 |
13.8% |
党政机关 |
4.3% |
小学 |
1.7% |
其他专业人员 |
8.2% |
文教卫生科研文艺团体 |
3.5% |
初中 |
12.2% |
党政干部/军人 |
4.4% |
其他事业单位/社会团体 |
8.5% |
高中 |
42.1% |
企事业单位/社会团体办事及管理人员 |
22.8% |
国有企业 |
24.1% |
大学 |
43.2% |
工人/服务人员 |
17.7% |
股份/私营/合伙企业 |
31.0% |
硕士/博士 |
0.8% |
个体户/自由职业者 |
18.1% |
三资企业 |
3.4% |
||
企业所有者/合伙人/股东 |
5.6% |
个体/自由职业 |
19.7% |
||
其他职业 |
6.5% |
其他 |
5.7% |
||
退休/无业 |
1.9% |
||||
合计 |
100% |
合计 |
100% |
合计 |
100% |
注:各项分布均按家庭中收入最高的家庭成员计算。
3.取得消费特征参数和校正数据
对2005年和2006两个年份的调查数据(分别为2004年全年和2005年全年居民收入和消费数据)进行了合并。为了使数据具有可比性,对2005年样本的收入和消费数据根据城镇居民消费价格指数进行了调整,转换为2006年不变价格数据。对合并后的调查样本按居民家庭人均可支配收入进行排序,然后根据恩格尔系数进行分组匹配,形成了7个参照组,分别对应于国家统计局城镇居民住户调查样本的最高收入组(占城镇居民家庭总数的10%)、高收入组(占10%)、中上收入组(20%)、中等收入组(20%)、中下收入组(20%)、低收入组(10%)和最低收入组(10%)。‘
通过匹配,使每个参照组的平均恩格尔系数与统计局各样本组(以下称之为“对象组”)的恩格尔系数两两相等。根据“在相同经济背景下具有相同恩格尔系数的两组居民,应当具有大体相同的收入水平”这一判断,将具有同等恩格尔系数的参照组和对象组的人均收入和消费数据进行比较,取得了如下初步结果(见表3):
表3 调查样本和统计局住户样本的2005年人均收入比较(元)
最高 |
高收 |
中上 |
中等 |
中下 |
低收 |
最低 |
合计 | |
样本分布a |
10% |
10% |
20% |
20% |
20% |
10% |
10% |
100% |
恩格尔系数b |
0.280 |
0.343 |
0.364 |
0.388 |
0.419 |
0.448 |
0.474 |
|
参照组收入水平(1) |
140 764 |
34 569 |
23 863 |
15 184 |
10 401 |
7 208 |
3 377 |
26 500 |
对象组收入水平(2) |
28 773 |
17 203 |
12 603 |
9 190 |
6 711 |
4 885 |
3 135 |
10 493 |
(1)/(2) |
4.89 |
2.01 |
1.89 |
1.65 |
1.55 |
1.48 |
1.08 |
2.52 |
注:a. “样本分布”是指按照统计局样本,各收入组居民家庭数占城镇居民家庭总数的比例。
b. 由于采用由低到高递推的方法,最高收入组的平均恩格尔系数为0.291,略高于统计局样本;其他各收入组的平均恩格尔系数均与统计局样本一致。
资料来源:国家统计局(2006)、课题调查样本数据。
根据恩格尔系数进行匹配,将参照组和对象组的人均收入相比较,可以发现,尽管各对应收入组别的恩格尔系数都一致,但只有两个对应的最低收入组的人均收入水平非常接近,只相差8%。其他各组别两样本的差异都非常显著,统计局样本收入无例外地低于调查样本。而且,这些差异具有明显的规律性,随收入水平而呈阶梯形上升趋势。两个最高收入组的差距最大,最高收入组参照组的人均收入水平是14万元,对象组则不到2.9万元;两者相差4.9倍。
人均消费水平也存在类似的情况,调查样本与统计局样本的差异呈阶梯形上升,只是差额的幅度较小。两个最高收入样本组的人均消费水平分别为5.3万元和1.9万元,两者相差2.8倍。
以上规律性在其他消费支出方面也表现得非常明显。以最低收入组来看,两个样本的各项支出相差不多,有些项目前者高一些,有些项目后者高一些。但其他各收入组相比较,基本上都是调查样本高于统计局样本,而且收入越高的组别,差别越大(见表4)。
表4 调查样本和统计局样本2005年各项消费比较
(调查样本数据与统计局样本数据之比)
最高 |
高收 |
中上 |
中等 |
中下 |
低收 |
最低 | |
人均消费比例 |
2.79 |
1.96 |
1.71 |
1.58 |
1.56 |
1.47 |
1.09 |
人均食品支出比例 |
2.53 |
1.84 |
1.59 |
1.49 |
1.50 |
1.41 |
1.02 |
人均外出就餐支出比例 |
2.70 |
2.09 |
1.94 |
1.84 |
1.54 |
1.48 |
0.67 |
人均服装支出比例 |
2.37 |
1.49 |
1.37 |
1.13 |
1.07 |
0.99 |
0.77 |
人均医疗支出比例 |
1.80 |
0.98 |
1.25 |
1.45 |
0.97 |
1.29 |
1.20 |
人均交通通信支出比例 |
2.16 |
1.79 |
1.57 |
1.62 |
1.58 |
1.63 |
1.34 |
人均教育支出比例 |
1.83 |
1.36 |
1.37 |
1.48 |
1.87 |
1.69 |
1.21 |
人均旅游支出比例 |
5.84 |
3.79 |
1.91 |
2.61 |
2.50 |
1.59 |
0.35 |
人均自有住房面积比例* |
1.38 |
1.22 |
1.08 |
0.94 |
0.77 |
0.78 |
0.66 |
人均家用汽车比例 |
3.79 |
3.33 |
1.96 |
2.00 |
0.91 |
0.36 |
2.77 |
注:*人均自有住房面积的两组数据口径有所不同。统计局样本为2004年建筑面积数据(但其他各项均为2005年数据),调查样本为2005年使用面积数据。因此如果转换为同一口径数据,两个样本之间的差异会更大。
资料来源:同表3。
根据以上情况,我们可以初步判断:除最低收入组以外,统计局城镇居民住户调查样本都可能在一定程度上有低报收入的倾向。其中,最高收入组的居民对收入有大幅度的低报。这一判断是否可信?这从下面的调查结果可以得到相当程度的证实。
在调查问卷中,我们设计了如下问题:“如果一个不认识的统计局调查员来找您进行家庭收入和消费调查,您愿意把您的家庭年收入全都如实告诉他吗?如果不愿意,您愿意告诉他/她的收入是多少?”
我们发现,中等以下各收入组的多数人愿意报告真实收入;其中最低收入组只有31%的人表示不愿意如实报告收入,而这其中还有一部分人是倾向于多报收入(因为他们认为收入太低“面子上不好看”)。在少报和多报两相抵消后,最低收入组表示愿意报告的收入略微超过了实际收入。但随着收入水平的提高,隐瞒收入的倾向和隐瞒的程度都明显上升。其中的最高收入组中有高达70%的被调查者表示不愿意报告真实收入(见图3)。他们表示愿意报告的收入平均只相当于他们真实收入的34%。
图3 各收入组中有多少人不愿报告真实收入?
资料来源:调查样本(有效样本数:2052)。
上述调查结果说明,本报告前面关于高收入居民的实际收入存在严重统计遗漏的判断是符合实际的。不过上面的校正数仅仅是一个粗略的初步结果,可能存在误差,需要进一步核实;而且如果相信我国国民总收入数据基本准确,那么用上述调查数据推算,得到的居民可支配收入总额占国民总收入的比例偏高。这有以下几种可能的原因:
第一,关于居民收入的统计调查除了可能存在对高收入居民的遗漏外,也会存在对低收入居民的一定程度遗漏。因此就对人均收入水平的影响而言,这可能在一定程度上抵消高收入居民遗漏带来的影响(但程度较小)。
各种居民收入调查,包括本项调查在内,都有可能遗漏一些特定的人群,包括因身体、智力残疾和疾病而影响阅读、听力、书写、记账和语言交流能力的人,文盲和半文盲,流动人口,生活不能自理的老年人等等。因为这些人很难顺利地接受调查和提供所需要的信息。而这些人中,有相当大的比例属于低收入人口或者依靠救济生活的贫困人口。
最新的抽样调查结果显示,我国残疾人占总人口的比重为6.34%。而如果采用更严格的国外标准,这个比例有可能达到10%(第二次全国残疾人抽样调查领导小组、国家统计局,2006)。而一项更早些的调查显示,在残疾人中有超过五分之一是贫困人口(中国残疾人联合会扶贫处,1998)。在此外根据卫生部2003年的调查,我国城市居民慢性病患病率为17.7%(卫生部,2006)。而在城乡居民家庭收支调查样本中,残疾人和慢性疾病患者比例都非常低,说明这两类人大部分都没有被包括在统计局样本中。在我们的调查中没有采集健康状况的信息,但估计也会对上述人群发生很多遗漏。
根据以上信息,我们不妨近似地假定上述这些被遗漏的残疾或患病的低收入人群占城镇人口的比例大约为10%,他们的人均收入相当于最低收入10%居民家庭的平均收入,那么把这些人计算在内,需要进一步把城镇人均收入水平从上面的估计下调8%左右。由于分组的变动,每个收入组的人均收入也都需要进行相应的调整。
第二,我们的居民收入调查样本较小,虽然所覆盖的城市面相当广,但为了获得真实信息而采用了定向调查方法而不是随机抽样方法,这可能会带来某种程度的估计偏差;另外,收入和支出数据来自被调查者的记忆和逐项估计,而不是来自详细的收支账目。这些也会影响到推算数据的准确度。
根据世界各国居民可支配收入占国民总收入的通常水平来考虑,我国城镇居民2005年的人均可支配收入可能在接近2万元的水平。在对低收入居民的统计遗漏进行了调整后,调查的误差因素有可能导致所估计的平均收入水平偏高20%-30%。
考虑到这些因素,假定低收入人口统计遗漏的因素对所估计的收入水平有8%的影响,调查误差因素有25%的影响,两者综合考虑,将除了最低收入组以外的各组调查样本收入数据都按31%的幅度做同样的下调(最低收入组只调整8%),据此计算各收入组的人均收入水平。
4.关于城镇各组别居民收入的推算结果
在进行了上述调整后,城镇人均可支配收入为1.96万元(而原有统计局数据是1.05万元)。其中,10%城镇最高收入家庭的人均可支配收入是9.71万元(而在原有统计局样本中是2.88万元)。这一组居民的人均收入下限大约在4万元。城镇最高和最低10%收入组之间的收入差距是31倍(而在统计局原有样本中两者的差距只有9倍)。调整后的各参照组收入数据,及其与统计局样本数据的比较,在图4中表示。按家庭年收入计算,10%城镇最高收入家庭的平均年收入为25.6万元,下限约为10.5万元。
图4 校正前后的城镇的各阶层居民收入统计数据比较(2005年)
注:各居民收入组占城镇居民户的近似比重是,最高收入组、高收入组、低收入组、最低收入组各为10%,其余三组各为20%。
资料来源:同表3。
从图4可以看到,目前关于城镇居民收入统计的主要遗漏发生在10%的城镇最高收入居民,约占全部遗漏收入的四分之三。这部分居民的实际收入远远高于原有的统计水平。这一情况将不但使实际的城镇居民收入差距远远大于原来的估计,也会使实际的全国居民收入差距远远大于原来的估计。
本项调查只涉及城镇居民。关于农村居民的实际收入水平,我们目前还没有进行调查。但农村居民中,高收入者比城镇少得多,统计遗漏也相应会比较小。在与农村低收入居民可能发生的统计遗漏相抵消后,我们假定农村居民人均收入可以基本保持不变。
如果我们近似地用城镇20%高收入家庭(约占全国家庭数的10.2%,他们2005年的人均收入调整后约6.05万元)和农村20%低收入家庭(约占全国家庭数的9.8%,仍按统计局数据,2005年人均收入约1100元)的收入水平来代表全国10%最高收入和10%最低收入家庭的人均收入,那么这最高和最低收入的两组家庭之间,实际人均收入差距大约是55倍,而不是根据原来的收入统计数据推算得到的21倍。
本报告后面的部分,将对这些估计进行进一步的验证。如果根据以上这些估计来推算,2005年全国居民收入总额应当是13.5万亿元,约占当年国民总收入的73%,与美国2005年居民可支配收入占国民总收入的比例相同(但国民总收入也有可能需要相应调整;这样的话,居民收入占国民总收入的实际比例可能低于这里计算的73%)(注5)。
而根据现有的统计局城乡家庭收支调查数据推算,2005年全国居民收入总额只有8.7万亿元,占国民总收入的47%。前者比后者多出4.8万亿元。根据上面的推算结果,我国城镇居民内部、城乡之间以及全国居民收入分配差距都显著大于原来的数据。
另外,根据上述调查推算,城镇居民的平均储蓄率也需要作大幅度的上调,大约需要从根据现有的城镇居民收入和消费统计数据推算的24.3%调整到41.2%。其中10%城镇最高收入居民家庭的储蓄率超过60%。■
相关文章
「 支持!」
您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!