RSS
当前位置 : 首页>大千世界>列表

什么是基尼系数及基尼系数的计算方法-酷狗剧情网

来源: 作者: Tag: 时间:2007-01-08 点击:

酷狗剧情网

什么是基尼系数及基尼系数的计算方法

什么是基尼系数?

基尼系数是国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标,由意大利经济学家于1922年提出。

20世纪初意大利经济学家基尼,根据洛伦茨曲线找出了判断分配平等程度的指标(如右图),设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。并以A除以A+B的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。如果A为零,基尼系数为零,表示收入分配完全平等;如果B为零则系数为1,收入分配绝对不平等。该系数可在零和1之间取任何值。收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越是趋向不平等,洛伦茨曲线的弧度越大,那么基尼系数也越大。如果个人所得税能使收入均等化,那么,基尼系数即会变小。联合国有关组织规定:若低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距较大;0.6以上表示收入差距悬殊。

    基尼系数是一个用来描述收入整体差距程度的重要指标。国际上通常认为,当它处于0.3-0.4时表示收入分配比较合理,0.4-0.5表示收入差距过大,超过0.5则意味着出现两极分化。从现实来看,世界各国对基尼系数的运用并不完全一致。很多国家都是把它与其他因素结合起来,综合判断收入差距。在不少国家,基尼系数都有不同的标准和界线。总的来说,基尼系数只可参考,不能绝对化。


  目前,国际上用来分析和反映居民收入分配差距的方法和指标很多。基尼系数由于给出了反映居民之间贫富差异程度的数量界线,可以较客观、直观地反映和监测居民之间的贫富差距,预报、预警和防止居民之间出现贫富两极分化,因此得到世界各国的广泛认同和普遍采用。
  按照国际惯例,基尼系数在0.2以下,表示居民之间收入分配“高度平均”,0.2~0.3之间表示“相对平均”,在0.3~0.4之间为“比较合理”,同时,国际上通常把0.4作为收入分配贫富差距的“警戒线”,认为0.4~0.6为“差距偏大”,0.6以上为“高度不平均”。

基尼系数的计算方法

摘要:本文归纳了基尼系数的四种计算方法:直接计算法、拟合曲线法、分组计算法和分解法,并进行了数学推导和证明。在此基础上,文章比较了各种算法优缺点,分析了误差可能产生的环节。
关键词:洛伦茨曲线  基尼系数的计算方法

一、洛伦茨曲线和基尼系数
1905年,统计学家洛伦茨提出了洛伦茨曲线,如图一。将社会总人口按收入由低到高的顺序平均分为10个等级组,每个等级组均占10%的人口,再计算每个组的收入占总收入的比重。然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入分配差距状况的曲线,即为洛伦茨曲线。

为了用指数来更好的反映社会收入分配的平等状况,1912年,意大利经济学家基尼根据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G)。在上图中,基尼系数定义为:
  G=  SA       SA+B                                                      式(1)
当A为0时,基尼系数为0,表示收入分配绝对平等;当B为0时,基尼系数为1,表示收入分配绝对不平等。基尼系数在0~1之间,系数越大,表示越不均等,系数越小,表示越均等。

二、基尼系数的计算方法
式(1)虽然是一个极为简明的数学表达式,但它并不具有实际的可操作性。为了寻求具有可操作性的估算方法,自基尼提出基尼比率以来,许多经济学家和统计学家都进行了这方面的探索。在已有的研究成果中,主要有四种有代表性的估算方法,结合自己的计算,笔者将它们归纳为直接计算法、拟合曲线法、分组计算法和分解法。
1、直接计算法
直接计算法在基尼提出收入不平等的一种度量时,就已经给出了具体算法,而且这种算法并不依赖于洛伦茨曲线,它直接度量收入不平等的程度。定义
△= n n ∑∑∣j=1 i=1Yj-Yi∣/n2, 0≤△≤2u                           式(2)
式中,△是基尼平均差,∣Yj-Yi∣是任何一对收入样本差的绝对值,n是样本容量,u是收入均值。定义
G=△/2u, 0≤G≤1                                                式(3)
可以证明:G=△/2u=2SA(证明过程见附录一),而由式(1)G= SA/ SA+B,SA+B=1/2,G=2SA,因此,式(2)中定义的G即为基尼系数,综合式(2)、(3),基尼系数的计算方法为:
G=    1           2n2 u  n n ∑∑∣j=1 i=1Yj-Yi∣                                   式(4)
直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存在来源于样本数据方面的误差,就不存在产生误差的环节。实际上,在附录一证明过程当中将看到,直接计算法依然采用了以直代曲法计算面积,只不过这个过程在样本数据范围内达到了最小近似,其精确度直接取决于样本数据本身。因此,可以认为它不带任何误差的计算了样本数据的基尼系数值。
2、拟合曲线法
拟合曲线法计算基尼系数的思路是采用数学方法拟合出洛伦茨曲线,得出曲线的函数表达式,然后用积分法求出B的面积,计算基尼系数。通常是通过设定洛伦茨曲线方程,用回归的方法求出参数,再计算积分。例如,设定洛伦茨曲线的函数关系式为幂函数:
    I=αPβ                                                          式(5)
根据选定的样本数据,用回归法求出洛伦茨曲线,例如,α=m,β=n.求积分
SB=∫01 mpndp=   m   n+1                                               式(6)
计算
G=  SA       SA+B  = SA+B-SB    SA+B      =1- 2m   n+1                                              式(7)
拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算。
3、分组计算法
这种方法的思路有点类似用几何定义计算积分的方法,在X轴上寻找n个分点,将洛伦茨曲线下方的区域分成n部分,每部分用以直代曲的方法计算面积,然后加总求出面积。分点越多,就越准确,当分点达到无穷大时,则为精确计算。

假设分为n组,每组的收入为Yi,则每个部分P的面积为:
SP=  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi                                                   式(8)
加总得到:
G=  SA       SA+B  = SA+B-SB    SA+B      =1-2lim       k→∞∑ n  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi                                式(9)
这是精确计算基尼系数的表达式,当分点n个数有限时,定义:
yi=  Yi                 n∑Yi                                                                                                           式(10)
得到近似表达式:
G=2SA=  2         n  (y1+2y2+···+nyn)-( n+1       n  )                     式(11)
(证明过程见附录二)
分组计算法不依赖于洛伦茨曲线的函数形式,但在以直代曲的环节会出现误差,增加分点的个数可以减少这种误差。
4、分解法
上述的计算方法的最终目的都在于求出基尼系数的值,而分解法则是在求出上述值的基础上,力图研究基尼系数的构成因素,除了得出总的基尼系数的信息之外,在计算过程中还能够获得分解部分内部的基尼系数值。另外,分解法求出基尼系数的过程一般都依赖于已有部分的基尼系数的值,从这个意义上说,分解法并不是独立计算基尼系数的方法,它更重要的意义在于对基尼系数的分解,即定义的各个不同基尼系数值之间的相互关系。
伦敦经济学院收入分配方法论专家Cowell教授提出,基尼系数在不同人群组之间无法完全分解于尽。总体基尼系数除了包括各个组内差距之外,还应包括组间差距和相互作用项。公式为:
G =  k∑WiGi+Ib+ε(fi)                                                                           式(12)
式中,G是总体基尼系数,Gi是第i组内部的基尼系数(i=1,2,…,n),Wi是Gi的权数,Ib是组间的差距指数,ε(fi)是相互作用项。ε(fi)是各个组之间收入分布的重叠程度。特别地,当各个组之间收入分布完全不重叠时,ε(fi)=0。
式(12)地意义在于形式化地表述了对总体基尼系数进行分解的思路和框架,但由于没有给出Wi、Ib和ε(fi)的具体计算方法,还不能用于基尼系数的计算。
经济学家Sundrum(1990)在他的《欠发达国家的收入分配》一书中介绍了一种对一国或地区基尼系数进行分解的方法,其数学公式为:
G=P12 u1        u   G1+ P22 u2        u   G2+P1P2︱ u1-u2      u    ︱        koogou.net      式(13)
式中,G表示总体基尼系数,G1和G2分别表示农村和城镇的基尼系数,P1、P2分别表示农村人口和城镇人口占总人口的比重,u1、u2、u分别表示农村、城镇和总体的人均收入。
对比式(12)和式(13),可以发现式(13)是式(12)的一种具体运用,P12 u1        u   G1和P22 u2        u   G2可以作为以P12 u1        u   和P22 u2        u   为权重的 k∑WiGi,P1P2︱ u1-u2      u    ︱则为组间差距指数Ib。值得注意的是式中没有ε(fi)项,意味着ε(fi)=0成立,因此这种算法隐含的假设条件是农村与城镇的收入分布完全不重叠。此外,采用这种计算方法还必须满足条件:在估算城乡内部的基尼系数时所用的居民收入数据的口径是相同或相近的。
这种方法会在可能在两个环节产生误差:一是用其他方法估计城乡各自的基尼系数G1和G2时,可能产生误差;二是城乡收入分布一般会在不同程度上重叠。


附录一:
证明:G=△/2u=2SA
第一步,分解 n n ∑∑∣j=1 i=1Yj-Yi∣
设将收入按从低到高排列Y1、Y2、……Yn,则上式可以分解为矩阵A:

Y1            Y2          ……       Yn-1         Yn   
Y1
Y2


……


Yn-1
Yn   0       Y2-Y1        ……     Yn-1-Y1     Yn-Y1
Y2-Y1      0           ……     Yn-1-Y2     Yn-Y2
                                                  

……       ……        ……       ……        ……
 

Yn-1-Y1  Yn-1-Y2      ……         0        Yn-Yn-1
Yn-Y1    Yn-Y2           ……                    0 
将矩阵中各项加总得到:
2〔(n-1)Yn+(n-2)Yn-1+……+Y2—(n-1)Y1-(n-2)Y2-……-Yn-1〕
  =2〔(n-1)Yn+(n-3)Yn-1+(n-5)Yn-2……-(1-n)Y2-(n-1)Y1〕
第二步,计算    1           2n2u    
取样本均值u= Y1+Y2+……Yn     n        =  n∑Yi           n 
   1           2n2u =    1          2n  n∑Yi
综上,第一步、第二步,得到
G=    1          n  n∑Yi 〔(n-1)Yn+(n-3)Yn-1+(n-5)Yn-2……-(1-n)Y2-(n-1)Y1〕                                                    式(14)
第三步,计算SB

如图四,计算每一部分面积SP
SP= 1            2  AB(AC+BD)=  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi          
SB= n∑  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi          
第四步,计算SA
SA=SA+B-SB= 1            2  -  n∑  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi        = 1            2n  n n∑Yi- n∑ ∑i-1Yi+∑ i Yi            n∑Yi           
分解n n∑Yi- n∑ ∑i-1Yi+∑ i Yi得到矩阵B

n n∑Yi  n∑ ∑i-1Yi+∑ i Yi n n∑Yi- n∑ ∑i-1Yi+∑ i Yi   
Y1+Y2+…Yn
Y1+Y2+…Yn



Y1+Y2+…Yn
Y1+Y2+…Yn +Y1
Y1+Y1+Y2
Y1+Y2+Y1+Y2+Y3
 


Y1+Y2+…Yn-2+Y1+Y2+…Yn-1
Y1+Y2+…Yn-1+Y1+Y2+…Yn Yn+Yn-1+…Y2
Yn+Yn-1+…Y3-Y1
Yn+Yn-1+…Y4-Y1-Y2


Yn-Y1-Y2-…Yn-2
-Y1-Y2-…Yn-1 
加总最后一行,得到:
n n∑Yi- n∑ ∑i-1Yi+∑ i Yi=(n-1)Yn+(n-2)Yn-1+……+Y2—(n-1)Y1-(n-2)Y2-……-Yn-1=(n-1)Yn+(n-3)Yn-1+(n-5)Yn-2……-(1-n)Y2-(n-1)Y1
SA=  1            2n  n n∑Yi- n∑ ∑i-1Yi+∑ i Yi            n∑Yi            =  1           2n   n∑Yi〔(n-1)Yn+(n-3)Yn-1+(n-5)Yn-2……-(1-n)Y2-(n-1)Y1〕                               式(15)
比较式(14)和式(15)可得G=△/2u=2SA。

附录二:
证明:当分点个数n有限时,G=2SA=  2         n  (y1+2y2+···+nyn)-( n+1       n  )
定义:yi=  Yi                 n∑Yi      
SP= 1            2  AB(AC+BD)=  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi         = 1            2n ( ∑ iYi                 n∑Yi  +   ∑i-1Yi                 n∑Yi  )
SB= n∑  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi          
SA=SA+B-SB= 1            2  -  n∑  1   ∑i-1Yi+∑ i Yi     2n       n∑Yi        = 1            2n  n n∑Yi-( n∑ ∑i-1Yi+∑ i Yi)         n∑Yi           
  =1            2n  n n∑Yi- n∑(2 ∑i  Yi-Yi)            n∑Yi           =1            2n  n n∑Yi- n∑(2 ∑i  Yi-Yi)            n∑Yi          
=1            2n (2n-2 n ∑ i∑yi+2 n∑yi)- n+1           2n 
分解n- n ∑ i∑yi得到矩阵C:

n n ∑ i∑yi n- n ∑ i∑yi   
y1+y2+……yn
y1+y2+……yn


……

y1+y2+……yn
y1+y2+……yn y1
y1+y2
y1+y2+y3
 
……

y1+y2+……yn-1
y1+y2+……yn Yn+Yn-1+……Y2
Yn+Yn-1+……Y3
Yn+Yn-1+……Y4

……

Yn

加总最后一列,得到
n- n ∑ i∑yi=(n-1)yn+(n-2)yn-1+……y2
SA=1            2n (2n-2 n ∑ i∑yi+2 n∑yi)- n+1           2n 
  =1            n (y1+2y2+···+nyn)- n+1           2n 
G=2SA=  2         n  (y1+2y2+···+nyn)-( n+1       n  )

                                                 
参考资料:
Sundrum.R.M,1990,Incom Distribution in Less Developed Counties, London and New York:Routledge
Cowell.F.A,2000,Measurement of Inequality, in Handbook of Income Distribution, eds. By A.Atkirrson and F.Bourguignon, Northholland
熊俊:《基尼系数估算方法的比较研究》;《财经问题研究》2003年1月第1期
王文森:《基尼系数及推广应用》;《统计与预测》;2003年1月第1期

基尼系数的简易公式——g=P5 -P1
从理论上说。计算基尼系数需要知道全国每一个人的收入状况。但实际上,是把全国居民的收入从低到高分成几个收入组来测度基尼系数的。通常的做法是五分法,即把全国居民的收入从高到低分成人数相等的五个组。但是,每年出版的《中国统计年鉴》中只有城镇居民的五分法数据,却没有农村居民的五分法数据,更没有城乡合一的五分法数据。这样,就无从计算中国全国的基尼系数。而中国全国的基尼系数,恰恰又是当前我们十分需要的信息。下面将通过理论推导得到计算基尼系数的简易的、但又是相当精确的公式,从而使得利用当前出版的《中国统计年鉴》上的数据就可以相当精确地计算出中国城乡合一的全国的基尼系数。
由于无论是在中国还是在外国,一般都采用五分法的收入分组数据来计算基尼系数,因此下面讨论的基尼系数的简易计算公式也以五分法的数据为基础。
根据前面我们得到的基尼系数的理论计算公式,在五分法下,

把上式中正的项与负的项分别归并,有

上式就是五分法下基尼系数数值计算的精确公式。
为了使基尼系数的计算简单化,下面我们假定最低收入组、中下收入组、中等收入组、中上收入组、最高收入组的收入占总收入的比重呈等差数列,记公差为D,则有

代入(1)式,得
这样,我们得到了一个重要的计算基尼系数的简易公式。尽管在推导过程中每一步都是精确的,但由于在推导过程中我们使用了“五个收入组的收入比重呈等差数列排列”的假定,因此我们宁愿视上述简易公式为近似公式,并用小写的g把公式重写如下,以表示这是基尼系数的近似计算公式:


其意义是:基尼系数等于五分法中收入最高的那组人的收入百分比与收入最低的那组人的收入百分比之差。这一公式十分有用。因为,通常我们常见的报道是:某国居民收入的收入分配十分不公平,收入最高的20%的人们的收入已占全部收入的65%,而收入最低的20%的穷人的收入只占全部收入的5%,等等。根据上述简易公式,我们马上可以算出,这个国家的收入分配的基尼系数为
g=65%-5%=0.6

而且,对于不懂基尼系数的人来说,我们也可以简单地告诉他们:基尼系数大致就是20%的最高收入者的收入比重与20%的最低收入者的收入比重之差。
上述计算基尼系数的简易公式,简易是简易了,但精确性如何呢?表2给出了一些国家的五分法收入分配数据和基尼系数。


表2  32个国家的基尼系数、收入分配状况和用简易公式计算的基尼系数(%)

国家 年度 吉尼
系数 最低的20% 第二个
20% 第三个
20% 第四个
20% 第五个
20% 用简易公式计
算的基尼系数   
中国 1995 41.5 5.5 9.8 14.9 22.3 47.5 42   
孟加拉 1992 28.3 9.4 13.5 17.2 22.0 37.9 28.5   
印度 1994 29.7 9.2 13.0 16.8 21.7 39.3 30.1   
印尼 1996 36.5 8.0 11.3 15.1 20.8 44.9 36.9   
以色列 1992 35.5 6.9 11.4 16.3 22.9 42.5 35.6   
日本 1979  8.7 13.2 17.5 23.1 37.5 28.8   
马来西亚 1989 48.4 4.6 8.3 13.0 20.4 53.7 49.1   
韩国 1988  7.4 12.3 16.3 21.8 42.2 34.8   
巴基斯坦 1996 31.2 9.4 13.0 16.0 20.3 41.2 31.8   
菲律宾 1994 42.9 5.9 9.6 13.9 21.1 49.6 43.7   
新加坡 1983  5.1 9.9 14.6 21.4 48.9 43.8   
斯里兰卡 1990 30.1 8.9 13.1 16.9 21.7 39.3 30.4   
泰国 1992 46.2 5.6 8.7 13.0 20.0 52.7 47.1   
越南 1993 35.7 7.8 11.4 15.4 21.4 44.0 36.2   
尼日利亚 1993 37.5 4.0 8.9 14.4 23.4 49.3 45.3   
南非 1994 59.3 2.9 5.5 9.2 17.7 64.8 61.9   
加拿大 1994 31.5 7.5 12.9 17.2 23.0 39.3 31.8   
墨西哥 1995 53.7 3.6 7.2 11.8 19.2 58.2 54.6   
美国 1994 40.1 4.8 10.5 16.0 23.5 45.2 40.4   
巴西 1995 60.1 2.5 5.7 9.9 17.7 64.2 61.7   
委内瑞拉 1995 46.8 4.3 8.8 13.8 21.3 51.8 47.5   
保加利亚 1992 30.8 8.3 13.0 17.0 22.3 39.3 31.0   
法国 1989  5.6 11.8 17.2 23.5 41.9 36.3   
德国 1989 28.1 9.0 13.5 17.5 22.9 37.1 28.1   
意大利 1991 31.2 7.6 12.9 17.3 23.2 38.9 31.3   
荷兰 1991 31.5 8.0 13.0 16.7 22.5 39.9 31.9   
波兰 1992 27.2 9.3 13.8 17.7 22.6 36.6 27.3   
俄罗斯 1996 48.0 4.2 8.8 13.6 20.7 52.8 48.6   
西班牙 1990 32.5 7.5 12.6 17.0 22.6 40.3 32.8   
英国 1988  4.6 10.0 16.8 24.3 44.3 39.7   
澳大利亚 1989 33.7 7.0 12.2 16.6 23.3 40.9 33.9   
新西兰 1982  5.1 10.8 16.2 23.2 44.7 39.6 
资料来源:世界银行,转引自刘洪主编《国际统计年鉴》,中国统计出版社,1999年12月。其中最后一列基尼系数的数值是笔者用简易公式自己计算的。

从表2可以看出,用简易公式计算所得的基尼系数与表2中给出的基尼系数数值相当接近,也就是说,我们的计算基尼系数的简易公式有着相当的精确性。
但是,从表2也可以看出,无论是对哪个国家,5个收入组所占的收入比重并不呈等差数列排列。事实上,前3个收入组基本上还可以说是呈现等差数列排列,但从第4个收入组开始,其收入比重就开始“起飞”了;到最高收入组,其比重更是“一飞冲天”。令人奇怪的是,尽管等差数列的假定不成立,但我们据此假定推导出来的计算基尼系数的简易公式的计算结果却令人出奇的准确。除尼日利亚外,所有国家的基尼系数与我们用简易公式计算的结果极其接近(事实上,尼日利亚的基尼系数有误。读者可以根据表2中的五分法数据和基尼系数的精确计算公式(1)式来计算基尼系数,可以得到结果为0.4204,而不是表2中的37.5%)。而且,用简易公式计算所得的结果无一例外地都略大于真实的基尼系数的数值。这说明,这里存在着某种规律性的东西,需要继续进行研究。

最新评论共有 0 位网友发表了评论
发表评论