构建一类新的拟合效果更好的洛伦兹曲线模型,并针对1977年美国收入分配分组数据进行数值实验。实验结果表明,该类模型拟合效果较好。 A new kind of Lorenz curve model with better fitting effect is constructed, and numerical experiments are carried out on the grouped data of American income distribution in 1977. The experimental results show that this kind of model has better fitting effect.
构建一类新的拟合效果更好的洛伦兹曲线模型,并针对1977年美国收入分配分组数据进行数值实验。实验结果表明,该类模型拟合效果较好。
洛伦兹曲线模型,幂函数,指数函数,数值实验
Shanhua Ding, Lu Meng
School of Data Science and Information Engineering, Guizhou Minzu University, Guiyang Guizhou
Received: Nov. 27th, 2020; accepted: Dec. 21st, 2020; published: Dec. 31st, 2020
A new kind of Lorenz curve model with better fitting effect is constructed, and numerical experiments are carried out on the grouped data of American income distribution in 1977. The experimental results show that this kind of model has better fitting effect.
Keywords:Lorentz Curve Model, Power Function, Exponential Function, Numerical Experiments
Copyright © 2020 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
洛伦兹曲线作为刻画社会收入分配的不平等程度或贫富差距程度的一个有效工具,洛伦兹曲线得到了广泛而深入的研究。到目前为止,已经发现了几十种洛伦兹曲线模型用以拟合分组形式的收入分配数据。文献 [
设收入分配的概率密度函数为 f ( x ) ,对应的概率分布函数为 F ( x ) ,则 p = F ( x ) 表示收入低于或等于x的人口比例。记收入低于或等于x的人口群体拥有收入占总收入的比例为 L ( p ) ,则 L ( p ) = 1 μ ∫ 0 x t f ( t ) d t p = F ( x ) ,其中 μ 为平均收入。记 F ( x ) 的反函数为,则 F − 1 ( p ) L ( p ) = 1 μ ∫ 0 p F − 1 ( q ) d q 。因此,只要知道收入分配的统计分布,就可以得到相应的洛伦兹曲线。可以通过入户调查来获取家庭收入和消费等数据,用 p i 表示的是低收入群体的累计人口比例, L i 表示的是该群体拥有的总收入比例,则其形式为 { ( p i , L i ) } i = 1 n 。用最小二乘法对数据进行拟合,通过拟合来确定 L ( p , τ ) 参数向量 τ 的估值 τ ^ 。最后使用 L ( p , τ ^ ) = L ^ ( p ) 来近似描述收入分配情况。 L ( p , τ ) 是定义在区间 [ 0 , 1 ] 上取值于区间 [ 0 , 1 ] 的函数,并且满足
L ( 0 , τ ) = 0 , L ( 1 , τ ) = 1 , L ′ ( p , τ ) ≥ 0 , L ″ ( p , τ ) ≥ 0. (1)
即 L ( p , τ ) 是 [ 0 , 1 ] 上关于p的凸增函数。
文献 [
定理1 当 1 4 ≤ a ≤ 1 , α ≥ 2 a + 1 + 4 a 2 + 1 2 时, H ( p ) 满足洛伦兹曲线条件。
证明 为了证明 H ( p ) 满足洛伦兹曲线条件,需验证 H ( p ) 满足(1)式。显然, H ( 0 ) = 0 , H ( 1 ) = 1 。
H ′ ( p ) = α p α − 1 e a ( 1 − p ) + p α ( − a ) e a ( 1 − p ) = ( α p α − 1 − a p α ) e a ( 1 − p ) = e a ( 1 − p ) p α − 1 ( α − a p ) .
当 1 4 ≤ a ≤ 1 , p ∈ [ 0 , 1 ] , α ≥ 2 a + 1 + 4 a 2 + 1 2 时,易知 H ′ ( p ) ≥ 0.
H ″ ( p ) = ( − a ) e a ( 1 − p ) p α − 1 ( α − a p ) + e a ( 1 − p ) ( α − 1 ) p ( α − 2 ) ( α − a p ) + e a ( 1 − p ) p ( α − 1 ) ( α − a ) = e a ( 1 − p ) p α − 2 ( − a p ( α − a p ) + ( α − 1 ) ( α − a p ) + p ( α − a ) ) = e a ( 1 − p ) p α − 2 ( − a p α + a 2 p 2 + α 2 − α a p − α + a p + α p − a p ) = e a ( 1 − p ) p α − 2 ( − 2 a p α + a 2 p 2 + α 2 − α + α p ) = e a ( 1 − p ) p α − 2 ( a 2 − ( 2 a p + 1 ) α + a 2 p 2 + α p ) .
因为 p ∈ [ 0 , 1 ] , 1 4 ≤ a ≤ 1 时,所以当 α ≥ 2 a + 1 + 4 a 2 + 1 2 时, H ″ ( p ) ≥ 0 ,定理证毕。
利用Basmann (1990)实例分析中所给出的1977年美国100个分位点的详细收入分配分组数据对周递芝(2018)中 J ( p ) = p α sin ( π 2 p ) , ( α > 1 + π 2 ) 以及我们的 H ( p ) = p α e a ( 1 − p ) , ( α > 2 a + 1 + 4 a 2 + 1 2 , 1 4 ≤ a ≤ 1 ) 进行数值实验,并比较。定义残差平方和为 S S R = ∑ i = 1 n [ L ( p , τ ^ ) − L i ] 2 ,最大绝对误差 M A S = max 1 ≤ i ≤ n | L ( p , τ ^ ) − L i | ,基尼系数 G = 1 − 2 ∫ 0 1 L ( p ) d p 。借助Lingo11和matlab得出的实验结果见表1。
SSR | MAS | G | |
---|---|---|---|
J ( p ) | 0.1191427E-02 | 0.8428122 | 0.339733 |
H ( P ) | 0.8449939E-03 | 0.0530572 | 0.378377 |
表1. 1977年美国收入分组数据均方误差检验结果
通过数值实验结果的比对, H ( p ) 的残差平方和和最大绝对误差都是最小,这表明了我们构建的新模型拟合效果有了很大的改善,该模型的拟合精度更高,适应性更强。因此,我们构造的洛伦兹曲线模型是对既有洛伦兹曲线模型的有效拓展。
作者对同行评阅人的意见和建议表示深深感谢。
丁善华,蒙 璐. 基于幂函数与指数函数组合的洛伦兹曲线模型Lorenz Curve Model Based on Exponent Combination of Power Function and Exponential Function[J]. 应用数学进展, 2020, 09(12): 2329-2332. https://doi.org/10.12677/AAM.2020.912272
https://doi.org/10.1007/BF01205943
https://doi.org/10.1016/0165-1765(96)00833-6
https://doi.org/10.1016/0304-4076(94)01722-0
https://doi.org/10.1080/07474939708800389
https://doi.org/10.1016/j.econlet.2005.05.015
https://doi.org/10.1016/S0165-1765(00)00274-3
https://doi.org/10.1016/S0304-4076(98)00048-7
https://doi.org/10.1016/0304-4076(90)90108-6