37
139 Economía Española y Protección Social, VIII, Año 2016. 139-175 DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. UNA APLICACIÓN A LA ESTIMACIÓN DE RETENCIONES A CUENTA DEL IRPF WAGE DISTRIBUTIONS: ADJUSTMENT AND PROJECTION. AN APPLICATION TO THE ESTIMATED INCOME TAX WITHHOLDINGS Pedro Valverde Caramés 1 Jefe de Área. Servicio de Estudios Tributarios y Estadísticas. AEAT. España Resumen Este artículo parte de la carencia, en las fuentes estadísticas fiscales españolas, de información sobre el tiempo de trabajo en materia de retribuciones salariales. La información estadística sobre salarios anuales es muy precisa pero no tiene en cuenta el tiempo efectivo en que se obtiene esa renta. Para poder abordar lo anterior se recurre a la Muestra Continua de Vidas Laborales (MCVL), puesto que en dicha operación estadística se integran, conjuntamente, tanto información fiscal como laboral; salarios y tiempo de trabajo. El conocimiento detallado del tiempo de trabajo efectivo (en el que se obtiene la renta y que no tiene por qué coincidir con aquel al que se le imputa, generalmente el año natural) permite comprender de manera satisfactoria la forma que adopta la distribución de las rentas salariales anuales (inexplicable de otra manera) así como realizar una estratificación 1 Correo electrónico / E-mail: [email protected]

DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

Embed Size (px)

Citation preview

Page 1: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

139

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 139-175

DISTRIBUCIONES SALARIALES AJUSTE Y PROYECCIOacuteN

UNA APLICACIOacuteN A LA ESTIMACIOacuteN DE RETENCIONES A

CUENTA DEL IRPF

WAGE DISTRIBUTIONS ADJUSTMENT AND PROJECTION AN

APPLICATION TO THE ESTIMATED INCOME TAX WITHHOLDINGS

Pedro Valverde Carameacutes1

Jefe de Aacuterea Servicio de Estudios Tributarios y Estadiacutesticas AEAT Espantildea

Resumen

Este artiacuteculo parte de la carencia en las fuentes estadiacutesticas fiscales

espantildeolas de informacioacuten sobre el tiempo de trabajo en materia de

retribuciones salariales La informacioacuten estadiacutestica sobre salarios anuales

es muy precisa pero no tiene en cuenta el tiempo efectivo en que se obtiene

esa renta

Para poder abordar lo anterior se recurre a la Muestra Continua de Vidas

Laborales (MCVL) puesto que en dicha operacioacuten estadiacutestica se integran

conjuntamente tanto informacioacuten fiscal como laboral salarios y tiempo de

trabajo El conocimiento detallado del tiempo de trabajo efectivo (en el que

se obtiene la renta y que no tiene por queacute coincidir con aquel al que se le

imputa generalmente el antildeo natural) permite comprender de manera

satisfactoria la forma que adopta la distribucioacuten de las rentas salariales

anuales (inexplicable de otra manera) asiacute como realizar una estratificacioacuten

1 Correo electroacutenico E-mail pedrovalverdeccorreoaeates

140

muy fructiacutefera en teacuterminos de anaacutelisis estadiacutestico de la poblacioacuten de

asalariados

Todo lo anterior permite una adecuada modelizacioacuten de las retribuciones

salariales de la economiacutea espantildeola Como se veraacute eacutestas se ajustan con

mucha precisioacuten a una distribucioacuten estadiacutestica de cuatro paraacutemetros

conocida como Beta Generalizada de Segunda Especie (GB2 en la

literatura sobre el tema) Conocida la distribucioacuten de probabilidad a la que

se ajustan los salarios anuales se puede estudiar coacutemo evolucionan en el

tiempo los paraacutemetros que la definen con lo cual se dispone de una

herramienta provechosa para efectuar predicciones Reemplazar los valores

reales por sus equivalentes simulados a traveacutes de la correspondiente GB2

permite el anaacutelisis de la evolucioacuten de los salarios y la simulacioacuten de

acciones fiscales sobre ellos entre otras muchas posibilidades A modo de

ejemplo se presentaraacute una propuesta para la estimacioacuten de las Retenciones

a Cuenta del IRPF

Palabras clave

Salarios Tiempo de trabajo Simulaciones numeacutericas Funciones de

distribucioacuten Beta generalizada de segundo orden (GB2)

Abstract

Information about annual salaries is very accurate in Spanish tax statistics

but does not consider the time period in which that income is obtained To

address the above MCVL is used (MCVL is a statistical operation that

integrates tax and employment information wages and working time) The

detailed working time (in which income is obtained and that does not have to

match that to which is charged usually a calendar year) allows us to

understand satisfactorily the form of the distribution of incomes wages

141

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

(otherwise inexplicable) and stratifying -very fruitful in terms of statistical

analysis- the population of employees

All this allows adequate modeling of the salaries of the Spanish economy

As it will be seen they are adjusted very accurately to a statistical

distribution known as Beta four parameters Generalized Second Kind (GB2

literature on the subject) Knowing the probability distribution which annual

wages are adjusted you can study how they evolve over time parameters

that define it showing a helpful tool for making predictions Replace the

actual values for their simulated counterparts through the corresponding

GB2 allows the analysis of the evolution of wages the simulation of fiscal

actions on them among many other possibilities As an example a proposal

for the estimation of the personal income tax withholdings will be presented

Keywords

Wages Working time Income distribution Generalized beta of second kind

(GB2) Numerical simulations

JEL C13 C46 D63

1 El problema de la forma

El presente artiacuteculo es una continuacioacuten de Valverde Carameacutes P

(2011) Alliacute se discutiacutea la necesidad de incorporar el tiempo de trabajo como

variable fundamental a la hora de estudiar la distribucioacuten de los salarios

de la economiacutea espantildeola y se proponiacutea el uso de la Muestra Continua

de Vidas Laborales (MCVL) como la herramienta adecuada para ese fin

Partimos aquiacute del Graacutefico 1 que muestra la distribucioacuten de las retribuciones

salariales en este caso como funcioacuten del Salario Miacutenimo Interprofesional

142

(SMI) correspondiente al ejercicio de 2014 La informacioacuten proviene de la

estadiacutestica Mercado de Trabajo y Pensiones en las Fuentes Tributarias

(MTyPFT) elaborada por la Agencia Estatal de Administracioacuten Tributaria

(AEAT)

Graacutefico 1 Distribucioacuten de las retribuciones salariales anuales 2014

Fuente Mercado de trabajo y pensiones en las fuentes tributarias (AEAT)

La forma de este histograma es bien conocida y se repite de manera

habitual al analizar la distribucioacuten de los salarios en la economiacutea espantildeola

La existencia de colas pesadas en la parte izquierda de la distribucioacuten

(salarios bajos) junto con un decrecimiento asintoacutetico por el lado derecho

(salarios altos) y una doble moda es una constante a lo largo del tiempo en

los estudios sobre distribucioacuten de retribuciones salariales (veacutease por todos

Melis Maynar F (1995)) Usando la informacioacuten proporcionada por la

explotacioacuten de la MCVL (la MCVL-2014 en este caso) se puede replicar la

proporcionada por la estadiacutestica MTyPFT y asiacute se obtiene la Tabla 1

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

143

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Como se puede observar la MCVL replica de manera muy

aproximada tanto la distribucioacuten como los salarios medios por tramo de SMI

y ademaacutes proporciona el tiempo de trabajo medio para cada intervalo Esto

uacuteltimo no es posible con la estadiacutestica MTyPFT

Tabla 1 Retribuciones salariales y tiempo de trabajo Comparacioacuten entre

MCVL y MTyPFT

TRAMOS SMI2014

DISTRIBUCIOacuteN SALARIOS MEDIOS TIEMPO

TRABAJO MEDIO

MCVL-2014 MTyPFT MCVL-2014 MTyPFT MCVL-2014

0 - 05 2080 2186 1907 1840 10105

05 - 1 1362 1300 6744 6731 24385

1 - 15 1262 1211 11329 11320 31111

15 - 2 1417 1314 15812 15815 34643

2 - 25 1118 1047 20178 20182 35630

25 - 3 757 736 24702 24726 35896

3 - 35 527 586 29235 29260 36013

35 - 4 385 448 33760 33775 36129

4 - 45 289 337 38245 38251 36141

45 - 5 194 213 42748 42744 36125

5 - 75 422 429 54004 53885 36153

75 - 10 113 117 76699 76753 36187

gt 10 074 076 150129 148824 35635

TOTAL 10000 10000 18138 18420 28191

Fuente elaboracioacuten propia

A traveacutes de la MCVL se pueden conocer los diacuteas que el trabajador

ha estado en alta a lo largo del antildeo Esto permite estudiar el periacuteodo de

tiempo -efectivo- en el que se han obtenido dichas retribuciones El anaacutelisis

asiacute concebido tiene en cuenta una perspectiva temporal de la que carece si

uacutenicamente se dispone de la informacioacuten de caraacutecter fiscal Representando

las dos distribuciones de la tabla anterior se obtiene el Graacutefico 2 Ambos

histogramas tienen la misma forma como era de prever ya que ambas

144

estadiacutesticas comparten la misma informacioacuten para determinar la masa

salarial total Es importante destacar que la MCVL combina en una uacutenica

operacioacuten estadiacutestica tanto informacioacuten fiscal como seriacutean los salarios en

este caso como informacioacuten propia de seguridad social el tiempo de

trabajo La explotacioacuten del moacutedulo fiscal de la MVCL (el que contiene la

informacioacuten sobre salarios retenciones etc y ha sido utilizado en este

trabajo) permite un anaacutelisis maacutes completo que si se usan las bases de

cotizacioacuten que al estar topadas aproximan mal los salarios maacutes altos

Graacutefico 2 Distribucioacuten de las retribuciones salariales anuales 2014

Comparacioacuten entre MCVL y MTyPFT

Fuente elaboracioacuten propia

Usando la MCVL-2014 se pueden construir las curvas de densidad

(reduciendo la amplitud de los intervalos considerados) para las

retribuciones salariales El Graacutefico 3 permite observar esto por tramos de

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

MCVL MTyPFT

145

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

salario bruto anual para el ejercicio de 2014 La curva obtenida es una

envolvente al histograma inicial

Graacutefico 3 Curva de densidad para los salarios del ejercicio 2014

Fuente elaboracioacuten propia Miles de euros

2 Permanentes y Eventuales

Al disponer para cada uno de los trabajadores no soacutelo de su salario

anual sino ademaacutes del nuacutemero de diacuteas en alta laboral se puede avanzar en

el anaacutelisis descomponiendo la poblacioacuten total en dos colectivos claramente

diferenciados De forma natural el conjunto admite una desagregacioacuten en

funcioacuten de si se ha estado en alta laboral todo el antildeo o soacutelo una fraccioacuten del

mismo A cada trabajador estudiado se le asigna para cada ejercicio un

vector de 365 componentes una para cada diacutea del antildeo Cada componente

tendraacute el valor 1 si ha estado de alta ese diacutea y 0 si no lo ha estado de tal

manera que quedaraacute definido por un vector del tipo (111hellip1000hellip)

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 2: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

140

muy fructiacutefera en teacuterminos de anaacutelisis estadiacutestico de la poblacioacuten de

asalariados

Todo lo anterior permite una adecuada modelizacioacuten de las retribuciones

salariales de la economiacutea espantildeola Como se veraacute eacutestas se ajustan con

mucha precisioacuten a una distribucioacuten estadiacutestica de cuatro paraacutemetros

conocida como Beta Generalizada de Segunda Especie (GB2 en la

literatura sobre el tema) Conocida la distribucioacuten de probabilidad a la que

se ajustan los salarios anuales se puede estudiar coacutemo evolucionan en el

tiempo los paraacutemetros que la definen con lo cual se dispone de una

herramienta provechosa para efectuar predicciones Reemplazar los valores

reales por sus equivalentes simulados a traveacutes de la correspondiente GB2

permite el anaacutelisis de la evolucioacuten de los salarios y la simulacioacuten de

acciones fiscales sobre ellos entre otras muchas posibilidades A modo de

ejemplo se presentaraacute una propuesta para la estimacioacuten de las Retenciones

a Cuenta del IRPF

Palabras clave

Salarios Tiempo de trabajo Simulaciones numeacutericas Funciones de

distribucioacuten Beta generalizada de segundo orden (GB2)

Abstract

Information about annual salaries is very accurate in Spanish tax statistics

but does not consider the time period in which that income is obtained To

address the above MCVL is used (MCVL is a statistical operation that

integrates tax and employment information wages and working time) The

detailed working time (in which income is obtained and that does not have to

match that to which is charged usually a calendar year) allows us to

understand satisfactorily the form of the distribution of incomes wages

141

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

(otherwise inexplicable) and stratifying -very fruitful in terms of statistical

analysis- the population of employees

All this allows adequate modeling of the salaries of the Spanish economy

As it will be seen they are adjusted very accurately to a statistical

distribution known as Beta four parameters Generalized Second Kind (GB2

literature on the subject) Knowing the probability distribution which annual

wages are adjusted you can study how they evolve over time parameters

that define it showing a helpful tool for making predictions Replace the

actual values for their simulated counterparts through the corresponding

GB2 allows the analysis of the evolution of wages the simulation of fiscal

actions on them among many other possibilities As an example a proposal

for the estimation of the personal income tax withholdings will be presented

Keywords

Wages Working time Income distribution Generalized beta of second kind

(GB2) Numerical simulations

JEL C13 C46 D63

1 El problema de la forma

El presente artiacuteculo es una continuacioacuten de Valverde Carameacutes P

(2011) Alliacute se discutiacutea la necesidad de incorporar el tiempo de trabajo como

variable fundamental a la hora de estudiar la distribucioacuten de los salarios

de la economiacutea espantildeola y se proponiacutea el uso de la Muestra Continua

de Vidas Laborales (MCVL) como la herramienta adecuada para ese fin

Partimos aquiacute del Graacutefico 1 que muestra la distribucioacuten de las retribuciones

salariales en este caso como funcioacuten del Salario Miacutenimo Interprofesional

142

(SMI) correspondiente al ejercicio de 2014 La informacioacuten proviene de la

estadiacutestica Mercado de Trabajo y Pensiones en las Fuentes Tributarias

(MTyPFT) elaborada por la Agencia Estatal de Administracioacuten Tributaria

(AEAT)

Graacutefico 1 Distribucioacuten de las retribuciones salariales anuales 2014

Fuente Mercado de trabajo y pensiones en las fuentes tributarias (AEAT)

La forma de este histograma es bien conocida y se repite de manera

habitual al analizar la distribucioacuten de los salarios en la economiacutea espantildeola

La existencia de colas pesadas en la parte izquierda de la distribucioacuten

(salarios bajos) junto con un decrecimiento asintoacutetico por el lado derecho

(salarios altos) y una doble moda es una constante a lo largo del tiempo en

los estudios sobre distribucioacuten de retribuciones salariales (veacutease por todos

Melis Maynar F (1995)) Usando la informacioacuten proporcionada por la

explotacioacuten de la MCVL (la MCVL-2014 en este caso) se puede replicar la

proporcionada por la estadiacutestica MTyPFT y asiacute se obtiene la Tabla 1

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

143

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Como se puede observar la MCVL replica de manera muy

aproximada tanto la distribucioacuten como los salarios medios por tramo de SMI

y ademaacutes proporciona el tiempo de trabajo medio para cada intervalo Esto

uacuteltimo no es posible con la estadiacutestica MTyPFT

Tabla 1 Retribuciones salariales y tiempo de trabajo Comparacioacuten entre

MCVL y MTyPFT

TRAMOS SMI2014

DISTRIBUCIOacuteN SALARIOS MEDIOS TIEMPO

TRABAJO MEDIO

MCVL-2014 MTyPFT MCVL-2014 MTyPFT MCVL-2014

0 - 05 2080 2186 1907 1840 10105

05 - 1 1362 1300 6744 6731 24385

1 - 15 1262 1211 11329 11320 31111

15 - 2 1417 1314 15812 15815 34643

2 - 25 1118 1047 20178 20182 35630

25 - 3 757 736 24702 24726 35896

3 - 35 527 586 29235 29260 36013

35 - 4 385 448 33760 33775 36129

4 - 45 289 337 38245 38251 36141

45 - 5 194 213 42748 42744 36125

5 - 75 422 429 54004 53885 36153

75 - 10 113 117 76699 76753 36187

gt 10 074 076 150129 148824 35635

TOTAL 10000 10000 18138 18420 28191

Fuente elaboracioacuten propia

A traveacutes de la MCVL se pueden conocer los diacuteas que el trabajador

ha estado en alta a lo largo del antildeo Esto permite estudiar el periacuteodo de

tiempo -efectivo- en el que se han obtenido dichas retribuciones El anaacutelisis

asiacute concebido tiene en cuenta una perspectiva temporal de la que carece si

uacutenicamente se dispone de la informacioacuten de caraacutecter fiscal Representando

las dos distribuciones de la tabla anterior se obtiene el Graacutefico 2 Ambos

histogramas tienen la misma forma como era de prever ya que ambas

144

estadiacutesticas comparten la misma informacioacuten para determinar la masa

salarial total Es importante destacar que la MCVL combina en una uacutenica

operacioacuten estadiacutestica tanto informacioacuten fiscal como seriacutean los salarios en

este caso como informacioacuten propia de seguridad social el tiempo de

trabajo La explotacioacuten del moacutedulo fiscal de la MVCL (el que contiene la

informacioacuten sobre salarios retenciones etc y ha sido utilizado en este

trabajo) permite un anaacutelisis maacutes completo que si se usan las bases de

cotizacioacuten que al estar topadas aproximan mal los salarios maacutes altos

Graacutefico 2 Distribucioacuten de las retribuciones salariales anuales 2014

Comparacioacuten entre MCVL y MTyPFT

Fuente elaboracioacuten propia

Usando la MCVL-2014 se pueden construir las curvas de densidad

(reduciendo la amplitud de los intervalos considerados) para las

retribuciones salariales El Graacutefico 3 permite observar esto por tramos de

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

MCVL MTyPFT

145

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

salario bruto anual para el ejercicio de 2014 La curva obtenida es una

envolvente al histograma inicial

Graacutefico 3 Curva de densidad para los salarios del ejercicio 2014

Fuente elaboracioacuten propia Miles de euros

2 Permanentes y Eventuales

Al disponer para cada uno de los trabajadores no soacutelo de su salario

anual sino ademaacutes del nuacutemero de diacuteas en alta laboral se puede avanzar en

el anaacutelisis descomponiendo la poblacioacuten total en dos colectivos claramente

diferenciados De forma natural el conjunto admite una desagregacioacuten en

funcioacuten de si se ha estado en alta laboral todo el antildeo o soacutelo una fraccioacuten del

mismo A cada trabajador estudiado se le asigna para cada ejercicio un

vector de 365 componentes una para cada diacutea del antildeo Cada componente

tendraacute el valor 1 si ha estado de alta ese diacutea y 0 si no lo ha estado de tal

manera que quedaraacute definido por un vector del tipo (111hellip1000hellip)

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 3: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

141

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

(otherwise inexplicable) and stratifying -very fruitful in terms of statistical

analysis- the population of employees

All this allows adequate modeling of the salaries of the Spanish economy

As it will be seen they are adjusted very accurately to a statistical

distribution known as Beta four parameters Generalized Second Kind (GB2

literature on the subject) Knowing the probability distribution which annual

wages are adjusted you can study how they evolve over time parameters

that define it showing a helpful tool for making predictions Replace the

actual values for their simulated counterparts through the corresponding

GB2 allows the analysis of the evolution of wages the simulation of fiscal

actions on them among many other possibilities As an example a proposal

for the estimation of the personal income tax withholdings will be presented

Keywords

Wages Working time Income distribution Generalized beta of second kind

(GB2) Numerical simulations

JEL C13 C46 D63

1 El problema de la forma

El presente artiacuteculo es una continuacioacuten de Valverde Carameacutes P

(2011) Alliacute se discutiacutea la necesidad de incorporar el tiempo de trabajo como

variable fundamental a la hora de estudiar la distribucioacuten de los salarios

de la economiacutea espantildeola y se proponiacutea el uso de la Muestra Continua

de Vidas Laborales (MCVL) como la herramienta adecuada para ese fin

Partimos aquiacute del Graacutefico 1 que muestra la distribucioacuten de las retribuciones

salariales en este caso como funcioacuten del Salario Miacutenimo Interprofesional

142

(SMI) correspondiente al ejercicio de 2014 La informacioacuten proviene de la

estadiacutestica Mercado de Trabajo y Pensiones en las Fuentes Tributarias

(MTyPFT) elaborada por la Agencia Estatal de Administracioacuten Tributaria

(AEAT)

Graacutefico 1 Distribucioacuten de las retribuciones salariales anuales 2014

Fuente Mercado de trabajo y pensiones en las fuentes tributarias (AEAT)

La forma de este histograma es bien conocida y se repite de manera

habitual al analizar la distribucioacuten de los salarios en la economiacutea espantildeola

La existencia de colas pesadas en la parte izquierda de la distribucioacuten

(salarios bajos) junto con un decrecimiento asintoacutetico por el lado derecho

(salarios altos) y una doble moda es una constante a lo largo del tiempo en

los estudios sobre distribucioacuten de retribuciones salariales (veacutease por todos

Melis Maynar F (1995)) Usando la informacioacuten proporcionada por la

explotacioacuten de la MCVL (la MCVL-2014 en este caso) se puede replicar la

proporcionada por la estadiacutestica MTyPFT y asiacute se obtiene la Tabla 1

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

143

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Como se puede observar la MCVL replica de manera muy

aproximada tanto la distribucioacuten como los salarios medios por tramo de SMI

y ademaacutes proporciona el tiempo de trabajo medio para cada intervalo Esto

uacuteltimo no es posible con la estadiacutestica MTyPFT

Tabla 1 Retribuciones salariales y tiempo de trabajo Comparacioacuten entre

MCVL y MTyPFT

TRAMOS SMI2014

DISTRIBUCIOacuteN SALARIOS MEDIOS TIEMPO

TRABAJO MEDIO

MCVL-2014 MTyPFT MCVL-2014 MTyPFT MCVL-2014

0 - 05 2080 2186 1907 1840 10105

05 - 1 1362 1300 6744 6731 24385

1 - 15 1262 1211 11329 11320 31111

15 - 2 1417 1314 15812 15815 34643

2 - 25 1118 1047 20178 20182 35630

25 - 3 757 736 24702 24726 35896

3 - 35 527 586 29235 29260 36013

35 - 4 385 448 33760 33775 36129

4 - 45 289 337 38245 38251 36141

45 - 5 194 213 42748 42744 36125

5 - 75 422 429 54004 53885 36153

75 - 10 113 117 76699 76753 36187

gt 10 074 076 150129 148824 35635

TOTAL 10000 10000 18138 18420 28191

Fuente elaboracioacuten propia

A traveacutes de la MCVL se pueden conocer los diacuteas que el trabajador

ha estado en alta a lo largo del antildeo Esto permite estudiar el periacuteodo de

tiempo -efectivo- en el que se han obtenido dichas retribuciones El anaacutelisis

asiacute concebido tiene en cuenta una perspectiva temporal de la que carece si

uacutenicamente se dispone de la informacioacuten de caraacutecter fiscal Representando

las dos distribuciones de la tabla anterior se obtiene el Graacutefico 2 Ambos

histogramas tienen la misma forma como era de prever ya que ambas

144

estadiacutesticas comparten la misma informacioacuten para determinar la masa

salarial total Es importante destacar que la MCVL combina en una uacutenica

operacioacuten estadiacutestica tanto informacioacuten fiscal como seriacutean los salarios en

este caso como informacioacuten propia de seguridad social el tiempo de

trabajo La explotacioacuten del moacutedulo fiscal de la MVCL (el que contiene la

informacioacuten sobre salarios retenciones etc y ha sido utilizado en este

trabajo) permite un anaacutelisis maacutes completo que si se usan las bases de

cotizacioacuten que al estar topadas aproximan mal los salarios maacutes altos

Graacutefico 2 Distribucioacuten de las retribuciones salariales anuales 2014

Comparacioacuten entre MCVL y MTyPFT

Fuente elaboracioacuten propia

Usando la MCVL-2014 se pueden construir las curvas de densidad

(reduciendo la amplitud de los intervalos considerados) para las

retribuciones salariales El Graacutefico 3 permite observar esto por tramos de

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

MCVL MTyPFT

145

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

salario bruto anual para el ejercicio de 2014 La curva obtenida es una

envolvente al histograma inicial

Graacutefico 3 Curva de densidad para los salarios del ejercicio 2014

Fuente elaboracioacuten propia Miles de euros

2 Permanentes y Eventuales

Al disponer para cada uno de los trabajadores no soacutelo de su salario

anual sino ademaacutes del nuacutemero de diacuteas en alta laboral se puede avanzar en

el anaacutelisis descomponiendo la poblacioacuten total en dos colectivos claramente

diferenciados De forma natural el conjunto admite una desagregacioacuten en

funcioacuten de si se ha estado en alta laboral todo el antildeo o soacutelo una fraccioacuten del

mismo A cada trabajador estudiado se le asigna para cada ejercicio un

vector de 365 componentes una para cada diacutea del antildeo Cada componente

tendraacute el valor 1 si ha estado de alta ese diacutea y 0 si no lo ha estado de tal

manera que quedaraacute definido por un vector del tipo (111hellip1000hellip)

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 4: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

142

(SMI) correspondiente al ejercicio de 2014 La informacioacuten proviene de la

estadiacutestica Mercado de Trabajo y Pensiones en las Fuentes Tributarias

(MTyPFT) elaborada por la Agencia Estatal de Administracioacuten Tributaria

(AEAT)

Graacutefico 1 Distribucioacuten de las retribuciones salariales anuales 2014

Fuente Mercado de trabajo y pensiones en las fuentes tributarias (AEAT)

La forma de este histograma es bien conocida y se repite de manera

habitual al analizar la distribucioacuten de los salarios en la economiacutea espantildeola

La existencia de colas pesadas en la parte izquierda de la distribucioacuten

(salarios bajos) junto con un decrecimiento asintoacutetico por el lado derecho

(salarios altos) y una doble moda es una constante a lo largo del tiempo en

los estudios sobre distribucioacuten de retribuciones salariales (veacutease por todos

Melis Maynar F (1995)) Usando la informacioacuten proporcionada por la

explotacioacuten de la MCVL (la MCVL-2014 en este caso) se puede replicar la

proporcionada por la estadiacutestica MTyPFT y asiacute se obtiene la Tabla 1

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

143

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Como se puede observar la MCVL replica de manera muy

aproximada tanto la distribucioacuten como los salarios medios por tramo de SMI

y ademaacutes proporciona el tiempo de trabajo medio para cada intervalo Esto

uacuteltimo no es posible con la estadiacutestica MTyPFT

Tabla 1 Retribuciones salariales y tiempo de trabajo Comparacioacuten entre

MCVL y MTyPFT

TRAMOS SMI2014

DISTRIBUCIOacuteN SALARIOS MEDIOS TIEMPO

TRABAJO MEDIO

MCVL-2014 MTyPFT MCVL-2014 MTyPFT MCVL-2014

0 - 05 2080 2186 1907 1840 10105

05 - 1 1362 1300 6744 6731 24385

1 - 15 1262 1211 11329 11320 31111

15 - 2 1417 1314 15812 15815 34643

2 - 25 1118 1047 20178 20182 35630

25 - 3 757 736 24702 24726 35896

3 - 35 527 586 29235 29260 36013

35 - 4 385 448 33760 33775 36129

4 - 45 289 337 38245 38251 36141

45 - 5 194 213 42748 42744 36125

5 - 75 422 429 54004 53885 36153

75 - 10 113 117 76699 76753 36187

gt 10 074 076 150129 148824 35635

TOTAL 10000 10000 18138 18420 28191

Fuente elaboracioacuten propia

A traveacutes de la MCVL se pueden conocer los diacuteas que el trabajador

ha estado en alta a lo largo del antildeo Esto permite estudiar el periacuteodo de

tiempo -efectivo- en el que se han obtenido dichas retribuciones El anaacutelisis

asiacute concebido tiene en cuenta una perspectiva temporal de la que carece si

uacutenicamente se dispone de la informacioacuten de caraacutecter fiscal Representando

las dos distribuciones de la tabla anterior se obtiene el Graacutefico 2 Ambos

histogramas tienen la misma forma como era de prever ya que ambas

144

estadiacutesticas comparten la misma informacioacuten para determinar la masa

salarial total Es importante destacar que la MCVL combina en una uacutenica

operacioacuten estadiacutestica tanto informacioacuten fiscal como seriacutean los salarios en

este caso como informacioacuten propia de seguridad social el tiempo de

trabajo La explotacioacuten del moacutedulo fiscal de la MVCL (el que contiene la

informacioacuten sobre salarios retenciones etc y ha sido utilizado en este

trabajo) permite un anaacutelisis maacutes completo que si se usan las bases de

cotizacioacuten que al estar topadas aproximan mal los salarios maacutes altos

Graacutefico 2 Distribucioacuten de las retribuciones salariales anuales 2014

Comparacioacuten entre MCVL y MTyPFT

Fuente elaboracioacuten propia

Usando la MCVL-2014 se pueden construir las curvas de densidad

(reduciendo la amplitud de los intervalos considerados) para las

retribuciones salariales El Graacutefico 3 permite observar esto por tramos de

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

MCVL MTyPFT

145

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

salario bruto anual para el ejercicio de 2014 La curva obtenida es una

envolvente al histograma inicial

Graacutefico 3 Curva de densidad para los salarios del ejercicio 2014

Fuente elaboracioacuten propia Miles de euros

2 Permanentes y Eventuales

Al disponer para cada uno de los trabajadores no soacutelo de su salario

anual sino ademaacutes del nuacutemero de diacuteas en alta laboral se puede avanzar en

el anaacutelisis descomponiendo la poblacioacuten total en dos colectivos claramente

diferenciados De forma natural el conjunto admite una desagregacioacuten en

funcioacuten de si se ha estado en alta laboral todo el antildeo o soacutelo una fraccioacuten del

mismo A cada trabajador estudiado se le asigna para cada ejercicio un

vector de 365 componentes una para cada diacutea del antildeo Cada componente

tendraacute el valor 1 si ha estado de alta ese diacutea y 0 si no lo ha estado de tal

manera que quedaraacute definido por un vector del tipo (111hellip1000hellip)

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 5: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

143

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Como se puede observar la MCVL replica de manera muy

aproximada tanto la distribucioacuten como los salarios medios por tramo de SMI

y ademaacutes proporciona el tiempo de trabajo medio para cada intervalo Esto

uacuteltimo no es posible con la estadiacutestica MTyPFT

Tabla 1 Retribuciones salariales y tiempo de trabajo Comparacioacuten entre

MCVL y MTyPFT

TRAMOS SMI2014

DISTRIBUCIOacuteN SALARIOS MEDIOS TIEMPO

TRABAJO MEDIO

MCVL-2014 MTyPFT MCVL-2014 MTyPFT MCVL-2014

0 - 05 2080 2186 1907 1840 10105

05 - 1 1362 1300 6744 6731 24385

1 - 15 1262 1211 11329 11320 31111

15 - 2 1417 1314 15812 15815 34643

2 - 25 1118 1047 20178 20182 35630

25 - 3 757 736 24702 24726 35896

3 - 35 527 586 29235 29260 36013

35 - 4 385 448 33760 33775 36129

4 - 45 289 337 38245 38251 36141

45 - 5 194 213 42748 42744 36125

5 - 75 422 429 54004 53885 36153

75 - 10 113 117 76699 76753 36187

gt 10 074 076 150129 148824 35635

TOTAL 10000 10000 18138 18420 28191

Fuente elaboracioacuten propia

A traveacutes de la MCVL se pueden conocer los diacuteas que el trabajador

ha estado en alta a lo largo del antildeo Esto permite estudiar el periacuteodo de

tiempo -efectivo- en el que se han obtenido dichas retribuciones El anaacutelisis

asiacute concebido tiene en cuenta una perspectiva temporal de la que carece si

uacutenicamente se dispone de la informacioacuten de caraacutecter fiscal Representando

las dos distribuciones de la tabla anterior se obtiene el Graacutefico 2 Ambos

histogramas tienen la misma forma como era de prever ya que ambas

144

estadiacutesticas comparten la misma informacioacuten para determinar la masa

salarial total Es importante destacar que la MCVL combina en una uacutenica

operacioacuten estadiacutestica tanto informacioacuten fiscal como seriacutean los salarios en

este caso como informacioacuten propia de seguridad social el tiempo de

trabajo La explotacioacuten del moacutedulo fiscal de la MVCL (el que contiene la

informacioacuten sobre salarios retenciones etc y ha sido utilizado en este

trabajo) permite un anaacutelisis maacutes completo que si se usan las bases de

cotizacioacuten que al estar topadas aproximan mal los salarios maacutes altos

Graacutefico 2 Distribucioacuten de las retribuciones salariales anuales 2014

Comparacioacuten entre MCVL y MTyPFT

Fuente elaboracioacuten propia

Usando la MCVL-2014 se pueden construir las curvas de densidad

(reduciendo la amplitud de los intervalos considerados) para las

retribuciones salariales El Graacutefico 3 permite observar esto por tramos de

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

MCVL MTyPFT

145

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

salario bruto anual para el ejercicio de 2014 La curva obtenida es una

envolvente al histograma inicial

Graacutefico 3 Curva de densidad para los salarios del ejercicio 2014

Fuente elaboracioacuten propia Miles de euros

2 Permanentes y Eventuales

Al disponer para cada uno de los trabajadores no soacutelo de su salario

anual sino ademaacutes del nuacutemero de diacuteas en alta laboral se puede avanzar en

el anaacutelisis descomponiendo la poblacioacuten total en dos colectivos claramente

diferenciados De forma natural el conjunto admite una desagregacioacuten en

funcioacuten de si se ha estado en alta laboral todo el antildeo o soacutelo una fraccioacuten del

mismo A cada trabajador estudiado se le asigna para cada ejercicio un

vector de 365 componentes una para cada diacutea del antildeo Cada componente

tendraacute el valor 1 si ha estado de alta ese diacutea y 0 si no lo ha estado de tal

manera que quedaraacute definido por un vector del tipo (111hellip1000hellip)

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 6: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

144

estadiacutesticas comparten la misma informacioacuten para determinar la masa

salarial total Es importante destacar que la MCVL combina en una uacutenica

operacioacuten estadiacutestica tanto informacioacuten fiscal como seriacutean los salarios en

este caso como informacioacuten propia de seguridad social el tiempo de

trabajo La explotacioacuten del moacutedulo fiscal de la MVCL (el que contiene la

informacioacuten sobre salarios retenciones etc y ha sido utilizado en este

trabajo) permite un anaacutelisis maacutes completo que si se usan las bases de

cotizacioacuten que al estar topadas aproximan mal los salarios maacutes altos

Graacutefico 2 Distribucioacuten de las retribuciones salariales anuales 2014

Comparacioacuten entre MCVL y MTyPFT

Fuente elaboracioacuten propia

Usando la MCVL-2014 se pueden construir las curvas de densidad

(reduciendo la amplitud de los intervalos considerados) para las

retribuciones salariales El Graacutefico 3 permite observar esto por tramos de

0

5

10

15

20

25

0 - 05 05 - 1 1 - 15 15 - 2 2 - 25 25 - 3 3 - 35 35 - 4 4 - 45 45 - 5 5 - 75 75 - 10 gt 10

MCVL MTyPFT

145

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

salario bruto anual para el ejercicio de 2014 La curva obtenida es una

envolvente al histograma inicial

Graacutefico 3 Curva de densidad para los salarios del ejercicio 2014

Fuente elaboracioacuten propia Miles de euros

2 Permanentes y Eventuales

Al disponer para cada uno de los trabajadores no soacutelo de su salario

anual sino ademaacutes del nuacutemero de diacuteas en alta laboral se puede avanzar en

el anaacutelisis descomponiendo la poblacioacuten total en dos colectivos claramente

diferenciados De forma natural el conjunto admite una desagregacioacuten en

funcioacuten de si se ha estado en alta laboral todo el antildeo o soacutelo una fraccioacuten del

mismo A cada trabajador estudiado se le asigna para cada ejercicio un

vector de 365 componentes una para cada diacutea del antildeo Cada componente

tendraacute el valor 1 si ha estado de alta ese diacutea y 0 si no lo ha estado de tal

manera que quedaraacute definido por un vector del tipo (111hellip1000hellip)

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 7: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

145

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

salario bruto anual para el ejercicio de 2014 La curva obtenida es una

envolvente al histograma inicial

Graacutefico 3 Curva de densidad para los salarios del ejercicio 2014

Fuente elaboracioacuten propia Miles de euros

2 Permanentes y Eventuales

Al disponer para cada uno de los trabajadores no soacutelo de su salario

anual sino ademaacutes del nuacutemero de diacuteas en alta laboral se puede avanzar en

el anaacutelisis descomponiendo la poblacioacuten total en dos colectivos claramente

diferenciados De forma natural el conjunto admite una desagregacioacuten en

funcioacuten de si se ha estado en alta laboral todo el antildeo o soacutelo una fraccioacuten del

mismo A cada trabajador estudiado se le asigna para cada ejercicio un

vector de 365 componentes una para cada diacutea del antildeo Cada componente

tendraacute el valor 1 si ha estado de alta ese diacutea y 0 si no lo ha estado de tal

manera que quedaraacute definido por un vector del tipo (111hellip1000hellip)

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 8: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

146

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uci

oacuten

(

)

Tramos de salarios (euro)

En base a esa estructura se puede clasificar al total de la muestra en dos

conjuntos disjuntos

1 Permanentes seraacute aquel subgrupo de trabajadores que estaacuten en

alta laboral los 365 diacuteas del antildeo con lo cual tendraacuten un vector del

tipo (11hellip1) No entran ni salen de mercado laboral en el antildeo a

estudio

2 Eventuales seraacuten todos lo que no cumplen el ser Permanentes

tendraacuten una o varias entradas yo salidas del Reacutegimen General de la

Seguridad Social Han estado en alta menos de 365 diacuteas en el antildeo

Tienen un vector asociado del tipo (1010hellip001hellip1)

Como se veraacute esta descomposicioacuten del colectivo total en funcioacuten

del tiempo de trabajo es especialmente fructiacutefera a hora de explicar el

problema de las colas pesadas en la distribucioacuten de salarios La curva de

densidad de los salarios para el colectivo de Eventuales es totalmente

diferente a la que se obtiene para el de Permanentes Ello se desprende de

la observacioacuten directa de los Graacuteficos 4 y 5

Graacutefico 4 Curvas de densidad para los salarios Permanentes 2014

Fuente elaboracioacuten propia

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 9: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

147

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

2

4

6

8

10

12

14

16

18

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Dis

trib

uc

ioacuten

(

)

Tramos de salarios (euro)

Graacutefico 5 Curvas de densidad para los salarios Eventuales 2014

Fuente elaboracioacuten propia

Graacutefico 6 Descomposicioacuten de la curva de densidad para el total de la

poblacioacuten 2014 en Permanentes y Eventuales

Fuente elaboracioacuten propia

0

1

2

3

4

5

6

7

8

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

Total2014 Perm2014 Event2014

P

T=P+E

E

Tramos de salarios (euro)

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 10: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

148

Discriminar el colectivo total entre Permanentes y Eventuales

permite explicar las colas pesadas de la distribucioacuten de salarios y la

existencia de una importante bolsa de trabajadores con salarios muy bajos

por debajo del SMI anual Como se deduce del anaacutelisis de estos colectivos

la mayoriacutea de los trabajadores con sueldos muy bajos son asalariados

eventuales que trabajan soacutelo una fraccioacuten del antildeo Por ello maacutes que hablar

de sueldos bajos se deberiacutea hablar de poco tiempo trabajado La

composicioacuten de ambas distribuciones Eventuales y Permanentes

promediadas sobre el total del colectivo que se presenta en el Graacutefico 7 asiacute

lo pone de manifiesto

Graacutefico 7 Relacioacuten entre Permanentes y Eventuales por nivel salarial

Fuente elaboracioacuten propia

La Tabla 2 resume la informacioacuten obtenida en materia de salarios y

tiempo de trabajo de la MCVL para el periacuteodo 2004-2014

000

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

Eventuales

Permanentes

Salarios (miles de euro)

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 11: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

149

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 2 Resumen informacioacuten obtenida de la MCVL (2004-2014)

Fuente elaboracioacuten propia Sobre el salario diacutea medio veacutease Valverde Carameacutes P (2011)

3 Modelizacioacuten parameacutetrica de una distribucioacuten empiacuterica

Se puede definir la modelizacioacuten parameacutetrica como una teacutecnica de

estadiacutestica matemaacutetica cuyo objetivo fundamental es resumir los datos

empiacutericos mediante una funcioacuten matemaacutetica dependiente de un nuacutemero

pequentildeo de paraacutemetros y sin que ello suponga una peacuterdida de informacioacuten

importante En el caso que nos ocupa la aplicaremos a la informacioacuten

obtenida sobre rentas salariales El punto de partida de la modelizacioacuten

parameacutetrica siempre seraacute un modelo de probabilidad definido por una

familia de funciones de distribucioacuten Dicho modelo se propone con el objeto

de representar el conjunto de datos disponibles y su eleccioacuten quedaraacute

determinada por las caracteriacutesticas especiacuteficas del fenoacutemeno a estudio

Para mayor informacioacuten veacutease Prieto Alaiz M y C Garciacutea Peacuterez (2006)

31 La distribucioacuten Beta Generalizada de segundo orden y derivadas

POBLACION 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

Nuacutemero de trabajadores 544370 597429 624925 653741 659005 624452 609664 600233 601888 562152 571842

Salario anual medio 1580552 1616758 1697600 1776323 1854095 1863563 1867023 1877071 1773121 1823760 1813799

Diacuteas de trabajo medios 29452 29264 29412 29463 29106 28551 28621 28576 28882 28203 28191

Salario diacutea medio 5367 5525 5772 6029 6370 6527 6523 6569 6139 6467 6434

PERMANENTES

Nuacutemero de trabajadores 314363 335239 350125 367899 374591 366748 361282 354794 362294 332217 331157

Salario anual medio 2167038 2240042 2336074 2433472 2555689 2578541 2582866 2603223 2436396 2569324 2583538

Diacuteas de trabajo medios 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500 36500

Salario diacutea medio 5937 6137 6400 6667 7002 7064 7076 7132 6675 7039 7078

Permanentes 577 561 560 563 568 587 593 591 602 591 579

EVENTUALES

Nuacutemero de trabajadores 230007 262190 274800 285842 284414 257704 248382 245439 239594 229935 240685

Salario anual medio 778970 819820 884181 930525 930052 846052 825799 827381 770171 746546 754721

Diacuteas de trabajo medios 19820 20014 20383 20406 19368 17239 17160 17122 17212 16216 16759

Salario diacutea medio 3930 4096 4338 4560 4802 4908 4812 4832 4475 4604 4503

Eventuales 4225 4389 4397 4372 4316 4127 4074 4089 3981 4090 4209

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 12: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

150

Se presenta en este apartado a la distribucioacuten Beta Generalizada de

Segunda Especie (GB2) La expresioacuten de la funcioacuten de densidad de la

distribucioacuten beta generalizada de segunda especie es la siguiente

1198661198612(119903 119886 119887 119901 119902) = 119886119903119886119901minus1

119887119886119901 119861(119901 119902)( 1 minus ( 119903119887

)119886)( 119901+119902) 119903 ge 0

donde se tiene que a b p q gt0 y 119861(119901 119902) es la funcioacuten Beta El paraacutemetro b

lo es de escala y los restantes tres a p y q de forma La GB2 es una

distribucioacuten que proporciona una adecuada descripcioacuten de la distribucioacuten de

la renta con un nuacutemero razonable de paraacutemetros (4)

Figura 1 La distribucioacuten GB2 y sus derivadas

Fuente Kleiber C y S Kotz (2003)

La gran ventaja de la distribucioacuten GB2 es la riqueza de modelos

relacionados con ella que incluye las distribuciones triparameacutetricas Dagum

(DAGUM) y Singh-Maddala (SM) junto a los modelos del mismo orden beta

de segunda especie y gamma generalizada y los modelos de dos

paraacutemetros Lognormal Gamma Weibull y Fisk Todas estas funciones con

casos particulares de la GB2 Para maacutes informacioacuten sobre la GB2 veacutease

Kleiber C y S Kotz (2003)

(4 p)

q-gtinfin p=1 q=1

a=1

(3p)

q-gtinfin q-gtinfin

a-gt0 a=1 p=1 q=1 p=1

(2p)

Gamma Beta 2 S-M Dagum

Lognormal Gamma Weibull Fisk

GB2

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 13: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

151

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

0

1

1

2

2

3

3

4

4

5

5

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(441 230826 050 060)

Salarios (euro)

4 Aplicacioacuten de la GB2 a los resultados de la MCVL-2014

En el caso particular que nos ocupa con la modelizacioacuten

parameacutetrica de las distribuciones empiacutericas para las retribuciones salariales

anuales obtenidas de la MCVL-2014 se busca estimar los paraacutemetros que

definen el ajuste oacuteptimo de una distribucioacuten GB2 El Meacutetodo de maacutexima

verosimilitud proporciona este tipo de estimadores Se ha aplicado el

Principio de Maacutexima Verosimilitud sobre los datos de rentas salariales

individuales de acuerdo a la informacioacuten obtenida de la MCVL-2014 El

procedimiento consiste en ajustar una distribucioacuten GB2 para el conjunto de

Permanentes y Eventuales de un ejercicio y reconstruir la distribucioacuten del

total como agregacioacuten por intervalos de ambas distribuciones

Graacutefico 8 Ajuste del colectivo de Permanentes

Fuente elaboracioacuten propia

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 14: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

152

000

200

400

600

800

1000

1200

1400

1000 5000 9000 13000 17000 21000 25000 29000 33000 37000 41000 45000 49000 53000 57000

distr2014 ajusteMV

BG2(250 14761 029 131)

Graacutefico 9 Ajuste del colectivo de Eventuales

Fuente elaboracioacuten propia

Graacutefico 10 Ajuste de la distribucioacuten del colectivo total (T=P+E)

Fuente elaboracioacuten propia

000

100

200

300

400

500

600

1000 6000 11000 16000 21000 26000 31000 36000 41000 46000 51000 56000

gb2 Total

T=P+E

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 15: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

153

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 3 Media y Mediana para los colectivos de Permanentes y Eventuales

Comparacioacuten entre empiacutericos y ajustados Error cometido

Empiacutericos MCVL Permanentes Eventuales

Media 2583538 754721

Mediana 2095430 507789

Ajuste GB2

Media 2590946 746945

Mediana 2135831 516936

Error

Media -029 103

Mediana -193 -180

Fuente elaboracioacuten propia

5 Propuesta para la estimacioacuten de las Retenciones del IRPF sobre los

Rendimientos del Trabajo Ajuste numeacuterico de la distribucioacuten salarial

51 Planteamiento de la cuestioacuten

Como ejemplo de la aplicacioacuten de lo que se ha presentado hasta

este momento se pretende en lo que sigue elaborar una metodologiacutea para la

estimacioacuten de la recaudacioacuten por retenciones sobre IRPF en ejercicios

futuros (esto es partiendo de la informacioacuten disponible en un ejercicio n

calcularla en n+i i=1 oacute 2) que sea consistente con las previsiones que

informa el Cuadro Macroeconoacutemico (informacioacuten que se supone conocida

en el ejercicio n y referida a n+1 o n+2) Las previsiones sobre la

recaudacioacuten por retenciones deben ser consecuentes con lo anterior para

que tengan utilidad no se puede calcular de manera independiente al resto

de las variables macroeconoacutemicas Se parte de que la estimacioacuten buscada

ha de ser consistente con dos paraacutemetros Salario medio y Nuacutemero de

trabajadores que son fijos y externos a cualquier modelo que se plantee

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 16: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

154

Son por ello condiciones a las que se debe sujetar toda propuesta

en este sentido Como se vio anteriormente la MCVL es una herramienta

de la que se puede extraer un conocimiento de gran importancia a la hora

de abordar este problema De hecho del anaacutelisis de la MCVL se pueden

destacar una serie de evidencias empiacutericas que se incorporaraacuten como

hipoacutetesis de trabajo a partir de este momento Asiacute se tiene que

1 La poblacioacuten de salarios por cuenta ajena puede dividirse en dos

colectivos disjuntos Permanentes y Eventuales Estos conjuntos se

muestran especialmente importantes a la hora de explicar la forma

de la distribucioacuten total de los salarios

2 Ambos colectivos se ajustan de manera oacuteptima a una distribucioacuten

Beta Generalizada de Segundo Orden (GB2) Esta distribucioacuten

depende de cuatro paraacutemetros (119886 119887 119901 119902) donde a p y q son

paraacutemetros de forma y b lo es de escala El paraacutemetro a gobierna la

forma general de la distribucioacuten p la cola de la izquierda y q la de la

derecha

3 Se conocen los ajustes de la MCVL a las correspondientes GB2

(Permanentes y Eventuales) para un periacuteodo dado En este caso

usaremos el 2004-2013

4 Sustituir los salarios reales por los obtenidos de una distribucioacuten

1198661198612(119886 119887 119901 119902) oacuteptima en teacuterminos de ajuste maacuteximo verosiacutemil

supone incurrir en errores con respecto al salario medio real por

debajo del 2 para ambos colectivos (antildeo 2013)

Partiendo de lo anterior y dado que se conoce el ajuste de los dos

colectivos (Permanentes y Eventuales) para el periacuteodo 2004-2013 (y

subsecuentes con el paso de los ejercicios) se podriacutea pensar en proyectar el

vector de paraacutemetros (119886 119887 119901 119902) al ejercicio a estudio a partir de eacutel

reconstruir una poblacioacuten de salarios teoacuterica (que se supone replica a la

poblacioacuten real futura y cuyo tamantildeo debe ser N) y a eacutesta se aplicariacutea el

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 17: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

155

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

algoritmo de retenciones correspondiente al ejercicio a estimar De ahiacute se

extraeriacutea el montante de la recaudacioacuten esperada Esta primera

aproximacioacuten al problema plantea una serie de inconvenientes a tener en

cuenta

1 La evolucioacuten de los paraacutemetros de ajuste de las distribuciones

1198661198612(119886 119887 119901 119902) de los colectivos Permanentes y Eventuales se

muestra erraacutetica en el tiempo y resulta complejo estimar los posibles

valores que va a tener en un ejercicio posterior (n+1 o n+2) La

uacuteltima Muestra disponible (MCVLn) seraacute como miacutenimo la del

ejercicio anterior al que se quiera estimar

Tabla 4 Evolucioacuten de los paraacutemetros (119886 119887 119901 119902) en el periacuteodo 2004-

2013

Fuente elaboracioacuten propia

2 La distribucioacuten GB2 es muy sensible a las variaciones de los

paraacutemetros que la definen Por tanto posibles errores aunque sean

pequentildeos en la estimacioacuten del vector de paraacutemetros ( ) con

respecto al que seriacutea oacuteptimo (119886 119887 119901 119902)119900119901119905 se transmitiraacuten a la

distribucioacuten de salarios teoacuterica y de ahiacute a la de retenciones

estimadas

3 Aun cuando se consiguiera una correcta estimacioacuten de dichos

paraacutemetros para el ejercicio a estudio (n+1 o n+2) cosa que soacutelo se

podriacutea comprobar en el ejercicio siguiente (n+2 o n+3) nada

PARAacuteMETROS 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013

Permantes

a 485 518 507 518 519 466 452 471 491 437

b 1705616 1728060 1809128 1886197 2020448 2108897 2149320 2208206 2169397 2272720

p 056 053 054 052 050 053 054 050 048 052

q 051 046 048 047 047 054 057 055 052 061

Eventuales

a 770 780 828 767 607 293 292 306 253 124

b 1229165 1268411 1345826 1401595 1410022 1434374 1447732 1395952 1506362 1526200

p 010 010 010 011 013 028 027 025 030 033

q 040 040 037 039 049 105 108 098 130 157

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 18: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

156

garantiza que esa distribucioacuten sea consecuente con el salario medio

propuesto en el Cuadro Macroeconoacutemico y que por definicioacuten es

un paraacutemetro dado al que se deben sujetar las estimaciones

4 El caacutelculo de las retenciones es una funcioacuten del salario (y de otras

variables de menor relevancia que generalmente no se tendraacuten en

cuenta) estructurada en forma de aacuterbol de decisioacuten lo que da lugar a

una funcioacuten no lineal fuertemente dependiente de la forma de la

distribucioacuten de los salarios Veacutease el Apeacutendice 2

5 El ajuste directo de la distribucioacuten GB2 sobre el colectivo de

Permanentes de la MCVL usando estimacioacuten por Maacutexima

Verosimilitud da un ajuste que si bien es oacuteptimo en teacuterminos

estadiacutesticos no recoge bien la amplitud del intervalo modal Eacuteste

siempre aparece suavizado con respecto a los datos reales Parece

deseable conseguir un ajuste que se aproximase mejor en este

tramo de la distribucioacuten aunque se perdiese el oacuteptimo estadiacutestico

Ahiacute se concentran la mayoriacutea de los salarios que contribuyen a la

recaudacioacuten por retenciones

Graacutefico 11 Ajuste por Maacutexima Verosimilitud de una distribucioacuten

1198661198612(119886 119887 119901 119902) a Permanentes 2013

Fuente elaboracioacuten propia

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 19: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

157

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

En cualquier caso el tener que atenerse obligatoriamente a las

indicaciones del Cuadro Macroeconoacutemico sobre el salario medio del

ejercicio a estimar es razoacuten suficiente para tener que plantearse otra

estrategia de ajuste diferente

52 Planteamiento de un problema de minimizacioacuten aproximacioacuten por

meacutetodos numeacutericos

Una primera alternativa para abordar el objetivo propuesto (estimar

la recaudacioacuten por retenciones ajustaacutendose a un paraacutemetro externo) seriacutea

plantearse su solucioacuten a traveacutes de un problema de minimizacioacuten (o similar)

Se tratariacutea grosso modo de encontrar para cada uno de los dos colectivos

en que se descompone la poblacioacuten total aquella combinacioacuten de

paraacutemetros 119886 119887 119901 119902 que den lugar a traveacutes de la distribucioacuten GB2 a una

poblacioacuten de salarios teoacuterica cuya media sea consistente con la propuesta

en el Cuadro Macroeconoacutemico Es decir se buscariacutea solucionar el siguiente

planteamiento general

Sea S el salario medio dado por el cuadro macroeconoacutemico y N el

nuacutemero de asalariados Si definimos = 119864(1198661198612(119886 119887 119901 119902)) esto es es la

esperanza matemaacutetica de una poblacioacuten (de salarios en este caso)

generada por la distribucioacuten GB2 de tamantildeo N Se supone que (119886 119887 119901 119902) isin

119862 donde 119862 es aquiacute el campo de definicioacuten adecuado para el vector de

paraacutemetros Recueacuterdese que 119886 119887 119901 119902 son todos nuacutemeros reales

estrictamente positivos Por tanto tiene sentido plantearse el siguiente

problema

Min(S minus S)abpq

(a b p q) isin C

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 20: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

158

Se tratariacutea por tanto de buscar en 119862 aquel vector de paraacutemetros

(119886 119887 119901 119902) que asegure que la esperanza matemaacutetica de la distribucioacuten GB2

es precisamente el valor buscado S Obseacutervese que es una variable

aleatoria y que por tanto una extraccioacuten particular de 1198661198612((119886 119887 119901 119902) 119873) no

tiene por queacute tener una media que coincida exactamente con el valor S

pero siacute se tiene la seguridad que es el mejor proceso aleatorio consistente

con ese valor En caso de que el problema anterior tuviese solucioacuten que no

tendriacutea por queacute ser uacutenica (no hay garantiacuteas de la existencia de un oacuteptimo

global en 119862) la forma de la funcioacuten de densidad empiacuterica puede no ser la

adecuada (Veacutease inconveniente 4)

Seriacutea interesante por todo ello que no soacutelo se buscase una funcioacuten

GB2 que minimizase la diferencia con respecto a S sino que a la vez su

forma se aproximase lo maacutes posible a los datos empiacutericos conocidos (dados

por la MCVL de ejercicios pasados) Se puede pensar entonces en ampliar

las condiciones del problema anterior para buscar no uacutenicamente un vector

(119886 119887 119901 119902) que minimice la distancia con respecto a S sino que ademaacutes

genere una funcioacuten de densidad que acote lo maacuteximo posible el

inconveniente 4 Para abordar esto uacuteltimo se necesitariacutea disponer de

indicadores de la forma de la distribucioacuten que puedan ser calculados en

funcioacuten de los paraacutemetros de la GB2 En realidad de (apq) que son los

que gobiernan la estructura de la funcioacuten

Por simplicidad en lo que sigue se haraacute mencioacuten uacutenicamente al

colectivo de Permanentes siendo todo extensible al de Eventuales sin maacutes

que aplicarlo sobre la GB2 correspondiente tal y como hemos comprobado

La razoacuten para esto maacutes allaacute de no extendernos aquiacute repitiendo el mismo

anaacutelisis y siacute respetar las normas de publicacioacuten es tambieacuten de orden

praacutectico ya que maacutes del 90 del total de las retenciones provienen del

colectivo de Permanentes

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 21: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

159

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Tabla 5 Magnitudes relevantes Permanentes 2007-2013

Fuente elaboracioacuten propia

La tabla anterior muestra los valores reales de algunos indicadores

relacionados con la forma de la distribucioacuten de densidad de los datos reales

Como se puede ver

1 La mediana y su relacioacuten con la media evolucionan de una manera

muy estable en el tiempo El ratio 119872119898 se mantiene en el entorno

del 80 Bajo el supuesto (razonable) de mantenimiento de dicho

valor en el ejercicio a estudio conocer la media (dato) implica tener

un valor (o un intervalo) de referencia para la mediana

2 La relacioacuten entre el percentil 80 y el 20 (11987580

11987520) dada por el indicador

qsr vinculado de manera directa a las colas de la distribucioacuten

tambieacuten mantiene un comportamiento estable y permitiriacutea estimar

un rango de variacioacuten para el ejercicio a estudio

3 Todo lo dicho antes es extensible a la evolucioacuten del Iacutendice de Gini

A la vista de los anterior se puede concluir que se dispone de tres

indicadores de la forma de la distribucioacuten salarial mdashMediana qsr Ginimdash con

un comportamiento conocido y estable La relacioacuten entre estas tres

magnitudes y los paraacutemetros (119886 119901 119902) es conocida analiacuteticamente (aunque

Medidas 2007 2008 2009 2010 2011 2012 2013

Mediana (M) 1928353 2034678 2062539 2075674 2099105 2057833 2076855

Media (m) 2433472 2555689 2578541 2582866 2603224 2551263 2569324

qsr (8020) 5376 5439 5578 5619 5677 5683 5903

Gini 0339 0339 0341 0341 0341 0340 0344

Relaciones

Ratio Mm 7924 7961 7999 8036 8063 8066 8083

Tasa variacioacuten anual (M) 551 137 064 113 -197 092

Tasa variacioacuten anual (qsr) 502 089 017 079 -200 071

Tasa variacioacuten anual (Gini ) 117 256 074 103 011 387

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 22: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

160

no por ello sea sencilla) de manera que se pueden estimar para una

1198661198612 (119886 119887 119901 119902) los indicadores teoacutericos El problema a resolver seriacutea

encontrar uno o varios (pocos) vectores (119886 119887 119901 119902) isin 119862 cuya distribucioacuten GB2

teoacuterica tuviese una esperanza igual a la media (S) y que a su vez la

Mediana qsr y Gini teoacutericos fuesen los dados por hipoacutetesis Se busca por

tanto un (119886 119887 119901 119902)119900119901119905 isin 119862 tal que verifique simultaacuteneamente las siguientes

condiciones

a) 119878 = 119864(1198661198612(119886 119887 119901 119902)119900119901119905)

b) 119872119890 = 119872119890119889(1198661198612(119886 119887 119901 119902)119900119901119905)

c) 119902119904 = 119902119904119903(1198661198612(119886 119887 119901 119902)119900119901119905)

d) 119866119894119899 = 119866119894119899119894(1198661198612(119886 119887 119901 119902)119900119901119905)

donde 119872119890 119902119904 119866119894119899 seriacutean valores dados por hipoacutetesis

La resolucioacuten analiacutetica de semejante problema se adivina de una

complejidad importante en el supuesto de que fuese abordable por

procedimientos analiacuteticos Como alternativa se propone una resolucioacuten por

meacutetodos numeacutericos y en base a un algoritmo secuencial El algoritmo

propuesto es el siguiente

1 Se resuelve un problema similar al de minimizacioacuten presentado

anteriormente (pero ahora de manera menos restrictiva) Se busca

la coleccioacuten de puntos Q sub 119862 que verifican

Q = (a b p q)Abs(S minus S) le K tal que K gt 0 a b p q isin C

119876 es el subconjunto de 119862 que garantiza distribuciones BG2 cuya

esperanza matemaacutetica dista de S (dato) un valor menor que K

(arbitrario)

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 23: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

161

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

2 Sobre 119876 sub 119862 se van a buscar aquellos puntos que proporcionen

valores deseados para Mediana qsr y Gini El procedimiento seraacute

secuencial y en el orden anterior

a Se extrae sobre 119876 el siguiente colectivo

1198761 = (119886 119887 119901 119902) sub 119876119860119887119904(119872119890119889(119886 119887 119901 119902) minus 119872119890) le 119872

119905119886119897 119902119906119890 119872 gt 0

Donde 119872119890119889(119886 119887 119901 119902) es el valor teoacuterico de la Mediana

y 119872119890 el valor hipoteacutetico

b Anaacutelogamente se extrae sobre 1198761 el siguiente colectivo

1198762 = (119886 119887 119901 119902) sub 1198761119860119887119904(119902119904119903(119886 119887 119901 119902) minus 119902119904) le 119877

119905119886119897 119902119906119890 119877 gt 0

c Finalmente sobre 1198762 se extrae 1198763

1198763 = (119886 119887 119901 119902) sub 1198762119860119887119904(119866119894119899119894(119886 119887 119901 119902) minus 119866119894119899) le 119866

119905119886119897 119902119906119890 119866 gt 0

53 Aplicacioacuten del algoritmo y comparacioacuten con datos reales

Colectivo de Permanentes 2013

El esquema anterior se ha programado en lenguaje R utilizando

como apoyo fundamentalmente el paquete GB2 en su versioacuten 21 La

estrategia de programacioacuten consiste en partir de una malla de puntos

(119886 119887 119901 119902) definida ad hoc y en cada punto computar 1198661198612(119886 119887 119901 119902) A partir

de ahiacute se van realizando de forma secuencial los pasos del algoritmo El

paquete GB2 permite el caacutelculo de todos los paraacutemetros teoacutericos necesarios

en cada paso

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 24: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

162

Figura 2 Representacioacuten idealizada del espacio 119862 para un valor b=cte

Fuente elaboracioacuten propia

En base a la informacioacuten proporcionada por la muestra se pueden

estimar los intervalos de variacioacuten de las variables (119886 119887 119901 119902) esto es

[119886119898119894119899 119886119898119886119909] [119887119898119894119899 119887119898119886119909] [119901119898119894119899 119901119898119886119909] [119902119898119894119899 119902119898119886119909] y que define el espacio 119914

de buacutesqueda Una vez definidos los liacutemites se debe establecer el granulado

de la malla esto es la distancia δ que para cada una de ellas existe entre

dos valores consecutivos Por simplicidad tomaremos para a p q un mismo

δ δ=001 y para b un paso ε=10 Asiacute se estudiaran todas las

combinaciones de valores de (119886 119887 119901 119902) entre sus liacutemites y con los pasos δ

y ε anteriores Por ejemplo una malla construida con los siguientes

intervalos y pasos

a[4 6 by = 001]

b [20000 24000 by=10]

p [03 05 by =001]

q[03 05 by =001]

119918119913120784(119938119946 119939 119953119946 119954119946)

a p

q

δ

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 25: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

163

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

da lugar a un retiacuteculo (el espacio 119862) con 3713661 puntos a estudio todos

ellos posibles candidatos a resolver el problema

Obseacutervese que si se reduce el paso la malla seriacutea mucho maacutes

tupida con lo que el nuacutemero de candidatos a estudio se multiplicariacutea y la

complejidad computacional tambieacuten Si se toma un paso demasiado grande

el problema se resuelve maacutes raacutepido al reducirse el nuacutemero de puntos a

evaluar y por ello se corre el riesgo de no encontrar solucioacuten En cualquier

caso el oacuteptimo del problema planteado va a depender del grado de precisioacuten

que se desee (o se pueda) emplear Los valores extremos de los intervalos

se toman a partir de la informacioacuten de la Tabla 5 Sobre este conjunto de

puntos se va a simular una posible solucioacuten situados en 2012 para el

ejercicio de 2013 Los uacutenicos datos que se suponen conocidos seriacutean la

media S=2569324 y el nuacutemero N=332217 Resolviendo el problema para

el ejercicio de 2013 con las siguientes hipoacutetesis

a) S=2569324 (dato conocido de la MCVL)

b) K=26 euros

c) Mediana [ 2050020800]

d) qsr [ 560 60]

e) Gini [ 0340 0350]

se obtienen a pesar del valor tan restrictivo de K once posibles

candidatos a solucioacuten tal y como aparece en la Tabla 6 cuyos resultados

finales tras ser aplicados hemos comprobado que no presentan sensibles

diferencias entre ellos Si por ejemplo se toma un valor K=26 euros el

nuacutemero de candidatos seriacutea en lugar de once ochenta y ocho en principio

tambieacuten todos ellos igual de vaacutelidos Este resultado ilustra el principal

problema de este meacutetodo la posible sobreabundancia de soluciones todas

factibles y la dificultad para elegir la ldquomejorrdquo

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 26: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

164

Tabla 6 Candidatos oacuteptimos a la solucioacuten del problema

a b p q media mediana qsr Gini

520 20180 050 047 2569301 2063190 578 0349

590 20180 044 041 2569411 2066812 567 0346

590 20510 042 041 2569236 2068012 583 0350

600 20280 042 040 2569175 2061865 580 0350

530 20030 050 046 2569475 2062858 570 0347

540 20160 048 045 2569479 2062360 577 0349

580 20730 042 042 2569145 2073000 587 0350

590 20340 043 041 2569132 2067262 575 0348

580 20560 043 042 2569545 2072715 579 0348

540 20010 049 045 2569099 2061613 570 0347

560 20100 046 043 2569067 2057696 579 0350

Fuente elaboracioacuten propia

Graacutefico 12 Comparacioacuten graacutefica de los datos reales con dos modelos de ajuste numeacuterico

Fuente elaboracioacuten propia

A fin de comparar las ganancias del meacutetodo aquiacute presentado con

respecto a la minimizacioacuten pura de la diferencia con la media presentado

como punto de partida de este apartado se presenta el Graacutefico 12 Se

recogen en eacutel la distribucioacuten real del colectivo de Permanentes (2013) y las

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 27: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

165

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

frecuencias empiacutericas obtenidas de los dos meacutetodos Como se puede ver el

ajuste uacutenicamente condicionado a la media (Ajuste_oacuteptimomedia) no

recoge la forma de la distribucioacuten real la curva empiacuterica es mucho menos

apuntada y el error en el intervalo modal es grande Si se aplica el segundo

meacutetodo a modo de ejemplo y sin peacuterdida de generalidad sobre el primer

candidato obtenido (el sombreado en amarillo en la Tabla 6) el resultado es

muy distinto Al haber forzado un ajuste condicionado a la media y a la vez a

otras medidas dependientes directamente de los paraacutemetros de forma

(Mediana qsr Gini) el resultado graacutefico es mucho mejor Si sobre esos

modelos teoacutericos se extraen dos realizaciones aleatorias con N=332217

elementos se pueden calcular y comparar con los valores reales tanto la

masa salarial total del colectivo como el total de retenciones Teacutengase en

cuenta que estos dos resultados (para Ajuste_oacuteptimomedia y

Ajuste_oacuteptimogeneral) son variables aleatorias al ser una realizacioacuten

concreta de sus respectivas 1198661198612(119886 119887 119901 119902) teoacutericas El resultado se muestra

en la tabla siguiente

Tabla 7 Retribuciones y Retenciones totales para Permanentes2013 y los

dos meacutetodos numeacutericos

Fuente elaboracioacuten propia

Como se puede constatar ambos modelos ajustan casi a la

perfeccioacuten la masa salarial total lo que era de esperar dado que ambos

ajustes buscan minimizar la distancia 119860119887119904(119878 minus 119878) De hecho el

Ajuste_oacuteptimogeneral es casi perfecto y mejor que el proporcionado por el

Ajuste_oacuteptimomedia Sin embargo al aplicarle a ambas el esquema de

Retenciones las diferencias son muy notables el que Ajuste_oacuteptimogeneral

Permanentes 2013 Ajuste oacuteptimo_media Ajuste oacuteptimo_general

Retribuciones 853573180710 859762986800 853026999900

Retenciones 153429854420 174796957000 159362412900

Variacioacuten Ajuste sobre

Permantes 2013 Retribuciones 07252 -00640

Variacioacuten Ajuste sobre

Permantes 2013 Retenciones 139263 38666

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 28: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

166

recoja mucho mejor la forma general de la distribucioacuten empiacuterica

(Permanentes-2013) sobre todo en los tramos centrales de la distribucioacuten

donde se acumulan la moda hace que la estimacioacuten de la recaudacioacuten por

Retenciones sea mucho maacutes ajustada

6 Conclusiones

El presente documento aborda la falta de informacioacuten sobre el

tiempo de trabajo existente en las fuentes estadiacutesticas fiscales en materia

de retribuciones salariales El problema que se plantea es que sin esta

informacioacuten no es posible abordar un correcto anaacutelisis de la distribucioacuten

personal de las rentas salariales Se plantea entonces la utilizacioacuten de la

Muestra Continua de Vidas Laborales (MCVL) como marco adecuado donde

abordar la solucioacuten al problema anterior puesto que en ella se integran

conjuntamente tanto informacioacuten fiscal como laboral relativa a los individuos

que la forman El conocimiento detallado del tiempo de trabajo permite

explicar de manera satisfactoria la forma que adopta la distribucioacuten de las

rentas salariales anuales Abundando en la misma liacutenea el tiempo de

trabajo permite una estratificacioacuten muy fructiacutefera de la poblacioacuten de

asalariados Conseguir una adecuada modelizacioacuten de las retribuciones

salariales es la siguiente cuestioacuten que se aborda en este documento Se

plantea aquiacute un ajuste de estas retribuciones en teacuterminos de la distribucioacuten

Beta Generalizada de Segunda Especie (GB2) distribucioacuten de cuatro

paraacutemetros que se muestra especialmente uacutetil este fin

Conocida la distribucioacuten de probabilidad se ajustan los salarios

anuales y se dispone de una herramienta uacutetil que permite abordar el anaacutelisis

de las Retenciones a cuenta del IRPF su simulacioacuten y su prediccioacuten Poder

estimar correctamente la recaudacioacuten por Retenciones de IRPF es de suma

importancia para presupuestar correctamente las partidas de gasto del

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 29: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

167

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

presupuesto dada la importancia cuantitativa que el Impuesto sobre la

Renta tiene para conjunto del sistema impositivo Por otra parte este trabajo

es un ejemplo de la riqueza de anaacutelisis existente en la combinacioacuten de

fuentes estadiacutesticas distintas (MCVL en su combinacioacuten de datos de

seguridad social y de datos fiscales) pero complementarias entre siacute

Fecha de recepcioacuten del artiacuteculo 24 de abril de 2016

Fecha de aceptacioacuten definitiva 21 de junio de 2016

7 Bibliografiacutea

[1] Garciacutea C FJ Callialta y JJ Nuacutentildeez (2006) ldquoLa Evolucioacuten de la

Distribucioacuten Personal de la Renta en Espantildea (1973-2000) a traveacutes de los

Paraacutemetros del Modelo de Dagumrdquo El Trimestre Econoacutemico 292 Paacutegs

783-808

[2] Graf M y D Nedyalkova (2014) ldquoModeling of Income and Indicators of

Poverty and Social Exclusion Using the Generalized Beta Distribution of the

Second Kindrdquo Review of Income and Wealth Vol 60 Issue 4 Paacutegs 821-

842

[3] Graf M y D Nedyalkova (2011) ldquoParametric Estimation of Income

Distributions and Indicators of Poverty and Social Exclusionrdquo

httpswwwunitrierdefileadminfb4projekteSurveyStatisticsNetAmeli_Deli

vrablesAMELI-WP2-D21-20110409pdf

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 30: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

168

[4] Graf M y D Nedyalkova (2015) ldquoGB2 Generalized Beta Distribution of

the Second Kind Properties Likelihood Estimationrdquo

httpscranr-projectorgwebpackagesGB2indexhtml

[5] Kleiber C y S Kotz (2003) Statistical size distributions in economics

and actuarial sciences Wiley series in Probability and Statistics

[6] McDonald JB y A Mantrala (1995) ldquoThe distribution of income

Revisitedrdquo Journal of Applied Econometrics 10 Paacutegs 201-204

[7] Melis Maynar F (1995) La distribucioacuten personal del salario anual en

1992 Papeles de trabajo del Instituto de Estudios Fiscales nordm 1695

[8] Prieto Alaiz M y C Garciacutea Peacuterez (2006) Modelizacioacuten parameacutetrica de la

distribucioacuten personal de la renta en Espantildea Una aproximacioacuten a partir de la

distribucioacuten beta generalizada de segunda especie IEF PT N 2107

[9] Valverde Carameacutes P (2011) ldquoLa distribucioacuten personal de los salarios y

su relacioacuten con el tiempo de trabajordquo Economiacutea Espantildeola y proteccioacuten

Social nordm 3 Paacutegs 5-35

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 31: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

169

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

Apeacutendice 1 Estimacioacuten del error cometido en el caacutelculo de

Retenciones usando la MCVL Fuentes de error

Un hecho a tener en cuenta son los errores que en la estimacioacuten del

caacutelculo de retenciones genera la aplicacioacuten de la Funcioacuten de retencioacuten (Fr)

sobre los resultados teoacutericos obtenidos en base al anaacutelisis anterior Hay que

tener en cuenta que el aacuterbol de decisioacuten utilizado para su caacutelculo es muy

complejo y depende del salario total del trabajador de coacutemo se estructura

eacuteste (si lo cobra de un uacutenico pagador o de varios) de la situacioacuten personal

(casado o no hijos ascendiente a cargo etc) y maacutes Por otra parte no

todas estas variables son faacuteciles de manejar usando la MCVL y por ello no

han sido tenidas todas en cuenta y en lo referente a la estructura del salario

total anual del trabajador a efectos de todo lo anterior se ha supuesto un

uacutenico retenedor Es decir se aplica Fr al total del salario anual percibido

Todo lo anterior hace necesario estimar queacute error se comete por el uso de

una Fr simplificada respecto a la realmente aplicada El esquema de la Fr

usado es el siguiente (para el ejercicio 2013)

MINORACIONES

1 Minoracioacuten por Seguridad Social

2 Minoracioacuten por reduccioacuten (Artiacuteculo 182)

MINIMO PERSONAL

Miacutenimo personal=6000

ESCALA DE RETENCION

Escala del ejercicio 2013

CUOTAS

Dado que la MCVL ofrece los datos salariales y las retenciones realmente

aplicadas a cada trabajador se puede proceder como sigue

Se definen las siguientes magnitudes

R=Retenciones reales del colectivo a estudio

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 32: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

170

Γ=Retenciones calculadas

S=Salarios totales reales (anuales)

Š=Salarios anuales simulados (obtenidos de Ajuste_oacuteptimogeneral)

donde

119877 = 119884(119878) donde Y es el algoritmo completo para el caacutelculo de retenciones

120548 = Ў (Š) donde Ў es la versioacuten reducida del algoritmo 119884 (119884 sub Ў) la Fr

simplificada Las retenciones calculadas se obtienen al aplicar un algoritmo

de retenciones reducido a los salarios prevenientes de un ajuste dado por

una GB2

Sea Abs(RmdashΓ)equiverror cometido en la estimacioacuten de las retenciones reales

esto es

휀 = R- Γ= Y(S)- Ў (Š)

Sea Ў (119878) el error que se comete cuando se usa el algoritmo de retenciones

reducido sobre el vector los salarios reales (conocido) Sumando y restando

en la expresioacuten anterior

휀 = Y(S) minus Ў (Š) + Ў (S) minus Ў (S)

Reordenando los factores

휀 = (Y(S) minus Ў (S)) + (Ў (S) minus Ў (Š)) = 휀d + δ le 휀d + δ

El error total cometido se puede por tanto separar en dos componentes

a) Error determinista (휀119889) Debido al uso del algoritmo reducido sobre los

salarios reales

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 33: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

171

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

b) Error aleatorio (ε) Debido al uso de salarios teoacutericos sobre el algoritmo

reducido

120634 le 120634119837 + 120517

Tabla 8 Estimacioacuten del peso de los errores cometidos en el caacutelculo de la

Retencioacuten

Retribuciones Retenciones

Permanentes

2013

853573180710 153429854420

Ajuste

Oacuteptimo General

8530269999 1593624129

Ε 5932558480

120634119941 4185970980

7056

Δ 17465875

2944

Por tanto se puede concluir que la mayor parte del error cometido en la

estimacioacuten del montante total de las retenciones del colectivo

Permanentes2013 se debe a que no se aplica el algoritmo de retenciones

exacto sino una aproximacioacuten De hecho el 70 del error cometido es

imputable a esa causa y menos de un 30 al hecho de reemplazar los

salarios reales por los obtenidos de Ajuste_oacuteptimogeneral

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 34: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

172

Apeacutendice 2 Orden y recaudacioacuten

En los apartados anteriores se hizo especial eacutenfasis en que la

ldquoformardquo de la distribucioacuten de los salarios (o de las rentas en general)

cuando se le aplica un impuesto progresivo era algo determinante De

hecho esa buacutesqueda de la ldquoformardquo adecuada era la clave de todo el

anaacutelisis Veamos por queacute esto es asiacute Sea Y=1199101 11991021199103 hellip 119910119873 una coleccioacuten

de N rentas 119910119894 gt 0 119894=12hellip119873 verificaacutendose que 119878 = sum (119910119894)119873119894=1 es la renta total

de ese colectivo Por simplicidad se supone que 119910119894 es un nuacutemero real

positivo Sea t por hipoacutetesis una funcioacuten de la renta real continua

derivable y creciente

119905R+ [01] 119905 es la funcioacuten de tipos marginales sobre la renta

Y

Para cada nivel de renta de Y 119910119894 se verifica que la recaudacioacuten

obtenida al aplicar 119905 viene dada por

119879(119910119894) = int 119905(119909)119889119909

119910119894

0

La recaudacioacuten total obtenida de la aplicacioacuten de t al conjunto Y T

viene dada por

119879(1199101 hellip 119910119873) = sum 119879(119910119894)

119873

119894=1

= sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

Llegados a este punto se puede plantear si existe alguacuten conjunto de

N rentas que sumando S es decir conservando la renta total proporcione

un valor oacuteptimo (maacuteximo yo miacutenimo) para 119879 Se plantea asiacute un problema de

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 35: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

173

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

optimizacioacuten sujeto a una restriccioacuten lineal Este problema admite solucioacuten

en los teacuterminos de un problema de optimizacioacuten de Lagrange

Max 119879 = sum int 119905(119909)119889119909119910119894

0119873119894=1

Sujeto a

119878 = sum(119910119894)

119873

119894=1

Formando el lagrangiano 119871 se tiene

119871(1199101 hellip 119910119873 120582) = [sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus 120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Expresioacuten de la funcioacuten lagrangiana

120575119871

120575119910119894= 0 119894=12hellip119873 Ecuaciones de Lagrange

120575119871

120575119910119894

=120575

120575119910119894

[sum int 119905(119909)119889119909

119910119894

0

119873

119894=1

] minus120575

120575119910119894

120582 ((sum(119910119894)

119873

119894=1

) minus 119878)

Aplicando el Teorema Fundamental del Caacutelculo se tiene

120575119871

120575119910119894

= sum120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

119873

119894=1

minus 120582 =120575

120575119910119894

int 119905(119909)119889119909

119910119894

0

minus 120582 = 119905(119910119894) minus 120582 = 0

120582 = 119905(119910119894) 119894 = 12 hellip 119873

De lo anterior se deduce que

Problema de optimizacioacuten de

Lagrange

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 36: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

174

120640 = 119905(1199101) = 119905(1199102) = ⋯ = 119905(119910119873)

Para la funcioacuten 119905 en los teacuterminos de las hipoacutetesis del problema la

relacioacuten anterior se verifica si se estaacute evaluando a 119905 en el mismo punto esto

es

1199101

= 1199102 = ⋯ = 119910119873 = 119910

Aplicado lo anterior sobre la restriccioacuten lineal

119878 = sum (119910119894)119873119894=1 =119873119910 rarr 119962 =

119930

119925= 119962

Asiacute pues existe un candidato a oacuteptimo en el punto 119910 hellip 119910

Aplicando lo anterior

119879119900119901 = sum 119905(119910119894)

119873

119894=1

= sum 119905 (119930

119925)

119873

119894=1

= 119873119905 (119930

119925) = 119873119905(119962)

119879119900119901 = 119873119905(119910)

Pasando a los criterios de segunda derivada para el lagrangiano 119871

se tiene

120597

120597119910119895(

120575119871

120575119910119894) =

120597

120597119910119895(119905(119910119894) minus 120582) = 0 para todo jnei

120597

120597119910119894

(120575119871

120575119910119894

) =120597

120597119910119894

(119905(119910119894) minus 120582)) =119889

119889119910119894

119905(119910119894) = 119905prime(119910119894)

De aquiacute se concluye que la matriz Hessiana tendraacute la siguiente

forma

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo

Page 37: DISTRIBUCIONES SALARIALES: AJUSTE Y PROYECCIÓN. … · salarial total. Es importante destacar que la MCVL combina en una única operación estadística tanto información fiscal,

175

Economiacutea Espantildeola y Proteccioacuten Social VIII Antildeo 2016 Paacutegs 139-175

P Valverde Carameacutes Distribuciones salariales ajuste y proyeccioacuten Una aplicacioacuten a la estimacioacuten de retencioneshellip

H=[119905prime(1199101) ⋯ 0

⋮ ⋱ ⋮0 ⋯ 119905prime(119910119873)

]

El caraacutecter de la matriz H aplicada en el punto oacuteptimo dependeraacute

del valor de 119905prime(119910) Como por hipoacutetesis 119905 es una funcioacuten creciente se tiene

que 119905prime(119910) gt0 y con lo que todos los menores principales seraacuten positivos Ello

implica que H es definida positiva y que 119884 = 119962 hellip 119962 seriacutea un miacutenimo para la

recaudacioacuten total La recaudacioacuten miacutenima se da cuando la distribucioacuten de

rentas es absolutamente equitativa Obseacutervese que no existe una uacutenica

combinacioacuten Y=1199101 11991021199103 hellip 119910119873 que proporcione un maacuteximo de recaudacioacuten

ya que cualquiera de ellas en las que N-1 unidades tengan la miacutenima renta

posible (por hipoacutetesis no hay rentas nulas 119910119894 gt 0 119894=12hellip119873 ) y la restante

acumule el resto seriacutea un maacuteximo de recaudacioacuten El caso ideal seriacutea que

toda la renta S se acumulase en un uacutenico individuo lo que dariacutea lugar al

maacuteximo de recaudacioacuten La maacutexima recaudacioacuten se consigue con la

distribucioacuten de renta menos equitativa En conclusioacuten la forma de la

distribucioacuten de las rentas es determinante de la recaudacioacuten obtenida

cuando se aplica sobre ella un impuesto progresivo