Proyecciones probabilísticas de la fecundidad en Argentina

Andreozzi, Lucía; Ribotta, Bruno; Andreozzi, Lucía; Ribotta, Bruno

doi:10.55441/1668.7515.n31.38015

Serviços Personalizados

Journal

Artigo

Indicadores

Citado por SciELO

Links relacionados

Similares em SciELO

Mais
Mais

Permalink

Astrolabio. Nueva Época

versão On-line ISSN 1668-7515

Astrolabio no.31 Cordoba dez. 2023

http://dx.doi.org/10.55441/1668.7515.n31.38015

Articulos

Proyecciones probabilísticas de la fecundidad en Argentina

Fertility Probabilistic Projections in Argentina

Lucía Andreozzi^a
http://orcid.org/0000-0002-1723-5725

Bruno Ribotta^b
http://orcid.org/0000-0003-1943-051

¹aInstituto de Investigaciones Teóricas y Aplicadas de la Escuela de Estadística. Consejo Nacional de Investigaciones Científicas y Técnicas. Universidad Nacional de Rosario. andreozzi.lu@gmail.com

²bCentro de Investigaciones y Estudios sobre Cultura y Sociedad. Consejo Nacional de Investigaciones Científicas y Técnicas. Universidad Nacional de Córdoba. brunoribo@yahoo.com.ar

Resumen

En los últimos años se ha propuesto una importante cantidad de métodos estadísticos demográficos. La gran mayoría han sido desarrollados con la finalidad de pronosticar las componentes demográficas y/o medidas derivadas a partir de la suposición de un modelo subyacente. El presente trabajo pretende realizar un ejercicio comparativo integral a través de la estimación y pronóstico de la fecundidad a partir de tres propuestas -métodos clásicos de pronóstico, tales como los modelos ARIMA y los suavizados exponenciales, modelos para datos funcionales (MDF) y modelos jerárquicos bayesianos (MJB)-, como un primer paso hacia el estudio de las proyecciones de población derivadas de cada una de ellas, empleando datos de la Argentina. El ejercicio tiene como horizonte final la estimación de la mortalidad y la fecundidad a través de los tres métodos mencionados para luego integrarlos en proyecciones de población.

Palabras clave: modelos para datos funcionales; modelos jerárquicos bayesianos; tasa global de fecundidad; Argentina; proyecciones demográficas

Abstract

In recent years, a significant number of demographic statistical methods have been proposed. Most of them have been developed with the purpose of forecasting demographic components or indicators derived from the assumptions of an underlying model. The present work aims to carry out a comprehensive comparative exercise through the estimation and forecast of fertility based on three proposals -classic forecast methods such as ARIMA models and exponential smoothing, functional data models (FDM) and Bayesian hierarchical models (BHM)- as a first step towards the study of population projections derived from each of method, using data from Argentina. The exercise has as final objective the estimation of mortality and fertility through the three aforementioned methods to later integrate them into population projections.

Keywords: functional data models; Bayesian hierarchical models; global fertility rate; Argentina; demographic projections

Introducción

En los últimos años, se ha propuesto una importante cantidad de métodos estadísticos demográficos. La gran mayoría han sido desarrollados con la finalidad de pronosticar las componentes demográficas y/o medidas derivadas a partir de la suposición de un modelo subyacente. Sin embargo, es importante recordar que estos supuestos constituyen una representación acotada -por lo general, lo menos acotada posible- de una realidad compleja que finalmente es representada a través de múltiples formas funcionales y parámetros. Desde los clásicos suavizados exponenciales y modelos ARIMA de ^{Box y Jenkins (1976}) (del inglés, Autorregressive Integrated Moving Average), pasando por el modelo de ^{Lee-Carter (Lee y Carter, 1992}) y sus múltiples variantes hasta los modelos para datos funcionales propuestos por ^{Hyndman y Booth (2008}) y los modelos jerárquicos bayesianos propuestos por ^{Alkema, Raftery, Gerland, Clark, Pelletier, Buettner y Heilig (2011}), la gran gama de propuestas comprende modelos provenientes tanto del enfoque frecuentista como del bayesiano.

Entre las distintas alternativas se pueden encontrar propuestas que pretenden modelizar las componentes demográficas en forma aislada a través de formas funcionales simplificadas de su dinámica. De este modo permiten analizarla, estudiar tendencias, patrones de edad y sexo, para luego pronosticarlas.

Un caso particular de ellas es el modelo para datos funcionales (MDF), que además de modelizar las tres componentes (mortalidad, fecundidad y migraciones) por separado permite integrarlas en un único modelo de proyección de la población.

Una propuesta que se plantea como superadora son los modelos jerárquicos bayesianos (MJB), que constituyen un dispositivo complejo que, partiendo de la integración de información de múltiples niveles geográficos, modelan y pronostican la mortalidad y la fecundidad para luego integrarlas a una proyección de población. Este enfoque se presenta como superador al MDF, desarrollados principalmente para países de baja fecundidad que han atravesado la fase de transición y cuyo nivel de fecundidad fluctúa de un modo estable, estacionario. Sin embargo, más allá de la inclusión de tres fases en el modelado, el desarrollo teórico desemboca en la identificación de una forma funcional única o común que se adapta, mediante parámetros o restricciones, a casos particulares.

Finalmente, el método determinístico más clásico; el método de las componentes (en inglés, CCMPP: Cohort Component Method for Population Projections) resulta aún de una simplicidad y practicidad superlativa, más allá de su punto crítico más planteado: la imposibilidad de ofrecer intervalos de probabilidad asociada a los resultados.

Desde el punto de vista demográfico, la complejidad, tanto en la formulación del modelo como en su estimación, aumenta con cada nueva propuesta, al mismo tiempo que su capacidad para generar un retorno teórico disminuye, reduciéndolo a la mera producción de una cifra o de un par de cifras (intervalo) sin un análisis sociodemográfico que la/s contextualice.

El ejercicio tiene como horizonte final la estimación de la mortalidad y la fecundidad a través de los tres métodos mencionados para luego integrarlos en proyecciones de población. MDF y MJB incluyen, como última etapa de su implementación, la construcción de las proyecciones a partir de las componentes proyectadas. Sin embargo, para la integración de las propuestas más clásicas se plantea la construcción de las proyecciones de población a partir del método de las componentes basado en las estimaciones ARIMA/Suavizados.

Marco conceptual y antecedentes

La transición de la fecundidad. Uno de los principales modelos teóricos demográficos se refiere a la transición demográfica y constituye, en numerosas metodologías de pronóstico, el supuesto principal subyacente. La transición de la fecundidad puede definirse, a grandes rasgos, como el descenso a largo plazo en el número de hijos por mujer, de cuatro o más a dos o menos; sin embargo, esta simple definición deja de lado la idea del patrón de cambio bajo el cual se da ese descenso. En un ensayo publicado en Demography, Karen Oppenheim Mason (1997) aborda el tema de la transición de la fecundidad de manera exhaustiva, pero principalmente crítica: sostiene que es frecuente encontrar en la bibliografía demográfica la idea de transición como un todo, pero lo que resulta interesante es deconstruir la teoría en primer lugar con relación a su escala temporal; se la puede pensar en términos de milenios, siglos o décadas. Es en base a esta escala temporal que se estudia la correlación entre la fecundidad y los fenómenos o fuerzas que influyen en su dinámica, y son las escalas las que determinan las diferencias entre las regiones del mundo. Desde esta perspectiva, plantea seis grandes teorías sobre la fecundidad y postula cuatro grandes errores a la hora de analizarla. Las teorías:

* ^{Thompson (1930}) y ^{Notestein (1953}) atribuyen el descenso en la fecundidad a los cambios en la vida social, presuntamente atribuidos a la industrialización y la urbanización.

* ^{Lesthaeghe (y Surkyn, 1988}; y Wilson, 1986) agrega a los cambios económicos un cambio en los valores hacia el individualismo y la autorregulación asociados; pero su teoría describe claramente a Europa, no así a la mayoría de las otras regiones.

* ^{Caldwell (1982}) plantea una teoría de los flujos de riqueza intrafamiliar y la nuclearización de la familia y el apoyo entre generaciones como determinantes del descenso.

* Microeconómica clásica, que se basa en tres determinantes vinculados a las “elecciones” de parejas, costo de los hijos versus otros bienes de la pareja, pero nada agrega en relación con las condiciones ambientales e institucionales que afectan ingresos, costos y preferencias.

* ^{Easterlin (1975} y 1978) y Easterlin y Crimmins (1985) agregan a la teoría anterior el concepto de “suministro de niños”, vinculada a la demanda y los costos de regulación de la fecundidad.

* ^{Cleland y Wilson (1987}) atribuyen “el ritmo” de la transición a la difusión de información y a las nuevas formas sociales sobre el control de la natalidad.

Según Oppenheim Mason (1997), estos serían los cuatro errores principales de estas teorías: primero, sostienen que todas las transiciones tienen la misma causa más allá del tiempo y del espacio, ignorando diferencias preexistentes en los patrones sociales y demográficos -ninguna proporciona una explicación completa de todas las disminuciones conocidas de la fecundidad-; segundo, ignoran el descenso en la mortalidad como precondición para el descenso en la fecundidad; tercero, suponen que la regulación de la fecundidad es fundamentalmente diferente entre las poblaciones pre-transicionales y pos-transicionales; cuarto, ponen el foco en una escala de décadas.

Es importante destacar que la teoría neoclásica proporciona un marco cuantificable para examinar el cambio de la fecundidad, pero como teoría ignora las condiciones ambientales e institucionales que modifican los costos, los ingresos y las preferencias, que también influyen en la disminución de la fecundidad. De la misma manera, el marco de la teoría de la oferta y la demanda contiene pocas ideas sobre los determinantes institucionales de la disminución de la fecundidad. Además, si bien intenta explicar cuándo se ha producido un cambio, no puede predecir de manera convincente por qué tales fenómenos no continúan ocurriendo en otras partes o regiones.

La fecundidad en Argentina y en América Latina. De acuerdo con el análisis de ^{Chackiel y Schkolnik (2004}), basado en estimaciones y proyecciones elaboradas conjuntamente por organismos nacionales y el Centro Latinoamericano de Demografía (CELADE), en América Latina, entre 1950-55 y 1985-90 se produjo un descenso importante de la fecundidad. Para el quinquenio 1950-55, Argentina y Cuba^¹ presentaban una fecundidad media-baja y Uruguay una fecundidad baja, ubicándose entre los países con tasas globales de fecundidad más bajas de la región.

América Latina, países según nivel de fecundidad 1950-1955 y 1985-1990

Nivel de fecundidad 1950-1955	Nivel de fecundidad 1985-1990
	Alta	Media alta	Media baja	Baja
Alta	Guatemala Honduras Nicaragua	Bolivia El Salvador Haití Paraguay	Brasil Costa Rica Ecuador México Panamá Perú Rep. Dominicana Venezuela	Colombia
Media alta				Chile
Media baja				Argentina Cuba
Baja				Uruguay

Fuente: ^{Chackiel y Schkolnik (2004})

Particularmente, y como analiza ^{Pantelides (1983}), el caso de la transición de la fecundidad en la Argentina es interesante por haberse producido tempranamente en el contexto latinoamericano; la evolución de la mortalidad y la fecundidad se parece poco a la conocida forma “clásica” del modelo transicional. Esta clasificación permite identificar un subconjunto de países, que incluye a la Argentina, con comportamientos similares entre ellos, pero diferentes dentro de la región. Dicho conjunto se tendrá en cuenta en la etapa de modelización.

Objetivos

El primer paso: la fecundidad. El presente trabajo pretende realizar un ejercicio comparativo integral a través la estimación y pronóstico de la fecundidad a partir de tres propuestas: métodos clásicos de pronóstico, tales como los modelos ARIMA y los suavizados exponenciales; modelos para datos funcionales; y modelos jerárquicos bayesianos, lo que constituye un primer paso hacia el estudio de las proyecciones de población derivadas de cada una de ellas. Al referirse a la fecundidad, se resume la información en la tasa global de fecundidad (TGF), uno de los componentes claves en las proyecciones de población -el número promedio de hijos que una mujer dará a luz durante la etapa reproductiva-, experimentando en cada edad las tasas específicas de fecundidad de ese período y asumiendo la ausencia de mortalidad.

Datos y métodos

Las metodologías más clásicas para el modelado y pronóstico de datos correlacionados temporalmente son los modelos ARIMA y los suavizados exponenciales. Estas técnicas se consideran ampliamente difundidas y disponibles en la bibliografía de análisis de series temporales, es por ello que se explican a continuación los dos modelos más innovadores y se comentan los procedimientos seguidos en cada caso.

Modelo para datos funcionales

Se denota con la cantidad a ser modelada, tasas de mortalidad, fecundidad o números de migración neta para la edad en el año . Si bien es posible plantear una transformación general de ^{Box y Cox (1964}) sobre , que permite modelar una tasa cuya variación aumenta con el valor de , es decir, cuando la variabilidad de las tasas es mayor a medida que las tasas son mayores, en la mayoría de las aplicaciones se implementa directamente la transformación logaritmo.

Se supone el siguiente modelo para las observaciones transformadas

[1]

[2]

donde es una función suave subyacente de son variables aleatorias, independientes e idénticamente distribuidas, y la definición de permite a la variancia cambiar con la edad y con el tiempo. Esto significa que las observaciones transformadas son la suma de la cantidad a modelar, , una función suave de la edad y un error (primera ecuación). La segunda ecuación describe la dinámica de a través del tiempo: es la media de a través de los años; es un conjunto de K funciones base ortogonales calculadas utilizando una descomposición en componentes principales funcionales de la matriz ; y es el error del modelo (el cual se supone no correlacionado serialmente). La dinámica del proceso está controlada por los coeficientes , los cuales tienen un comportamiento independiente uno de otro (garantizado por la utilización del método estadístico de componentes principales).

Existen tres fuentes de variación en el modelo: representa la variación aleatoria con respecto a la distribución relevante para los nacimientos, muertes y migrantes (Poisson o Normal); representa el residuo que surge al modelar utilizando un conjunto de funciones bases; y además existe una aleatoriedad inherente al modelo de series de tiempo para cada que ejerce los cambios en la dinámica de la curva suave . Es importante destacar que es posible implementar este enfoque para edades simples y también para grupos quinquenales.

Este modelo fue propuesto inicialmente por ^{Hyndman y Ullah (2007}) para modelar tasas de mortalidad y fecundidad empleando una transformación logaritmo en lugar de plantear la transformación de Box-Cox. También ha sido utilizado por ^{Erbas, Hyndman y Gertig (2007}) para pronosticar tasas de mortalidad por cáncer de mama. Como señalan Hyndman y Ullah (2007), el modelo es una generalización del conocido modelo de ^{Lee y Carter (1992}) para pronosticar tasas de mortalidad. En el enfoque de Lee y Carter (1992), representa la tasa de mortalidad e es el logaritmo de la mortalidad para el año y la edad ; además, no incluye suavizados y por lo tanto e ; finalmente se estima como el promedio de a través de los años. El número de componentes y se obtienen a partir la primera componente principal de la matriz y los pronósticos se obtienen ajustando una serie de tiempo al coeficiente ; en la práctica el modelo que se obtiene resulta generalmente un paseo aleatorio con pendiente.

El modelo general que se aplica a cada una de las componentes demográficas se obtiene a través de las etapas que se enumeran a continuación:

1. Se estiman las funciones suaves a través de regresión no paramétrica sobre para cada año , ecuación (1);

2. A se la define como la media de a través de los años;

3. Los coeficientes y las bases , con se calculan aplicando análisis de componentes principales funcionales sobre la matriz ;

4. Se ajusta un modelo de series de tiempo a donde . Para ello es posible utilizar un modelo ARIMA (^{Box y Jenkins, 1976}) o modelos de espacio de estado de innovaciones (^{Hyndman, Koehler, Ord y Snyder, 2008}).

Aunque el valor de debe ser especificado, ^{Hyndman y Ullah (2007}) sostienen que el método es insensible al valor elegido siempre y cuando sea lo suficientemente grande. Esto significa que el costo al elegir grande es pequeño (más allá del tiempo computacional), mientras que seleccionar un pequeño puede producir menor exactitud en los pronósticos. Hyndman y Booth (2008) utilizan para todos los componentes demográficos; esta cantidad en general es mayor a la que cualquier componente demográfica requiere.

La variancia observacional depende de la naturaleza de los datos. Para las muertes, la variancia observacional se estima a partir del logaritmo de las tasas suponiendo que las muertes se distribuyen Poisson (^{Brillinger, 1986}) con parámetro medio (donde es la población de edad expuesta al riesgo al 30 de junio del año ). Luego tiene una variancia aproximada y la variancia de (por aproximación de Taylor) resulta:

Para los nacimientos se supone una distribución Poisson (^{Keilman, Pham y Hetland, 2002}) con media , lo que implica

[3]

Para los datos de migraciones no se hacen supuestos distribucionales y se estima utilizando una regresión no paramétrica de sobre .

Puntualmente, ^{Hyndman y Ullah (2007}) sugieren utilizar regresión spline penalizada con restricciones para las tasas de mortalidad y fecundidad, de modo que los pesos contemplen la heterogeneidad presente en este tipo de datos. Se impone además una restricción de monotonía para las tasas de mortalidad y una restricción de concavidad para las de fecundidad. Más específicamente, para datos de mortalidad, se definen pesos iguales a la inversa de la variancia teórica (derivada del supuesto distribucional Poisson) y se utiliza una regresión spline penalizada (^{Wood, 2003}; y ^{He y Ng, 1999}), para estimar las curvas que representan a las tasas luego de la transformación logarítmica. La restricción impuesta determina que las curvas sean monótonamente crecientes para , es decir, a partir de una edad determinada, permitiendo reducir el ruido en las curvas estimadas para edades avanzadas. La imposición resulta lógica dado que cuanto más anciana es una persona tiene más probabilidad de morir.

Para los datos de fecundidad se utilizan los pesos de modo análogo y se impone como restricción la concavidad de las curvas, respetando el perfil observado habitualmente en las curvas de fecundidad. El método que permite implementar esta restricción puede verse en ^{He y Ng (1999}). Para suavizar las tasas de fecundidad se utiliza una regresión cuantil semiparamétrica por B-Splines con restricciones (He y Shi, 1996) que permite establecer restricciones a las funciones suavizadas, tales como monotonía, convexidad, concavidad o límites. Finalmente, para las migraciones se utiliza simplemente un suavizado por regresión local, loess.

Para el caso de las tasas de fecundidad, se detalla el enfoque de datos funcionales en demografía (^{Hyndman y Ullah, 2007}; Hyndman y Booth, 2008). Para ello se definen los datos necesarios para estimar la fecundidad, donde:

: nacimientos en mujeres de edad x ocurridos durante el año calendario t,

: población de mujeres de edad expuesta al riesgo al 30 de junio del año ,

donde y. La tasa de fecundidad de la edad x en el año calendario t se define como:

[4]

En el siguiente modelo, se denota con a la cantidad a ser modelada, en este caso la fecundidad de la madre de edad en el año . Primero se plantea una transformación de Box-Cox de y luego se supone el siguiente modelo para la cantidad transformada :

[5]

, [6]

donde es una función suave subyacente de ; son variables aleatorias gaussianas, independientes e idénticamente distribuidas; y es la varianza que puede variar con la edad y con el tiempo. Es posible implementar el enfoque para años y edades simples, así como también para grupos quinquenales. Luego, es una función suave de la edad que se observa con error y describe la dinámica de a través del tiempo. En esta ecuación, es la media de a través de los años; es un conjunto de funciones base ortogonales calculadas utilizando una descomposición en componentes principales; es el error del modelo, el cual se supone no correlacionado serialmente. La dinámica del proceso está controlada por los coeficientes , los cuales tienen un comportamiento independiente uno de otro (por propiedades del método de componentes principales).

En este enfoque, representa la tasa de fecundidad y se fija el parámetro de la transformación de Box y Cox, . Por ello es el logaritmo de la fecundidad para el año t y la edad x. En el modelo de Lee-Carter, desarrollado para el análisis de la mortalidad, no se realiza ningún tipo de suavizado, por ello, y a se estima como el promedio de a través de los años. Para ,se obtiene a partir de la primera componente principal de la matriz . Los pronósticos se obtienen ajustando un modelo de serie de tiempo a ; en la práctica el modelo resulta generalmente un paseo aleatorio con pendiente, en esta etapa la selección se realiza automáticamente empleando el modelo que genera el menor valor del criterio de Akaike.

Modelo jerárquico bayesiano

El modelo de proyección bayesiano propuesto por Alkema y otros se basa en estimaciones quinquenales de la tasa global de fecundidad desde 1950-1955 hasta 2015-2020. Su implementación se encuentra disponible para su uso en R en el paquete bayesTFR (^{Sevcíková, Alkema y Raftery, 2008}). Para ello se divide la evolución de la TGF en tres amplias fases:

I: una fase de alta fecundidad pre-transicional;

II: la transición a la fecundidad en la cual la TGF decrece desde niveles de fecundidad altos hacia o por debajo del nivel de fecundidad de reemplazo;

III: una fase posterior a la transición de baja fecundidad que incluye la recuperación de la fecundidad por debajo del reemplazo hacia la fecundidad de reemplazo y las oscilaciones alrededor de la fecundidad a ese mismo nivel.

El período de observación para cada país se divide en estas diferentes fases en función de las definiciones deterministas de sus períodos de inicio y finalización, y luego se modela por separado. Por tanto, se define como el comienzo de la fase II para el país c, la cual es dada por:

[7]

donde es el valor máximo de la TGF observada en el país , y indica el máximo local. El momento de inicio de la fase III para el país , indicado por , se encuentra dentro del período de datos observados si existen dos aumentos consecutivos de la TGF y a su vez esta es menor a 2.

[8]

donde es la TGF del país en el periodo . Para el resto de los países, .

En el MJB no se plantea un modelo para la fase I dado que se asume que en el siguiente periodo alcanzará la fase II y en base a ella se realizarán las proyecciones de la TGF. A continuación, se expone el modelo para la fase II.

Modelo para la fase II o transición de la fecundidad

Esta fase se modela mediante un paseo aleatorio con pendiente dado por

[9]

siendo la TGF para el período en el país ; es el decremento que representa la disminución sistemática de la fecundidad durante la transición; es el error aleatorio; y y los momentos de inicio y fin de la etapa de transición. La distribución del error está dada por

[10]

donde es la media y la desviación estándar en el momento inicial de la fase; y es la desviación para los restantes valores de t

[11]

siendo la desviación estándar máxima de los errores alcanzada en nivel S de la TGF y a y b son los multiplicadores de la desviación estándar para modelar la disminución lineal para valores más grandes y pequeños de la TGF. La constante se agrega para modelar la variancia del error más grande antes de 1975.

Finalmente se modela como función del nivel la TGF y el vector del siguiente modo;

[12]

siendo una función de diminución paramétrica. La función de disminución es la suma de dos funciones logísticas, y para un país específico viene dada por

[13]

donde es el vector de parámetros específicos de un país; es la disminución máxima; son constantes y los describen los rangos de la TGF, entre los cuales el ritmo de la disminución cambia; y es el nivel de comienzo de la disminución de la fecundidad.

Se estiman para cada país los parámetros de disminución, y para los países en que el comienzo de la fase II está dentro del período de datos observados se fija igual al valor de la TGF de fecundidad en ese período, es decir, Para los países en los cuales la fase II se inició previo al periodo de observación el nivel de inicio se agrega como otro parámetro más del modelo.

Figura 1. Esquema de la función de disminución

Fuente: elaboración propia

Dado el nivel de comienzo, , los cinco parámetros que determinan el ritmo de la disminución de la fecundidad en el país son , , y se estiman a partir de un modelo jerárquico bayesiano dado por:

[14]

[15]

[16]

[17]

[18]

[19]

[20]

Con media y varianza de parámetros .

Las proyecciones de la TGF para los países en fase II se basan en la distribución posterior de los parámetros del modelo y la mediana se emplea como valor de proyección dada su robustez y simplicidad.

En la fase III o de postransición, el cambio en la TGF se modela a través de un proceso AR(1) con media , que es una aproximación de la TGF para la fecundidad a nivel de reemplazo.

(21)

donde es el parámetro autorregresivo, con , y la desviación estándar de los errores aleatorios, que se estiman a través de máxima verosimilitud.

En síntesis, para la proyección de la TGF a través del modelo jerárquico bayesiano se procede al ajuste del modelo; se calculan o estiman los momentos de inicio de las fases II y III para cada país; luego, se obtiene una muestra a posteriori de los parámetros del modelo mediante el algoritmo MCMC (Markov chain Monte Carlo) para, finalmente, generar a partir de ella las trayectorias futuras de la TGF. Los autores puntualizan que la mediana, y no la media, se emplea como la mejor proyección dada su clara interpretación y robustez en relación con el comportamiento de las colas de las distribuciones posteriores, independientemente de la forma de la distribución posterior: la mitad de las trayectorias de la TGF está arriba, y la mitad de las trayectorias está por debajo de la mediana.

Fuentes

Existe una relativa escasez y fragmentariedad de los datos cuantitativos disponibles para la investigación histórica y sus tendencias, hecho que reduce las posibilidades de su explotación. La información que se emplea para las proyecciones demográficas se basa generalmente en datos secundarios publicados con aproximaciones predominantemente demográficas.

Con relación a las dos propuestas metodológicas que se analizan en el presente estudio, ^{Alkema et al. (2011}) se basa en los datos de World Population Prospects, para quien, de acuerdo con los metadatos disponibles en el sitio, las cifras de fecundidad se calculan en base a:

* Nacimientos registrados clasificados por edad de la madre y la población femenina subyacente por edad hasta 2016, ajustados por subregistro;

* Nacimientos en el hogar en los 12 (o 24) meses anteriores clasificados por edad de la madre de los censos de 1947, 1960, 1970, 1980, 1991, 2001, 2010 y MICS 2011-2012;

* Fecundidad ajustada utilizando el método de la relación P/F de Brass (o variantes) con datos sobre los niños nacidos vivos y los nacimientos en los 12 (o 24/36) meses anteriores, ambos clasificados por edad de la madre, desde 1947, 1960, 1970;

* Censos de 1980, 1991, 2001, 2010 y MICS 2011-2012;

* Estimaciones indirectas obtenidas de la aplicación del método inverso de supervivencia a los censos de 1980, 1991;

* Estimaciones internacionales consideradas hasta 2017;

* Estimaciones oficiales de las tasas de fecundidad específicas por edad hasta 2017.

Por otro lado, los modelos para datos funcionales se aplican a tasas de mortalidad y fecundidad. Para ello, los datos requeridos son los nacimientos según edad de la madre y la población por grupo quinquenal. Es importante destacar que durante la estimación es necesario contar con las cantidades netas tanto de eventos como de población. Por ello no es la tasa en sí el dato base, sino que se lo construye a partir de los registros de nacimientos y las cifras de población. Con relación a los datos provenientes del registro de hechos vitales, son suministrados por la Dirección de Estadísticas e Información de Salud (DEIS), a través de bases de datos que contienen el registro de los hechos individuales que permiten generar la matriz por grupos de edad para un período de tiempo de aproximadamente 30 años. En cambio, con relación a las cifras de población se decide utilizar la población por grupos quinquenales disponible en la página web de la Comisión Económica para América Latina y el Caribe (CEPAL).

Resultados

Se presentan las estimaciones obtenidas para la TGF desde 2015 a 2095 mediante los distintos enfoques. Las técnicas clásicas poseen particularidades: los modelos ARIMA requieren un mínimo de datos observados de manera que sean suficientes para la estimación de los parámetros; la técnica de suavizado exponencial de Holt no resulta tan estricta frente a este requisito, de modo que es más aplicable a series temporales más reducidas (breves). Luego, cuando los datos se presentan para períodos de cinco años calendario se cuenta tan solo con 6 datos para el periodo 1980-2010, pero en cambio se dispone de 30 datos si se consideran datos anuales. Se excluye el modelo ARIMA dado que presenta resultados incongruentes: cuando se estima el modelo en base a la serie de 30 datos, presenta una tendencia decreciente demasiado abrupta y poco compatible con la realidad.

La tabla 2 incluye las estimaciones del MJB para distintos períodos de base. En primer lugar, dado que los datos de estadísticas vitales presentan una calidad alta desde 1980 en adelante, se evalúan los modelos excluyendo períodos anteriores. En segundo lugar, se excluyen períodos para los cuales la TGF de fecundidad se calcula en base a proyecciones de población, es decir se combinan distintos inicios del período de datos observados con una finalización en 2010. Finalmente, se estima el modelo con la serie completa disponible en la web de World Population Prospects 2019 (United Nations, 2019).

Pronósticos de la Tasa Global de Fecundidad obtenidos mediante el modelo jerárquico bayesiano (2015-2095)

Período de pronóstico	Período empleado para la estimación
Período de pronóstico	1950-2010	1955-2010	1960-2010	1965-2010	1970-2010	1975-2010	1980-2010	1950-2015
2015-2020	2,21	2,21	2,22	2,22	2,21	2,19	2,19	2,27
2020-2025	2,13	2,13	2,15	2,16	2,14	2,10	2,10	2,20
2025-2030	2,07	2,06	2,07	2,08	2,09	2,02	2,02	2,14
2030-2035	2,00	2,00	2,01	2,02	2,05	1,96	1,97	2,07
2035-2040	1,96	1,95	1,96	1,97	2,02	1,91	1,92	2,01
2040-2045	1,92	1,91	1,92	1,94	1,98	1,87	1,88	1,97
2045-2050	1,88	1,89	1,90	1,90	1,96	1,85	1,85	1,93
2050-2055	1,86	1,86	1,87	1,88	1,95	1,83	1,83	1,89
2055-2060	1,84	1,85	1,86	1,86	1,94	1,83	1,82	1,86
2060-2065	1,83	1,83	1,85	1,85	1,94	1,81	1,82	1,84
2065-2070	1,83	1,83	1,84	1,85	1,94	1,81	1,81	1,82
2070-2075	1,83	1,82	1,84	1,84	1,94	1,80	1,81	1,80
2075-2080	1,82	1,83	1,84	1,84	1,94	1,81	1,81	1,79
2080-2085	1,82	1,82	1,84	1,84	1,94	1,81	1,81	1,79
2085-2090	1,82	1,82	1,84	1,84	1,95	1,82	1,81	1,79
2090-2095	1,82	1,83	1,84	1,84	1,95	1,82	1,82	1,77