Wednesday, 1 June 2011

La interpolación como herramienta para la investigación económica

Cuando los economistas nos encontramos haciendo investigación sobre un tema, lo deseable es contrastar el planteamiento teórico con la realidad, de manera que los datos de la realidad nos permitan formular planteamientos teóricos más consistentes. Lo anterior implica contar con información actualizada y confiable, además de que también es importante que se cuente con un número amplio de observaciones para que, de esta manera, se haga un análisis más completo.

Uno de los problemas recurrentes en las ciencias sociales es la falta de información o que los datos con los que se cuenta no son suficientemente representativos para el análisis de los fenómenos que aquejan a la sociedad, un ejemplo de esto es la base de datos de Producto Interno Bruto (PIB) que puede ser consultada en el sitio del Instituto Nacional de Estadística, Geografía e Informática (INEGI), esta base de datos tiene la peculiaridad de que puede ser consultada a partir de su construcción metodológica, año base 1993 y año base 2003, esto sin dejar de mencionar que INEGI cuenta con otras dos series para el PIB dentro de sus estadísticas históricas de México, la del año base 1970 y la del año base 1980.

Este tipo de limitación en la disponibilidad de una serie de PIB que abarque desde el año 1970 al año 2011, también limita un análisis del comportamiento de la variable en el tiempo. De manera que en ocasiones el investigador tiene que echar mano de herramientas que le permitan construir series lo suficientemente largas para analizar el comportamiento de las variables.

Para el caso de la variable PIB, la herramienta a utilizar se llama empalme de series, que significa homogeneizar bases de datos con distinto año base para crear una serie de datos amplia bajo un mismo año base. Este tema por supuesto nos ocupará en otra ocasión, en esta entrada se plantea la interrogante de ¿Cual herramienta podemos utilizar cuando queremos analizar el impacto de X sobre Z y se cuenta con información trimestral de X y anual de Z?

La herramienta a utilizar es la interpolación y consiste en tener datos de una misma variable del periodo A y del periodo B y encontrar los valores intermedios entre cada extremo (En este caso A y B); de esta forma, bases de datos con distinta periodicidad pueden ser homogeneizadas para analizar un fenómeno social en específico.

Un aspecto que se debe considerar es que la interpolación no se puede utilizar para complementar todas las bases de datos con las que se trabajen, es altamente recomendable que se aplique sólo en casos donde se observe que la variable a estudiar no es tan volátil y su tasa de crecimiento sea más o menos constante. Un variable donde se puede aplicar de buena forma la interpolación y sin temor a sesgar la información, es en la población, ya que el ritmo de crecimiento de la población no suele tener variaciones significativas de un año a otro.

Para entender mejor como se interpolan valores en una serie, se tomará la información de la población a mitad de año del Distrito Federal para el periodo 1990-2010.


Supongamos ahora que solo contamos con los datos de los años 1990, 1995, 2000, 2005 y 2010 y queremos determinar los valores intermedios entre estos años. Basado en Correa et al. (2002), se calculan los años faltantes con un promedio geométrico (r) dado por:

Donde:
V95.- Valor del año 1995
V90.- Valor del año 1990
n.- número de periodos
Se obtiene el valor de r para cada uno de los intervalos (1990, 1995, 2000, 2005 y 2010), como se aprecia en el siguiente cuadro:

A partir del promedio geométrico se interpolaron los valores de los años 1991-1994, con la siguiente fórmula:
Donde:
Vt.- Valor del año t a calcular
Vt-1.- Valor del periodo anterior

Se aplica el mismo procedimiento para los otros tramos de la serie donde hagan falta valores.

Se puede graficar la serie original y la serie interpolada para apreciar gráficamente las diferencias entre valores:
Como se aprecia, las series son muy semejantes en cuanto a los valores se refiere, por lo que si se hace una estimación con la serie interpolada los coeficientes serán muy similares.

La interpolación es una herramienta muy útil para incrementar el número de observaciones en una serie, sin embargo, no se sugiere que se utilice para todas las bases de datos, es importante que estas bases no presenten variaciones significativas de un año a otro ya que si se interpola una serie con muchas variaciones, ésta puede salir sesgada ya que al trabajar con el promedio geométrico, se está asumiendo que los valores son similares año con año, dejando de lado que algunas variables pueden sufrir alteraciones significativas por diferentes sucesos, tal como lo haría una crisis económica.

Referencias

Correa, V., Escandón, A., Luengo, R. y Venegas, J., 2002, “Empalme PIB: Series Anuales y Trimestrales 1986–1995, Base 1996. Documento Metodológico”, Banco Central de Chile, Documento de Trabajo No. 179.