Author
Listed:
- Cristina Luna
- Agustín Maravall
Abstract
Este trabajo resume la aplicación de una derivación del programa TRAMO denominada TERROR (TRAMO for errors), al control de calidad de los datos que el Banco de España recibe regularmente de entidades, y que sirven de base para la construcción de sus series agregadas. Dado que cada mes y cada trimestre se reciben cientos de miles de datos nuevos, es preciso realizar un esfuerzo para detectar posibles errores en los mismos. Las causas de estos errores son múltiples y muy variadas; pueden ir desde un error en la colocación de una coma, hasta la confusión, por poner un ejemplo, por parte de algún banco, de sus activos bancarios frente a Costa de Marfil con sus activos bancarios frente a las Islas Caimán. El problema del control de calidad de los datos ha sido objeto de una atención creciente en los últimos años. Sin embargo, las técnicas disponibles hasta el presente para tratar conjuntos grandes de series presentan limitaciones importantes, que implican que la detección de errores sea fundamentalmente manual y se base en unos criterios simples, que utilizan una cantidad pequeña de la información disponible. Por una parte, la detección se realiza, en esencia, comparando el crecimiento de los dos últimos períodos (ignorando, pues, la historia completa de la serie de que se trate), y, por otro lado, la comparación se realiza a un nivel de agregación relativamente elevado. Una implicación de la dificultad de detección de errores que ha habido en el pasado es que algunos de los grupos de series de base presentan un aspecto errático, que hace sospechar que pueden contener un número considerable de errores. Conviene señalar que métodos semejantes, fundamentalmente manuales, son también empleados en la mayoría de los bancos centrales e instituciones tales como el Banco de Pagos Internacionales. En la detección de errores es obvio que la información exógena a priori es importante (por ejemplo, pueden haberse fusionado dos bancos). Pero sería importante disponer de un método que fuese automático y que permitiese tratar gran cantidad de series en muy poco tiempo, utilizando la información disponible de forma eficiente. Un método de este tipo podría proporcionar una relación básica de partida sobre cuáles de los nuevos datos son sospechosos de ser erróneos. Cualquier método automático tiene que construirse sobre una definición precisa de qué significa que un dato es «sospechoso». Dado que se trata, en nuestro caso, de series temporales, parece natural plantear el problema en los siguientes términos: dada la evolución que ha seguido la serie, se obtiene una predicción óptima para el próximo período, así como una medida de la desviación típica del error de predicción. Si, al llegar el nuevo dato, este resulta «excesivamente» alejado de la predicción, se clasifica como sospechoso. El concepto de «excesivo» es fácil de precisar. Por ejemplo, se puede considerar excesivo un error de predicción de un tamaño tal que, dadas las características de la serie, solo esperaría uno encontrarlo una de cada 100.000 veces.
Suggested Citation
Cristina Luna & Agustín Maravall, 1999.
"Un nuevo método para el control de calidad de los datos en series temporales,"
Boletín Económico, Banco de España, issue MAY, pages 37-44, Mayo.
Handle:
RePEc:bde:joures:y:1999:i:5:n:4
Download full text from publisher
Corrections
All material on this site has been provided by the respective publishers and authors. You can help correct errors and omissions. When requesting a correction, please mention this item's handle: RePEc:bde:joures:y:1999:i:5:n:4. See general information about how to correct material in RePEc.
If you have authored this item and are not yet registered with RePEc, we encourage you to do it here. This allows to link your profile to this item. It also allows you to accept potential citations to this item that we are uncertain about.
We have no bibliographic references for this item. You can help adding them by using this form .
If you know of missing items citing this one, you can help us creating those links by adding the relevant references in the same way as above, for each refering item. If you are a registered author of this item, you may also want to check the "citations" tab in your RePEc Author Service profile, as there may be some citations waiting for confirmation.
For technical questions regarding this item, or to correct its authors, title, abstract, bibliographic or download information, contact: Ángel Rodríguez. Electronic Dissemination of Information Unit. Research Department. Banco de España (email available below). General contact details of provider: https://edirc.repec.org/data/bdegves.html .
Please note that corrections may take a couple of weeks to filter through
the various RePEc services.