IDEAS home Printed from https://ideas.repec.org/p/ecr/col027/4755.html
   My bibliography  Save this paper

Imputación de datos: teoría y práctica

Author

Listed:
  • Galván, Marco
  • Medina H., Fernando

Abstract

Documento preparado por Fernando Medina y Marco Galván, Asesor Regional y Asistente de Investigación, respectivamente, de la Unidad de Estadísticas Sociales de la División de Estadística y Proyecciones Económicas de la CEPAL.Las opiniones expresadas en este documento, que no ha sido sometido a revisión editorial, son de exclusiva responsabilidad de los autores y pueden no coincidir con las de la Organización. RESUMEN La presencia de datos faltantes, es la situación a la que permanentemente se enfrentan investigadores y tomadores de decisiones. Disponer de un archivo de datos completos es ideal, pero aplicar métodos de imputación inapropiados para lograrlo, puede generar más problemas de los que resuelve. Durante las últimas décadas se han desarrollado procedimientos que tienen mejores propiedades estadísticas que las opciones tradicionales como la eliminación de datos (listwise), el pareo de observaciones (pairwise), el método de medias y el hot-deck. Los algoritmos de imputación múltiple (IM) se pueden aplicar utilizando paquetes comerciales y de acceso gratuito, pero imputar información no debe entenderse como un fin en sí mismo. Sus implicaciones en el análisis secundario de datos deben evaluarse con cautela, y este trabajo concluye que no existe el método de imputación ideal. Cada situación es diferente, y la tasa de no respuesta y su distribución espacial cambia entre encuestas, por lo que no es conveniente adoptar —a priori— el mismo procedimiento de imputación para todas las variables, en todas las encuestas. En la primera parte se analiza la teoría en la que se sustentan los procedimientos de imputación utilizados, y en la segunda se aplican ocho métodos alternativos para imputar distintos conceptos de ingreso para datos provenientes de una encuesta de hogares, y se evalúa la sensibilidad de los índices de pobreza y desigualdad (Gini, Theil y Atkinson (ε = 2), a las técnicas de imputación utilizadas. Se demuestra que los índices de pobreza son sensibles a los métodos de imputación, en tanto el procedimiento de sustitución de información tiene menor impacto en los indicadores de desigualdad.

Suggested Citation

  • Galván, Marco & Medina H., Fernando, 2007. "Imputación de datos: teoría y práctica," Estudios Estadísticos 4755, Naciones Unidas Comisión Económica para América Latina y el Caribe (CEPAL).
  • Handle: RePEc:ecr:col027:4755
    Note: Incluye Bibliografía
    as

    Download full text from publisher

    File URL: http://repositorio.cepal.org/handle/11362/4755
    Download Restriction: no
    ---><---

    More about this item

    Statistics

    Access and download statistics

    Corrections

    All material on this site has been provided by the respective publishers and authors. You can help correct errors and omissions. When requesting a correction, please mention this item's handle: RePEc:ecr:col027:4755. See general information about how to correct material in RePEc.

    If you have authored this item and are not yet registered with RePEc, we encourage you to do it here. This allows to link your profile to this item. It also allows you to accept potential citations to this item that we are uncertain about.

    We have no bibliographic references for this item. You can help adding them by using this form .

    If you know of missing items citing this one, you can help us creating those links by adding the relevant references in the same way as above, for each refering item. If you are a registered author of this item, you may also want to check the "citations" tab in your RePEc Author Service profile, as there may be some citations waiting for confirmation.

    For technical questions regarding this item, or to correct its authors, title, abstract, bibliographic or download information, contact: Biblioteca CEPAL (email available below). General contact details of provider: https://edirc.repec.org/data/eclaccl.html .

    Please note that corrections may take a couple of weeks to filter through the various RePEc services.

    IDEAS is a RePEc service. RePEc uses bibliographic data supplied by the respective publishers.