TÉCNICAS ROBUSTAS Y NO ROBUSTAS PARA IDENTIFICAR OUTLIERS EN EL ANÁLISIS DE REGRESIÓN

Autores/as

  • Darwin Ugarte Ontiveros
  • Ruth Marcela Aparicio de Guzman Universidad Privada Boliviana

DOI:

https://doi.org/10.23881/idupbo.020.2-3e

Palabras clave:

Outliers, Estadística Robusta, Análisis de Regresión, Stata.

Resumen

Verificar si los resultados de un modelo de regresión reflejan el patrón de los datos, o si los mismos se deben a unas cuantas observaciones atípicas (outliers) es un paso importante en el proceso de investigación empírica. Para este propósito resulta aún común apoyarse en procedimientos (estándares) que no son eficaces para este propósito, al sufrir del denominado “masking effect”, algunos de ellos sugeridos incluso en los libros tradicionales de econometría. El presente trabajo pretende alertar a la comunidad académica sobre el peligro de implementar estas técnicas estándares, mostrando el pésimo desempeño de las mismas. Asimismo, se sugiere aplicar otras técnicas más idóneas sugeridas en la literatura sobre “estadística robusta” para identificar outliers en el análisis multivariado. Para facilitar la aplicación de las mismas, el trabajo pone a disposición de la comunidad académica un programa en Stata del tipo do-file para identificar y categorizar outliers basado en el trabajo de [1]. Simulaciones de Monte Carlo dan evidencia de la aplicabilidad de la misma.

Descargas

Los datos de descargas todavía no están disponibles.

Afiliación del autor/a

Darwin Ugarte Ontiveros

Centro de Investigaciones Económicas y Empresariales

Referencias

B. C. Rousseeuw, Peter J and Van Zomeren, “Points, Unmasking multivariate outliers and leverage,” J. Am. Stat. Assoc., vol. 85, pp. 633–639, 1990.

V. J. Maronna, Ricardo A and Yohai, “Robust regression with both continuous and categorical predictors,” J. Stat. Plan. Inference, vol. 89, pp. 197–214, 2000.

A. S. Hadi, “Identifying multiple outliers in multivariate data,” J. R. Stat. Soc. Ser. B (Methodological, vol. 54, pp. 761–774, 1992.

A. S. Hadi, “A modification of a method for the detection of outliers in multivariate samples,” J. R. Stat. Soc. Ser. B, vol. 56, pp. 393–396, 1994.

C. Verardi, Vincenzo and Croux, “Robust regression in Stata,” Stata J., vol. 9, no. SAGE Publications Sage CA: Los Angeles, CA, pp. 439–453, 2009.

V. J. and others Maronna, Ricardo A and Martin, R Douglas and Yohai, Robust statistics: theory and methods (with R). John Wiley & Sons, 2019.

Baltagi, Econometrics. 2011.

R. Davidson and J. G. MacKinnon, Instructor ’ s Manual to Accompany Econometric Theory and Methods. 2004.

C. Dehon, M. Gassner, and V. Verardi, “Beware of ‘Good’ outliers and overoptimistic conclusions,” Oxf. Bull. Econ. Stat., vol. 71, no. 3, pp. 437–452, 2009, doi: 10.1111/j.1468-0084.2009.00543.x.

F. Perachi, Econometrics. 2011.

F. Hayashi, Econometrics,‖ Princeton University Press: Princeton. 2000.

W. H. Greene, “Econometric analysis, 71e,” Stern Sch. Business, New York Univ., 2012.

B. Hansen, Econometrics. US. University of Wisconsin Press, 2017.

P. A. Ruud, An introduction to classical econometric theory. Oxford University Press, 2000.

M. Verbeek, A guide to modern econometrics. John Wiley & Sons, 2008.

P. Kennedy, A guide to modern econometrics. 2008.

J. M. Wooldridge, Introductory econometrics: A modern approach. 2016.

D. N. Gujarati, Basic econometrics. Tata McGraw-Hill Education, 2009.

Hampel and F. R., “The influence curve and its role in robust estimation,” J. Am. Stat. Assoc., vol. 69, pp. 383–393, 1974.

W. A. Hampel, Frank R and Ronchetti, Elvezio M and Rousseeuw, Peter J and Stahel, “Robust statistics: the approach based on influence functions,” vol. 196, no. John Wiley& Sons, 2011.

A. M. Rousseeuw, Peter J and Leroy, “Robust regression and outlier detection,” New York John Wiley Sons, vol. 589, 2005.

D. L. Donoho and P. J. Huber, “The notion of breakdown point,” A festschrift Erich L. Lehmann, vol. 157184, 1983.

Hampel and F. R, “A general qualitative definition of robustness,” Ann. Math. Stat., pp. 1887–1896, 1971.

R. E. Hoaglin, David C and Welsch, “The hat matrix in regression and ANOVA,” Am. Stat., vol. 32, pp. 17–22, 1978.

R. D. Cook, “Influential Observations in Linear Regression,” J. Am. Stat. Assoc., vol. 74, pp. 169–174, 1977.

A. Verardi, Vincenzo and McCathie, “The S-estimator of multivariate location and scatter in Stata,” Stata J., vol. 12, pp. 299–307, 2012.

W. A. Stahel and Werner A, “Robuste Schätzungen: Infinitesimale Optimalität und Schätzungen von Kovarianzmatrizen.,” ETH Zurich, 1981.

Donoho and D. L., “Breakdown properties of multivariate location estimators,” Tech. report, Harvard Univ. Boston. URL http//www-stat. stanford~…, 1982.

D. and others Verardi, Vincenzo and Gassner, Marjorie and Ugarte, “Robustness for dummies,” ECARES Work. Pap., 2012.

C. Verardi, Vincenzo and Vermandele, “Univariate and multivariate outlier identification for skewed or heavy-tailed distributions,” Stata J., vol. 18, pp. 517–532, 2018.

S. John and Weisberg, An R companion to applied regression. 2018.

Y. V. Salibi.an-Barrera M., “A fast algorithm for S-regression estimates,” J. Comput. Graph. Stat., vol. 15, pp. 414–427, 2006.

Publicado

22-01-2021

Cómo citar

Ugarte Ontiveros, D., & Aparicio de Guzman, R. M. (2021). TÉCNICAS ROBUSTAS Y NO ROBUSTAS PARA IDENTIFICAR OUTLIERS EN EL ANÁLISIS DE REGRESIÓN. Revista Investigación &Amp; Desarrollo, 20(2). https://doi.org/10.23881/idupbo.020.2-3e

Número

Sección

Economía, Empresa y Sociedad