Scientia et Technica Año XXVIII, Vol. 28, No. 01, enero-marzo de 2023. Universidad Tecnológica de Pereira
teniendo presente que estos guardan propiedades MCAR, ya
que las faltas se generan sin condiciones que impliquen un tipo
relación entre las faltas y los valores observadas. Bajo los
escenarios de simulación propuestos, el método de imputación
obtuvo buen desempeño, similar bajo todos los escenarios de
simulación, incluso en los escenarios donde se contaminó el
100% de los días.
Debido al reducido tamaño muestral para estimar las matrices
de covarianza con un tamaño relativamente grande de variables,
el estimador de encogimiento resultó ser una herramienta que
permitió generar mejores imputaciones, situación en la que se
prefirió perder la precisión del método con el fin de ganar
imputaciones con resultados lógicos. Podría ser de interés
estudiar si otras matrices objetivo mejoran el desempeño del
método.
Un estudio que se deriva de los resultados es la evaluación de
los test de Normalidad Multivariante y de MCAR, en las
condiciones que se evidenciaron en este trabajo, con 𝑝 ≈ 𝑛,
dadas las dificultades con la estimación de las matrices de
covarianzas.
Como se mencionó en la introducción, con los resultados
obtenidos se puede proponer que las observaciones horarias de
Journal of the American heart association. 2015. DOI:
10.1161/JAHA.115.002506.
[7] Beyea, J., Stellman, S. D., Teitelbaum, S., Mordukovich, I. and
Gammon, M. D. “Imputation method for lifetime exposure
assessment in air pollution epidemiologic studies”, Environmental
Health. 2013. DOI: 10.1186/1476-069X-12-62
[8] M. Lee, P. Koutrakis, B. Coull, I. Kloog. and J. Schwartz,, “Acute
effect of fine particulate matter on mortality in three Southeastern
states from 2007-2011”, Journal of exposure science &
environmental epidemiology, pp 173-179. 2015. DOI:
10.1038/jes.2015.47
[9] S. M. Taghavi-Shahri, A. Fassó, B. Mahaki and H. Amini,
“Concurrent spatiotemporal daily land use regression modeling and
missing data imputation of fine particulate matter using distributed
space time expectation maximization”, bioRxiv. DOI:
10.1101/354852
[10] J. Céspedes., J. Cuero and F. Hernández “Metodología para seguir
las concentraciones de aerosoles atmosféricos usando técnicas de
teledetección”, Universidad del Valle, Colombia. Sep. 2015.
[11] L. C. Chien, Y. A. Chen and H. L. Yu, “Lagged Influence of fine
particulate matter and geographic disparities on clinic visits for
children’s asthma in Taiwan”. International journal of
environmental research and public health. Abr. 2018. DOI:
10.3390/ijerph15040829
[12] D. Allison, “Quantitative Applications in the Social Sciences:
Missing data”. Univ. of Pennsylvania, Pensylvania P, USA, 2002.
DOI: 10.4135/9781412985079
[13] N. A. Zakira, and M. N. Noor, “Imputation methods for filling
missing data in urban air pollution data for Malaysia”. Urbanism,
��
2,
5
de cada día sean modeladas usando un proceso gaussiano
Arhitectură. Construcţii, Malaysia, Vol 9, No. 2, 2018.
[14] A. Caicedo and C. Jiménez, “Imputación basada en análisis de
ya que este se define como una generalización de la distribución
normal multivariada.
La ausencia de pruebas específicas de Normalidad
multivariante para los casos de con 𝑝 ≈ 𝑛 se convierten en una
potencial debilidad del procedimiento propuesto. Además, el
hecho de que el estimador máximo verosímil de la matriz de
covarianzas no sea admisible [27], implica que necesariamente
se debe pensar en alternativas para el contraste de hipótesis
sobre Normalidad multivariante, que puedan mejorar las
condiciones para el uso de la propuesta presentada en este
trabajo.
REFERENCIAS
[1] OMS, “9 de cada 10 personas en todo el mundo respiran aire
contaminado, pero más países están tomando medidas”,
Organización Mundial de la Salud. Ginebra Suiza, Comunicado de
prensa. Disponible: https://www.who.int/es/news/item/02-05-
2018-9-out-of-10-people-worldwide-breathe-polluted-air-but-
more-countries-are-taking-action, consultada en marzo 11, 2023
[2] IQAir, “PM2,5”, Actualización más reciente septiembre 22, 2015.
Disponible: https://www.iqair.com/newsroom/pm2-5 .
[3] Cao, Junji and Chow, Judith and Watson, John and Lee,
Shuncheng, “A brief history of PM2.5 and its adverse effects”.
Aerosol and Air Quality Research, Ene. 2013.
DOI:10.4209/aaqr.2012.11.0302
[4] Observatorio Nacional de Salud, “Carga de enfermedad ambiental
en Colombia”. Instituto Nacional de Salud (INS), pág. 96 Bogotá
D.C. Nov. 2018. Disponible:
https://www.ins.gov.co/Noticias/Paginas/Informe-Carga-de-
Enfermedad-Ambiental-en-Colombia.aspx
[5] M. E. Quinteros, S. Lu, C. Blazquez, J. P. Cárdenas-R Ossa, X.,
Delgado-Saborit, J. M., Harrison, R. M. and Ruiz-Rudolph, P.,
“Use of data imputation tools to reconstruct incomplete air quality
datasets: A case-study in Temuco, Chile”, Atmospheric
Environment 200, pp. 40-49. 2019. DOI:
10.1016/j.atmosenv.2018.11.053
[6] Pope III, C. A., J. B., Anderson, J. L., Cannon, J. B., Hales, N. M.,
Meredith, K. G., Le, V. and Horne, B. D., “Short-Term” exposure
to fine particulate matter air pollution is preferentially associated
with the risk of ST-Segment elevation acute coronary events”.
datos funcionales de observaciones faltantes de contaminación
atmosférica por partículas finas suspendidas en el aire (PM
2,5
)”.
Universidad del Valle, Colombia. 2016.
[15] A. Otero, and M. Presiga. “Evaluación de un método de imputación
basado en el Análisis de Datos Funcionales para los registros de
PM2.5 en la ciudad de Cali”. Trabajo de grado en Estadística,
Universidad del Valle, Colombia. Dic. 2019.
[16] G. G. Fernando. “Estimación de matrices de covarianzas: nuevas
perspectivas”, Universidad Nacional de Educación a Distancia,
España, 2014. Disponible: http://e-
spacio.uned.es/fez/eserv/bibliuned:masterMatavanz-
Fgodino/Documento.pdf
[17] J. Schäfer and K. Strimmer. “A shrinkage approach to large-scale
covariance matrix estimation and implications for functional
genomics”. Statistical applications in genetics and molecular
biology, vol. 4, Feb. 2005. DOI: 10.2202/1544-6115.1175
[18] J. Villaseñor and E. Gonzales, “A Generalization of Shapiro–Wilk's
Test for Multivariate Normality”. Communication in Statistics -
Theory and Methods, 2009. DOI: 10.1080/03610920802474465
[19] C. K., Enders “Applied Missing Data Analysis”. Univ. of
Pennsylvania, New York, NY, USA, 2010. Disponible:
http://hsta559s12.pbworks.com/w/file/fetch/52112520/enders.appl
ied
[20] Rubin and B. Donald, “Inference and missing data”. Biometrika
vol. 63 pp. 581-592. Oxford University Press, 1976. DOI:
10.2307/2335739
[21] Little and J. A. Roderick, “A Test of Missing Completely at
Random for Multivariate Data with Missing Values”, Journal of the
American Statistical Association, vol. 83, pp. 1198 - 1202. Dic.
1988. DOI: 10.1080/01621459.1988.10478722
[22] Mardia and V. Kanti, “Measures of multivariate skewness and
kurtosis with applications”, Biometrika vol. 57, no. 3, pp. 519-530,
Dic. 1, 1970. DOI: 10.1093/biomet/57.3.519
[23] DAGMA, “Sistema de Vigilancia de Calidad del Aire de Cali -
SVCAC” Cali, Colombia, acceso: Julio 2020.
[24] R Core Team, “R: A Language and Environment for Statistical
Computing” Viena, Austria. 2020
URL: https://www.R-project.org
[25] RStudio Team (2020). RStudio: Integrated Development for R.
RStudio, PBC, Boston, MA URL: http://www.rstudio.com/.
[26] J. Schäfer and R. Opgen-Rhein and V, Zuber and M. Ahdesmaki
and P.D. Silva and K. Strimmer (Maintainer). “Package corpcor”.
R Package Versión 1.6.9. Ene. 4, 2017. DOI: 10.2202/1544-
6115.1175