Identificación de variables asociadas a la desnutrición crónica infantil mediante CatBoost y LightGBM, región sierra, 2021–2023
| dc.author.orcid | https://orcid.org/0009-0007-0925-4620 | |
| dc.contributor.advisor | López de Castilla Vásquez, Carlos | |
| dc.contributor.author | Huarcaya Quinteros, Katja Joselyn | |
| dc.date.accessioned | 2026-06-11T19:49:06Z | |
| dc.date.available | 2026-06-11T19:49:06Z | |
| dc.date.issued | 2026 | |
| dc.description | Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática | |
| dc.description.abstract | Este Trabajo de Suficiencia Profesional (TSP) tuvo como objetivo identificar las variables predictoras más influyentes en la DCI en niños de 6 a 59 meses de edad, residentes en la región Sierra, utilizando información proveniente de la Encuesta Demográfica y de Salud Familiar (ENDES) durante el periodo 2021-2023. Para tal fin, se emplearon dos modelos avanzados de aprendizaje automático: Categorical Boosting (CatBoost) y Light Gradient Boosting Machine (LightGBM). Ambos modelos fueron evaluados mediante métricas de desempeño como precision, recall, f1-score y accuracy, así como mediante valores SHAP (SHapley Additive Explanations) para la interpretación de la importancia de las variables predictoras. Los resultados evidenciaron que el modelo LightGBM obtuvo un mejor desempeño en la detección de casos reales de desnutrición, con un recall de 0.70, lo que indica una mayor capacidad para identificar niños en riesgo, mientras que el modelo CatBoost presentó una mayor precisión (0.62), aunque con menor sensibilidad (0.20). Estas diferencias sugieren que, desde una perspectiva de salud pública, el modelo LightGBM resulta más adecuado para fortalecer los mecanismos de detección temprana de la desnutrición crónica infantil. El análisis de importancia de variables reveló que los factores más influyentes en la DCI fueron: el departamento de residencia, la talla de la madre, la talla al nacer, el nivel educativo materno, el nivel de anemia del menor y el grupo etario (especialmente de 6 a 23 meses). El presente estudio concluyó que los modelos basados en aprendizaje automático representan una herramienta valiosa para la identificación temprana de factores de riesgo y la focalización de políticas públicas, contribuyendo a la reducción sostenida de la DCI en la región Sierra. | |
| dc.description.abstract | This professional proficiency thesis aimed to identify the most influential predictive variables of chronic childhood malnutrition (stunting) among children aged 6 to 59 months residing in the Sierra region of Peru, using data from the Demographic and Family Health Survey (ENDES) for the period 2021–2023. To achieve this objective, two advanced machine learning models were employed: Categorical Boosting (CatBoost) and Light Gradient Boosting Machine (LightGBM). Model performance was evaluated using standard classification metrics—precision, recall, F1-score, and accuracy—and further interpreted through SHapley Additive exPlanations (SHAP) values to assess predictor importance. Results showed that LightGBM achieved superior performance in identifying true cases of stunting, with a recall of 0.70, indicating a stronger capacity to detect at-risk children. In contrast, CatBoost exhibited higher precision (0.62) but markedly lower sensitivity (0.20). These findings suggest that, from a public health perspective, LightGBM is better suited to enhance early detection mechanisms for chronic childhood malnutrition. The SHAP-based variable importance analysis revealed that the most influential predictors were department of residence, maternal height, birth length, maternal education level, child’s anemia status, and age group—particularly children aged 6 to 23 months. This study concludes that machine learning–based models make an excellent instrument for the early identification of risk factors and the targeted implementation of public policies, thereby contributing to the sustained reduction of chronic childhood malnutrition in the Sierra region. | |
| dc.format | application/pdf | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12996/7697 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Nacional Agraria La Molina | |
| dc.publisher.country | PE | |
| dc.rights | https://purl.org/coar/access_right/c_abf2 | |
| dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Desnutrición crónica infantil | |
| dc.subject | Niños | |
| dc.subject | Modelización | |
| dc.subject | Estadística | |
| dc.subject | Informática | |
| dc.subject | Salud | |
| dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#5.04.00 | |
| dc.title | Identificación de variables asociadas a la desnutrición crónica infantil mediante CatBoost y LightGBM, región sierra, 2021–2023 | |
| dc.type | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.version | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |
| renati.advisor.dni | 10149535 | |
| renati.advisor.orcid | https://orcid.org/0000-0001-7724-5522 | |
| renati.author.dni | 47560424 | |
| renati.discipline | 542026 | |
| renati.juror | Soto Rodríguez, Iván Dennys | |
| renati.juror | Sotomayor Ruiz, Rino Nicanor | |
| renati.juror | Coaquira Nina, Frida Rosa | |
| renati.level | https://purl.org/pe-repo/renati/level#tituloProfesional | |
| renati.type | https://purl.org/pe-repo/renati/type#trabajoDeSuficienciaProfesional | |
| thesis.degree.discipline | Estadística e Informática | |
| thesis.degree.grantor | Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación | |
| thesis.degree.name | Ingeniero Estadístico e Informático |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- huarcaya-quinteros-katja-joselyn.pdf
- Size:
- 2.35 MB
- Format:
- Adobe Portable Document Format
- Description:
- Texto completo
- Name:
- turnitin.pdf
- Size:
- 2.49 MB
- Format:
- Adobe Portable Document Format
- Description:
- Informe originalidad
- Name:
- autorizacion.pdf
- Size:
- 312.03 KB
- Format:
- Adobe Portable Document Format
- Description:
- Autorización
License bundle
1 - 1 of 1
- Name:
- license.txt
- Size:
- 1.63 KB
- Format:
- Item-specific license agreed upon to submission
- Description:

