Mejora del indicador de retención en una universidad privada a partir de la clasificación de alumnos utilizando un modelo predictivo

dc.contributor.advisorSoto Rodríguez, Iván Dennys
dc.contributor.authorUribe Mostacero, Jean Pierre
dc.date.accessioned2023-06-19T18:07:12Z
dc.date.available2023-06-19T18:07:12Z
dc.date.issued2022
dc.descriptionUniversidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informáticaes_PE
dc.description.abstractLa presente investigación tiene propósito predecir la deserción estudiantil de una universidad privada, aplicando dos técnicas de la minería de datos la regresión logística binaria y árbol de clasificación CART. Para el estudio se utilizó datos la base de datos de alumnos en los periodos 2019-2 con 32176 registros con datos relacionados a factores socio-demográfica, académicos y económicos. Se aplicó el balanceo de datos con la técnica de submuestreo a fin de mejorar la capacidad predictiva. El árbol de clasificación CART resultó con mayores valores para la exactitud, sensibilidad, especificidad y AUC de 73,8%, 97,3%, 50,3% y 73,8% respectivamente para predecir la deserción universitaria en comparación de la regresión logística binaria cuyos valores fueron 66,4%, 71,2%, 65,8% y 72,4% respectivamente. El árbol resultó identificó las variables más importantes: TAS_NOM_A, TAS_NOM_P, SEDE, TAS_ASI_A; con un tamaño de 13 nodos, con siete nodos terminales, de los cuales tres para predecir la clase SI y cuatro para la clase NO; así mismo, obtuvo cuatro reglas de decisión asociadas a la clase que no se matriculan.es_PE
dc.description.abstractThe purpose of this research is to predict student dropout from a private university, applying two data mining techniques: binary logistic regression and CART classification tree. For the study, data was used from the student database in the period 2019-2 with 32,176 records with data related to socio-demographic, academic, and economic factors. Data balancing was applied with the subsampling technique in order to improve the predictive capacity. The CART classification tree resulted in higher values for accuracy, sensitivity, specificity, and AUC of 73.8%, 97.3%, 50.3%, and 73.8%, respectively, to predict college dropout compared to logistic regression. binary whose values were 66.4%, 71.2%, 65.8% and 72.4% respectively. The resulting tree identified the most important variables: TAS_NOM_A, TAS_NOM_P, SEDE, TAS_ASI_A; with a size of 13 nodes, with seven terminal nodes, of which three to predict the SI class and four to predict the NO class; likewise, he obtained four decision rules associated with the class that are not enrolled.es_PE
dc.formatapplication/pdfes_PE
dc.identifier.urihttps://hdl.handle.net/20.500.12996/5849
dc.language.isospaes_PE
dc.publisherUniversidad Nacional Agraria La Molinaes_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/es_PE
dc.subjectDeserción universitariaes_PE
dc.subject.ocdePendientees_PE
dc.titleMejora del indicador de retención en una universidad privada a partir de la clasificación de alumnos utilizando un modelo predictivoes_PE
dc.typeinfo:eu-repo/semantics/bachelorThesises_PE
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_PE
renati.advisor.dni07029635es_PE
renati.advisor.orcidhttps://orcid.org/0000-0002-4928-8362es_PE
renati.author.dni44449124es_PE
renati.discipline542026es_PE
renati.jurorSotomayor Ruiz, Rino Nicanor
renati.jurorFebres Huamán, Grimaldo José
renati.jurorMeza Rodríguez, Aldo Richard
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesionales_PE
renati.typehttps://purl.org/pe-repo/renati/type#trabajoDeSuficienciaProfesionales_PE
thesis.degree.disciplineEstadística e Informáticaes_PE
thesis.degree.grantorUniversidad Nacional Agraria La Molina. Facultad de Economía y Planificaciónes_PE
thesis.degree.nameIngeniero Estadístico Informáticoes_PE

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
uribe-mostacero-jean-pierre.pdf
Size:
1.71 MB
Format:
Adobe Portable Document Format
Description:
Texto completo
Name:
Informe originalidad.pdf
Size:
275.05 KB
Format:
Adobe Portable Document Format
Description:
Informe originalidad
Name:
Autorización.pdf
Size:
2.11 MB
Format:
Adobe Portable Document Format
Description:
Autorización

License bundle

Now showing 1 - 1 of 1
Name:
license.txt
Size:
1.63 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections