Mejora del indicador de retención en una universidad privada a partir de la clasificación de alumnos utilizando un modelo predictivo

dc.contributor.advisorSoto Rodríguez, Iván Dennys
dc.contributor.authorUribe Mostacero, Jean Pierre
dc.date.accessioned2023-06-19T18:07:12Z
dc.date.available2023-06-19T18:07:12Z
dc.date.issued2022
dc.descriptionUniversidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática
dc.description.abstractLa presente investigación tiene propósito predecir la deserción estudiantil de una universidad privada, aplicando dos técnicas de la minería de datos la regresión logística binaria y árbol de clasificación CART. Para el estudio se utilizó datos la base de datos de alumnos en los periodos 2019-2 con 32176 registros con datos relacionados a factores socio-demográfica, académicos y económicos. Se aplicó el balanceo de datos con la técnica de submuestreo a fin de mejorar la capacidad predictiva. El árbol de clasificación CART resultó con mayores valores para la exactitud, sensibilidad, especificidad y AUC de 73,8%, 97,3%, 50,3% y 73,8% respectivamente para predecir la deserción universitaria en comparación de la regresión logística binaria cuyos valores fueron 66,4%, 71,2%, 65,8% y 72,4% respectivamente. El árbol resultó identificó las variables más importantes: TAS_NOM_A, TAS_NOM_P, SEDE, TAS_ASI_A; con un tamaño de 13 nodos, con siete nodos terminales, de los cuales tres para predecir la clase SI y cuatro para la clase NO; así mismo, obtuvo cuatro reglas de decisión asociadas a la clase que no se matriculan.
dc.description.abstractThe purpose of this research is to predict student dropout from a private university, applying two data mining techniques: binary logistic regression and CART classification tree. For the study, data was used from the student database in the period 2019-2 with 32,176 records with data related to socio-demographic, academic, and economic factors. Data balancing was applied with the subsampling technique in order to improve the predictive capacity. The CART classification tree resulted in higher values for accuracy, sensitivity, specificity, and AUC of 73.8%, 97.3%, 50.3%, and 73.8%, respectively, to predict college dropout compared to logistic regression. binary whose values were 66.4%, 71.2%, 65.8% and 72.4% respectively. The resulting tree identified the most important variables: TAS_NOM_A, TAS_NOM_P, SEDE, TAS_ASI_A; with a size of 13 nodes, with seven terminal nodes, of which three to predict the SI class and four to predict the NO class; likewise, he obtained four decision rules associated with the class that are not enrolled.
dc.formatapplication/pdf
dc.identifier.urihttps://hdl.handle.net/20.500.12996/5849
dc.language.isospa
dc.publisherUniversidad Nacional Agraria La Molina
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectDeserción universitaria
dc.subject.ocdePendiente
dc.titleMejora del indicador de retención en una universidad privada a partir de la clasificación de alumnos utilizando un modelo predictivo
dc.typeinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/publishedVersion
renati.advisor.dni07029635
renati.advisor.orcidhttps://orcid.org/0000-0002-4928-8362
renati.author.dni44449124
renati.discipline542026
renati.jurorSotomayor Ruiz, Rino Nicanor
renati.jurorFebres Huamán, Grimaldo José
renati.jurorMeza Rodríguez, Aldo Richard
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesional
renati.typehttps://purl.org/pe-repo/renati/type#trabajoDeSuficienciaProfesional
thesis.degree.disciplineEstadística e Informática
thesis.degree.grantorUniversidad Nacional Agraria La Molina. Facultad de Economía y Planificación
thesis.degree.nameIngeniero Estadístico Informático

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
uribe-mostacero-jean-pierre.pdf
Size:
1.71 MB
Format:
Adobe Portable Document Format
Description:
Texto completo
Name:
Informe originalidad.pdf
Size:
275.05 KB
Format:
Adobe Portable Document Format
Description:
Informe originalidad
Name:
Autorización.pdf
Size:
2.11 MB
Format:
Adobe Portable Document Format
Description:
Autorización

License bundle

Now showing 1 - 1 of 1
Name:
license.txt
Size:
1.63 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections