Identificación de clientes en campañas para una entidad financiera usando el método Stacking

dc.contributor.advisorMiranda Villagómez, Clodomiro Fernando
dc.contributor.authorAlvarez Chancasanampa, Julio César
dc.coverage
dc.date.accessioned2022-11-04T15:42:44Z
dc.date.available2022-11-04T15:42:44Z
dc.date.issued2022
dc.descriptionUniversidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática
dc.description.abstractLa presente investigación, tiene como objetivo general determinar si el método de ensamble Stacking predice con mayor precisión a los clientes potenciales a quienes se les otorgará o desembolsará préstamos en las ofertas de campaña de una entidad financiera, que los algoritmos de aprendizaje supervisado de Machine Learning: Random Forest, Regresión Logística y Árbol de Decisión. La evaluación se realizó comparando el método Stacking con los modelos individuales de Regresión Logística, Árbol de Decisión y Random Forest. Para dicha evaluación se usaron los indicadores Auc, Gini, Logloss y Kolmogorov. Los resultados de sensibilidad en orden de importancia que se obtuvieron con los modelos estadísticos fueron lo siguiente: Regresión Logística 88.9%, seguido del método Stacking con 87.9%, luego el Árbol de Decisión con un 84% y por último Random Forest con un 82.7%. Mientras, que al evaluar la especificidad el de mayor importancia fue el modelo de Random Forest con un 84.8%, Árbol de Decisión 82.8%, método Stacking 81.6% y por último Regresión Logística 78.4%. Respecto a los indicadores evaluados, el que presentó mayor Auc es el método Stacking 0.9117, seguido de Random Forest con un 0.9074, la Regresión Logística reportó un 0.9064 y Árbol de Decisión 0.9074. Con respecto al indicador Gini, el que tiene mayor Gini es el método de Stacking con 0.8235, seguido de Random Forest con un 0.8148, la Regresión Logística cuyo resultado fue de 0.8128 y en última posición el Árbol de Decisión con 0.7885. Con relación al indicador Logloss, el que mostró mejor desempeño fue el método Stacking con 0.3177, seguido de Random Forest con 0.3435, Árbol de Decisión 0.3886 y Regresión Logística 0.3959. Finalmente, con respecto al indicador Kolmogorov, el que tiene mejor resultado es el método Stacking con 0.7124, seguido por Random Forest con 0.7028, Árbol de Decisión 0.6907 y por último la Regresión Logística con 0.6751.
dc.description.abstractThe general objective of this research is to determine if the Stacking assembly method predicts with greater precision the potential clients who will be granted or disbursed loans in the campaign offers of a financial institution, than the Machine Learning supervised learning algorithms. : Random Forest, Logistic Regression and Decision Tree. The evaluation was carried out by comparing the Stacking method with the individual models of Logistic Regression, Decision Trees and Random Forest. For this evaluation were used the indicators Auc, Gini, Logloss and Kolmogorov. The results obtained with the confusion matrix were: the Logistic Regression presents greater sensitivity with 88.9%, followed by the Stacking method with 87.9%, then the Decision Tree with 84% and finally Random Forest was 82.7%. While, in the specificity the highest is Random Forest 84.8%, Decision Tree 82.8%, the stacking method 81.6% and finally Logistic Regression 78.4%. Respect to the evaluated indicators, the one with the greatest Auc is the method Stacking 0.9117, followed Random Forest with a 0.9074, Logistic regression reported a 0.9064 y Decision tree with a 0.9074. Also, the one with the greatest Gini is the method of Stacking with 0.8235, followed Random Forest with a 0.8148, the Logistic regression whose result was 0.8128 and Decision tree result 0.7885. Regarding, the indicator Logloss showed better performance is the stacking method 0.3177, then Random Forest 0.3435, Decision tree 0.3886 y Logistic regression 0.3959. Finally, the Kolmogorov indicator, the one with the best indicator is the stacking method 0.7124, followed by Random Forest 0.7028, Decision tree 0.6907 and finally Logistic regression 0.6751.
dc.formatapplication/pdf
dc.identifier.urihttps://hdl.handle.net/20.500.12996/5489
dc.language.isospa
dc.publisherUniversidad Nacional Agraria La Molina
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectMétodo Stacking
dc.subjectDesarrollo económico
dc.subjectInstituciones financieras
dc.subjectLima Metropolitana
dc.subjectMétodos estadísticos
dc.subjectPerú
dc.subjectPolítica monetaria
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#4.05.00
dc.titleIdentificación de clientes en campañas para una entidad financiera usando el método Stacking
dc.typeinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/publishedVersion
renati.advisor.dni08427218
renati.advisor.orcidhttps://orcid.org/0000-0002-5776-2749
renati.author.dni41943627
renati.discipline542026
renati.jurorRosas Villena, Fernando René
renati.jurorFebres Huamán, Grimaldo José
renati.jurorSoto Rodríguez, Iván Dennys
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesional
renati.typehttps://purl.org/pe-repo/renati/type#tesis
thesis.degree.disciplineEstadística e Informática
thesis.degree.grantorUniversidad Nacional Agraria La Molina. Facultad de Economía y Planificación
thesis.degree.nameIngeniero Estadístico Informático

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
alvarez-chancasanampa-julio-cesar.pdf
Size:
1.55 MB
Format:
Adobe Portable Document Format
Description:
Texto completo
Name:
Informe originalidad.pdf
Size:
921.79 KB
Format:
Adobe Portable Document Format
Description:
Informe originalidad
Name:
Autorización.pdf
Size:
714.26 KB
Format:
Adobe Portable Document Format
Description:
Autorización

License bundle

Now showing 1 - 1 of 1
Name:
license.txt
Size:
1.63 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections