Mostrar el registro sencillo del ítem

dc.contributor.advisorChue Gallardo, Jorge
dc.contributor.authorMeza Rodríguez, Aldo Richard
dc.date.accessioned2018-04-25T18:28:05Z
dc.date.available2018-04-25T18:28:05Z
dc.date.issued2018
dc.identifier.otherE70.M49-T BAN UNALM
dc.identifier.urihttps://hdl.handle.net/20.500.12996/3245
dc.descriptionUniversidad Nacional Agraria La Molina. Escuela de Posgrado. Maestría en Estadística Aplicadaes_PE
dc.description.abstractLa presente investigación tiene como propósito aplicar y comparar el modelo de regresión logística y el algoritmo Adaboost en datos desbalanceados, esto a efecto de predecir la fuga de clientes en una empresa del sector de telefonía móvil. El algoritmo Adaboost se sustenta en el aprendizaje adaptativo al entrenar clasificadores débiles combinándolos en conjunto para obtener un clasificador cuyo rendimiento sea fuerte. En cuanto a la regresión logística su modelamiento se realizó estrictamente desde una perspectiva de minería de datos, donde la clasificación es el objetivo y el rendimiento se evaluó en un conjunto de validación. Ambas técnicas se compararon mediante dos procedimientos, el primero mediante métodos de muestreo (sub-muestreo, sobre-muestreo y SMOTE) y el segundo modificando y/o ajustando el algoritmo o función. Al trabajar con datos desbalanceados la tasa de error de clasificación es ineficiente, por lo que las medidas de desempeño para elegir al mejor modelo fueron la precisión, el recall (sensibilidad), el F-measure, y como medida principal el AUC a través de curvas ROC. Al formar modelos logísticos con los métodos de muestreo, las medidas de desempeño arrojaron resultados similares, lo mismo pasó al formar modelos con el algoritmo Adaboost, sin embargo al comparar la regresión logística (AUC=0.86) con el algoritmo Adaboost (AUC =0.93), este último tuvo el mejor desempeño. En cuanto al ajuste a nivel de algoritmo o función, en la regresión logística se trabajó de dos maneras, el primero (Logit Asym) incluyendo en la FDA un valor Kappa (k) y el segundo (Power Logit) un valor Lambda (λ), en ambos modelos se identificaron los valores óptimos de k (0.02) y λ (2.5), en cuanto al algoritmo Adaboost (Adaboost Asym) se ajustó el peso de la clase minoritaria cuyo costo de clasificación fue errónea. La comparación de estos tres modelos ajustados dio como mayor rendimiento al algoritmo Adaboost. Finalmente se realizó la validación cruzada con 10 iteraciones para todos los modelos dando resultados similares al método de retención. Realizada todas las comparaciones y las medidas de desempeño se concluye que el modelo óptimo para la predicción de fuga de clientes en la empresa de telefonía es el algoritmo Adaboostes_PE
dc.description.abstractThe purpose of this research is to apply and to compare the logistic regression model and the Adaboost algorithm in unbalanced data, the purposes of predict the customer churn in a company in the mobile telephony sector. The Adaboost algorithm is based on adaptive learning when training weak classifiers, combining them together to obtain a classifier whose performance is strong. In terms of logistic regression, its modeling was done strictly from a data mining perspective, where the classification is the objective and the performance was evaluated in a validation set. Both techniques were compared using two methods, the first using sampling methods (sub-sampling, oversampling and SMOTE) and the second modifying and / or adjusting the algorithm or function. When working with unbalanced data the classification error rate is inefficient, so the performance measures to choose the best model were accuracy, recall (sensitivity), F-measure, and as a main measure the AUC through ROC curves. When forming logistic models with the sampling methods, the performance measures yielded similar results, the same happened when forming models with the Adaboost algorithm, however when comparing the logistic regression (AUC = 0.86) with the Adaboost algorithm (AUC = 0.93), the latter had the best performance. Regarding the adjustment at the level of algorithm or function, the logistic regression was worked in two ways, the first (Logit Asym) including in the FDA a Kappa value (k) and the second (Power Logit) a Lambda value (λ), in both models the optimal values of k (0.02) and λ (2.5) were identified, in terms of the Adaboost algorithm (Adaboost Asym) the weight of the minority class whose cost of classification was erroneous was adjusted. The comparison of these three adjusted models gave the Adaboost algorithm a higher performance. Finally, cross validation was carried out with 10 iterations for all the models, giving similar results to the retention method. Once all the comparisons and measures of performance are concluded, it is concluded that the optimal model for the prediction of customer leakage in the telephone company is the Adaboost algorithmen_US
dc.description.uriTesises_PE
dc.formatapplication/pdfen_US
dc.language.isospaes_PE
dc.publisherUniversidad Nacional Agraria La Molinaes_PE
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.sourceUniversidad Nacional Agraria La Molinaes_PE
dc.sourceRepositorio institucional - UNALMes_PE
dc.subjectTelecomunicacioneses_PE
dc.subjectEmpresas privadases_PE
dc.subjectConsumidoreses_PE
dc.subjectMétodos estadísticoses_PE
dc.subjectAplicaciones del ordenadores_PE
dc.subjectEvaluaciónes_PE
dc.subjectPerúes_PE
dc.subjectRotación de clienteses_PE
dc.subjectRiesgo de fugaes_PE
dc.titlePredicción de fuga de clientes en una empresa de telefonía utilizando el algoritmo Adaboost desbalanceado y la regresión logística asimétricaes_PE
dc.typeinfo:eu-repo/semantics/masterThesisen_US
thesis.degree.disciplineEstadística Aplicadaes_PE
thesis.degree.grantorUniversidad Nacional Agraria La Molina. Escuela de Posgradoes_PE
thesis.degree.nameMagister Scientiae - Estadística Aplicadaes_PE
thesis.degree.levelMaestríaes_PE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#4.05.00es_PE


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess
Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess