EPL-EI Tesis
Permanent URI for this collectionhttps://hdl.handle.net/20.500.12996/151
Browse
Recent Submissions
Item Open Access Aplicación del algoritmo k-means para la segmentación de clientes de un holding gastronómico en el PerúPacush Gomez, Sheyla Aurea (2026, Universidad Nacional Agraria La Molina)El presente estudio analiza el comportamiento de los clientes de un holding gastronómico del Perú con el propósito de identificar segmentos homogéneos que permitan optimizar las estrategias comerciales y de marketing. Para ello, se trabajó con información transaccional correspondiente al segundo trimestre del año 2025. Se aplicaron técnicas de análisis descriptivo, identificación de outliers multivariados, evaluación de correlaciones y estandarización de variables. La investigación se desarrolló bajo un enfoque cuantitativo, con un diseño no experimental y transversal. Para la segmentación, se empleó el algoritmo de aprendizaje no supervisado k-means, y la determinación del número óptimo de grupos se realizó mediante el coeficiente de silueta, el cual identificó k = 3 como la mejor estructura de segmentación. El algoritmo permitió clasificar a los clientes en tres segmentos: Clientes presenciales tradicionales de baja actividad, Clientes multicanal de alto valor, Clientes digitales ocasionales. Las conclusiones del estudio evidencian que el algoritmo aplicado es una herramienta eficaz para la segmentación de clientes, ya que los grupos formados mostraron diferencias claras en las variables analizadas, lo cual fue corroborado mediante análisis de varianzas. Los resultados ofrecen una visión integral y accionable del comportamiento de los clientes, permitiendo a la empresa diseñar estrategias personalizadas de fidelización, reactivación y optimización comercial. Asimismo, el estudio demuestra la utilidad de la analítica avanzada y la integración de datos como herramientas clave para la toma de decisiones estratégicas en organizaciones con alto volumen transaccional.Item Open Access Segmentación de clientes mediante el modelo RFM para optimizar estrategias de marketing en una empresa de distribución tecnológicaCaballero Quispe, Ricardo Sergei (2026, Universidad Nacional Agraria La Molina)En las últimas décadas, el crecimiento exponencial de los datos y la capacidad para analizarlos eficazmente se han convertido en factores determinantes para la competitividad empresarial. Transformar los datos en conocimiento constituye hoy una de las principales fuentes de ventaja competitiva. Permite a las empresas anticiparse a las necesidades del mercado, conocer mejor a sus clientes y tomar decisiones sustentadas en evidencia. El presente trabajo tuvo como propósito desarrollar una segmentación de clientes mediante el modelo RFM (Recencia, Frecuencia y Valor Monetario) en una empresa peruana dedicada a la distribución tecnológica que opera bajo un enfoque B2B (Business to Business). Esta metodología permitió clasificar a los clientes según su comportamiento de compra, identificando aquellos de mayor valor y facilitando el diseño de estrategias de marketing más precisas y efectivas. Se utilizaron datos transaccionales correspondientes al periodo enero–diciembre de 2024, almacenados en un entorno SQL Server y posteriormente analizados en R Studio. A partir del cálculo de las variables recencia, frecuencia y monto, se asignaron puntuaciones basadas en percentiles y se definieron segmentos accionables. Los resultados permitieron identificar distintos grupos de clientes, como Clientes de Valor, Potenciales, En riesgo y Perdidos, cada uno con características y patrones de comportamiento diferenciados. Este enfoque contribuyó a optimizar los esfuerzos comerciales de la empresa, priorizando la fidelización de los clientes más valiosos y la reactivación de aquellos con menor frecuencia de compra.Item Open Access Implementación de un modelo de propensión para el cambio de línea prepago a postpago en una empresa de telecomunicacionesAroni Rios, Alfredo Junior (2025, Universidad Nacional Agraria La Molina)Las empresas de telefonía móvil ubicadas en el Perú cuentan con el gran reto de lograr migrar a sus clientes con un plan prepago a postpago. Para ello utilizan canales como el call center quienes contactan a los clientes prepago y se les ofrece la migración de su plan a postpago. Debido a esto, este trabajo busca implementar un modelo de propensión que mejore la efectividad de la base seleccionada que se envía al call center para la campaña de migraciones mediante la identificación de la probabilidad a migrar. Se utilizó el algoritmo LightGBM para calcular la propensión, así mismo, se segmentó en deciles para que el negocio lo pueda utilizar como una alternativa a la selección tradicional donde solo se usan tres variables: recargas, tráfico de datos y tráfico de minutos. El modelo logro alcanzar un AUC de 0.68 en un nuevo mes, llamado periodo de validación. Así mismo, se logró probar el modelo durante 6 meses en un porcentaje de la base enviada al call center. Dando como resultados que el grupo seleccionado por el modelo obtenga una mayor tasa de conversión respecto a la selección tradicional. El incremento de la tasa de conversión de migraciones alcanza mas de 0.9% en promedio de manera mensual. Por lo que el modelo propuesto optimiza y simplifica la selección tradicional de la base enviada al call center para las migraciones a postpago. Además, se valida que contribuye a la mejora de la tasa de conversión y por ende a la cantidad de migraciones logradas por dicho canal.Item Open Access Determinación de la cantidad óptima de personal retén en servicios de limpieza con ausentismo laboral mediante el método Monte CarloGámez Castillo, Carlos Alexander (2025, Universidad Nacional Agraria La Molina)El trabajo tuvo como objetivo determinar la cantidad óptima de personal retén necesario para garantizar la cobertura operativa ante ausencias laborales en el turno tarde de un centro hospitalario atendido por SILSA. Para ello se analizaron los puestos no cubiertos (PNC), se diseñó un modelo de simulación aplicando el método de Monte Carlo para estimar escenarios futuros de ausentismo y se evaluó el impacto económico de las penalidades asociadas a la falta de cobertura. La metodología fue cuantitativa, no experimental y longitudinal, basada en datos diarios de asistencia del turno tarde recopilados entre febrero y septiembre de 2025. Se realizó una depuración de outliers mediante el rango intercuartílico y posteriormente se evaluó el ajuste de los datos a distintas distribuciones de conteo. Debido a la sobredispersión identificada, la cantidad de puestos no cubiertos se ajustó a una distribución Binomial Negativa, cuyos parámetros permitieron generar 1,000 escenarios de 30 días cada uno mediante el método de Monte Carlo. El nivel de cobertura objetivo fue 98.5%, establecido por SILSA como estándar operativo. Los resultados muestran que, con los datos depurados (222 días) y usando los parámetros estimados de una Binomial Negativa, la cantidad óptima de personal retén es de 26 trabajadores, lo que permite obtener una cobertura promedio de 98.72%. En términos económicos, incrementar la cobertura a 98.5% generaría una reducción aproximada del 38.2% en penalidades. Se concluyó que la simulación usando el método de Monte Carlo, combinada con un ajuste paramétrico adecuado, proporcionó una herramienta sólida para estimar requerimientos de personal y tomar decisiones operativas basadas en evidencia, mejorando la eficiencia, la calidad del servicio y la sostenibilidad financiera de SILSA.Item Open Access Identificación de variables asociadas a la desnutrición crónica infantil mediante CatBoost y LightGBM, región sierra, 2021–2023Huarcaya Quinteros, Katja Joselyn (2026, Universidad Nacional Agraria La Molina)Este Trabajo de Suficiencia Profesional (TSP) tuvo como objetivo identificar las variables predictoras más influyentes en la DCI en niños de 6 a 59 meses de edad, residentes en la región Sierra, utilizando información proveniente de la Encuesta Demográfica y de Salud Familiar (ENDES) durante el periodo 2021-2023. Para tal fin, se emplearon dos modelos avanzados de aprendizaje automático: Categorical Boosting (CatBoost) y Light Gradient Boosting Machine (LightGBM). Ambos modelos fueron evaluados mediante métricas de desempeño como precision, recall, f1-score y accuracy, así como mediante valores SHAP (SHapley Additive Explanations) para la interpretación de la importancia de las variables predictoras. Los resultados evidenciaron que el modelo LightGBM obtuvo un mejor desempeño en la detección de casos reales de desnutrición, con un recall de 0.70, lo que indica una mayor capacidad para identificar niños en riesgo, mientras que el modelo CatBoost presentó una mayor precisión (0.62), aunque con menor sensibilidad (0.20). Estas diferencias sugieren que, desde una perspectiva de salud pública, el modelo LightGBM resulta más adecuado para fortalecer los mecanismos de detección temprana de la desnutrición crónica infantil. El análisis de importancia de variables reveló que los factores más influyentes en la DCI fueron: el departamento de residencia, la talla de la madre, la talla al nacer, el nivel educativo materno, el nivel de anemia del menor y el grupo etario (especialmente de 6 a 23 meses). El presente estudio concluyó que los modelos basados en aprendizaje automático representan una herramienta valiosa para la identificación temprana de factores de riesgo y la focalización de políticas públicas, contribuyendo a la reducción sostenida de la DCI en la región Sierra.Item Open Access Modelo predictivo para la priorización de no clientes en call center de una empresa de telecomunicaciones en PerúGiurfa Llontop, Heidy Yadira (2026, Universidad Nacional Agraria La Molina)El presente trabajo desarrolla un modelo predictivo de contactabilidad para prospectos no clientes en campañas de televentas salientes (outbound) del call center de una empresa del sector telecomunicaciones en el Perú. Ante la baja eficiencia operativa que caracteriza este tipo de campañas, se plantea la aplicación de técnicas de machine learning que permitan identificar a los prospectos más propensos a responder llamadas telefónicas, optimizando así el uso de recursos humanos y tecnológicos en la operación comercial. Para el desarrollo del modelo se utilizó el algoritmo LightGBM, con validación cruzada estratificada (5-fold) y optimización de hiperparámetros mediante Optuna. El conjunto de datos incluyó variables de tráfico de voz, historial de interacción, banderas comerciales y atributos de interés previo (consultas de portabilidad, campañas winback, entre otros). Se abordó el desbalance de clases utilizando la función interna is_unbalance=True. La evaluación del modelo mostró un desempeño sólido, con un AUC promedio de 0.83, PR-AUC de 0.05 y Brier Score de 0.0042, reflejando buena capacidad discriminativa y excelente calibración probabilística. La interpretación del modelo mediante SHAP permitió identificar variables predictoras clave como CAM_WB (camada de clientes winback), CAM_PCO (camadas de clientes que hicieron una preevaluación) y LLAMADAS_ANT_1 (Cantidad de Llamadas efectuadas el mes anterior). Además, se propuso un sistema de priorización basado en deciles de score predictivo, donde el primer decil alcanzó un lift de 5.39, lo que implica una efectividad más de cinco veces superior respecto a una estrategia sin ordenamiento. Este hallazgo respalda la viabilidad operativa del modelo y su impacto potencial en la mejora de la tasa de conversión del canal telefónico. Se concluye que la implementación de esta solución permitiría reducir costos operativos, incrementar la tasa de contacto efectivo y aumentar las conversiones, posicionando al modelo como una herramienta estratégica para campañas comerciales de captación.Item Open Access Pronóstico del número de casos de infecciones respiratorias agudas por semana epidemiológica en la red AUNA – Lima, PerúDiaz Marzano, Diego (2026, Universidad Nacional Agraria La Molina)El trabajo aborda un problema de vigilancia epidemiológica en Perú: las IPRESS deben reportar semanalmente los casos de Infección Respiratoria Aguda (IRA) al sistema nacional, pero muchas carecen de herramientas eficientes, lo que genera retrasos, errores y sobrecarga operativa. Para solucionarlo, se desarrolló una herramienta predictiva basada en análisis de series de tiempo, utilizando datos históricos de IRA (2022-2024) de una red de clínicas de Lima. Los datos fueron extraídos desde la nube (AWS Athena), depurados para evitar duplicados (considerando que un cuadro de IRA dura hasta 14 días) y agregados por semana epidemiológica. El análisis exploratorio mostró una marcada estacionalidad anual, con picos en invierno y una serie no estacionaria, confirmada por los gráficos ACF y PACF, que revelaron un patrón estacional cada 52 semanas. Se evaluaron tres modelos SARIMA, seleccionando el mejor mediante el criterio AIC y validando su precisión con RMSE y MAE. El modelo ganador fue SARIMA(0,1,1)(0,1,1)₅₂, con un AIC de 573.13 y un RMSE de 65.72 casos, destacando por su equilibrio entre simplicidad y capacidad predictiva. El modelo se integró en un dashboard de Power BI con Python, automatizando la extracción y generación de pronósticos semanales para 2025 y 2026. Las predicciones anticipan picos entre las semanas 21 y 27 (junio-julio), permitiendo planificar recursos con antelación. En conclusión, el modelo SARIMA demostró ser una solución robusta, precisa y fácil de interpretar para equipos de salud, transformando datos clínicos en inteligencia accionable para la salud pública.Item Open Access Predicción del riesgo de incumplimiento en los pagos de préstamos personales de una institución financiera mediante el algoritmo LGBMFlores Ihuaraqui, Diego Guillermo (2025, Universidad Nacional Agraria La Molina)El presente trabajo de investigación muestra un estudio exhaustivo sobre la mejora en la predicción del riesgo de incumplimiento en los pagos de préstamos personales, utilizando el algoritmo LightGBM (LGBM). El objetivo general fue desarrollar un modelo capaz de predecir con alta precisión el riesgo de incumplimiento mediante el uso de este algoritmo. Para alcanzar este objetivo, se empleó una metodología estructurada basada en CRISP-DM, que facilitó un enfoque sistemático y efectivo en la resolución del problema. La metodología incluyó la recopilación de datos históricos de préstamos, la implementación del modelo LGBM, y la evaluación de su rendimiento utilizando principalmente indicadores como el Accuracy balanceado, F1-score y el recall. Además, se realizó una comparación del nuevo modelo entrenado con LGBM frente a un modelo previo basado en Regresión logística. Los resultados del estudio revelaron que el modelo LGBM alcanzó un Accuracy Balanceado de 75%, F1-score de 39%, y un recall de 73% en el conjunto de prueba. Estos resultados indicaron una capacidad superior del modelo de machine learning para identificar el riesgo de incumplimiento en comparación con el modelo anterior y otros enfoques tradicionales. Se concluye por lo tanto que los indicadores del modelo LGBM no solo mejoraron significativamente la precisión en la predicción del riesgo de morosidad, sino que también superaron a los métodos previos tradicionales en términos de rendimiento. Este hallazgo valida la efectividad del algoritmo LGBM en la gestión del riesgo crediticio y sugiere su implementación a largo plazo para optimizar la toma de decisiones en la entidad financiera. El presente estudio también recomienda la evaluación continua del modelo y la exploración de otros algoritmos avanzados para seguir mejorando la precisión y adaptabilidad del sistema de predicción de riesgos.Item Open Access Aplicación del algoritmo k-means para la detección de lavado de activos en una empresa de segurosRivera Berrios, Devlin Nevile (2024, Universidad Nacional Agraria La Molina)Este Trabajo de Suficiencia Profesional (TSP) se enfoca en la implementación del algoritmo de clustering k-means para la identificación de transacciones anómalas en las primas de una empresa de seguros, con el objetivo de fortalecer la prevención de lavado de activos. La investigación clasifica pólizas en distintos niveles de riesgo, segmentando los datos en función del monto de la prima y el tamaño de la empresa. Esta metodología permite diferenciar patrones de comportamiento regular y casos atípicos que requieren una evaluación adicional. El análisis de datos históricos de pólizas facilitó la creación de tres clusters bien definidos. El primer cluster representó la mayoría de las transacciones, indicando un comportamiento típico y estable en la asignación de primas. En contraste, los clusters restantes presentaron valores de prima significativamente altos y baja frecuencia, lo que sugiere que corresponden a casos anómalos. Esta segmentación proporcionó una estructura sólida para identificar y monitorear transacciones inusuales en la empresa. Las conclusiones del estudio destacan que el algoritmo k-means es una herramienta eficaz para la gestión de riesgos en el sector asegurador, ya que permite una clasificación precisa de las transacciones y optimiza el uso de recursos en el proceso de supervisión. Además, las recomendaciones proponen implementar esta metodología de manera periódica y realizar ajustes continuos en los parámetros del modelo para asegurar su relevancia en el tiempo, mejorando así la capacidad de respuesta ante posibles casos de lavado de activos.Item Open Access Detección del fraude financiero en transferencias provenientes del exterior a empresas peruanas utilizando el algoritmo Isolation ForestMallaupoma León, María Teresa (2024, Universidad Nacional Agraria La Molina)En la actualidad, el lavado de activos es un problema recurrente que afecta al sector financiero, generando serios conflictos económicos. Uno de los principales desafíos es el incremento en el volumen de transacciones fraudulentas, lo que ha hecho que la detección temprana y eficaz de estas actividades anómalas sea una prioridad para las instituciones bancarias. Estas buscan proteger la integridad de sus operaciones y mantener la confianza de sus clientes. En la Gerencia de Cumplimiento, específicamente en el área de Analytics, nuestro objetivo es alertar de manera inmediata sobre cualquier tipo de fraude financiero mediante el uso de metodologías y algoritmos estadísticos, que nos permitan identificar con precisión a los clientes involucrados en actividades fraudulentas. En el presente trabajo se empleó el algoritmo Isolation Forest para detectar fraudes financieros cometidos por clientes (empresas nacionales) que recibieron transferencias internacionales de montos significativos. Los resultados del modelo mostraron un índice de silueta del 0.96, y el 48% de las alertas generadas derivaron en investigaciones formales, lo que representa un porcentaje relevante para la Gerencia de Cumplimiento del banco.Item Open Access Predicción de la velocidad de ventas de un proyecto inmobiliario utilizando el modelo VARMAHerrera Chavez, Miguel Angel (2024, Universidad Nacional Agraria La Molina)Este Trabajo de Suficiencia Profesional (TSP) tiene como objetivo principal predecir la velocidad de ventas de un proyecto inmobiliario en Miraflores, Lima, mediante el modelo VARMA. La predicción precisa es crucial para asegurar el financiamiento bancario, ya que se requiere vender el 20% de las unidades antes de que el banco desembolse los fondos para la construcción. Esto es fundamental para la activación del proyecto y su viabilidad económica. El enfoque metodológico se basa en el análisis de series de tiempo utilizando datos históricos de ventas proporcionados por la Asociación de Empresas Inmobiliarias (ASEI). Estos datos incluyen 710 departamentos de 15 proyectos, entre ellos 14 competidores directos. Anteriormente, la estimación de la velocidad de ventas se hacía a través del juicio de expertos, lo que generaba incertidumbre. El modelo VARMA ofrece una herramienta más robusta al basarse en patrones históricos y análisis estadísticos avanzados. Implementar correctamente este modelo reduce significativamente el riesgo de no cumplir con los objetivos de ventas, lo que retrasaría la activación del proyecto y el desembolso del financiamiento. El estudio también busca optimizar las estrategias de precios y mejorar la planificación de ventas, brindando mayor seguridad en la gestión financiera de las empresas desarrolladoras. En última instancia, los resultados de esta investigación contribuirán a una planificación más eficiente de futuros proyectos inmobiliarios, asegurando su sostenibilidad y éxito financiero. La aplicación del modelo VARMA representa un avance significativo en la predicción de ventas, ayudando a que los proyectos cumplan con los hitos financieros clave.Item Open Access Sistema de información para optimización de la equidad remunerativa del capital humano en una empresa de consultoríaArmijo Carrillo, Renzo Carlo (2024, Universidad Nacional Agraria La Molina)El presente trabajo de suficiencia profesional tuvo como objetivo principal desarrollar un sistema de información para la optimización de la equidad remunerativa del capital humano en una empresa de consultoría. La necesidad surge debido a la alta demanda de servicios, los análisis de datos se realizaban de manera manual, lo que ralentizaba la obtención de resultados, por eso se propuso un sistema que automatice el proceso, verificando el cumplimiento de la equidad remunerativa de los empleados, tal como plantea la Ley 30709. Para ello se detallan las fases del desarrollo del sistema, así como la generación de gráficos que permiten visualizar información relevante, como el incumplimiento de los criterios de equidad remunerativa entre hombres y mujeres, utilizando la prueba no paramétrica de Wilcoxon de acuerdo a las bandas salariales. Así mismo, se incluyen resúmenes estadísticos de sueldos de empleados y su distribución, analizada mediante una regresión exponencial. La herramienta principal fue el lenguaje R en el entorno RStudio, lo que permitió crear la lógica del sistema además del diseño de los informes interactivos. Se obtuvo como resultado un sistema de información que permitió optimizar la equidad remunerativa en la empresa consultora, mediante los indicadores ya mencionados, concluyendo que este, pudo atender la alta demanda y suplir los puntos débiles que tenía la empresa en este aspecto.Item Open Access Diseño de un sistema electronico para soportar las adquisiciones y contrataciones públicasPalomino Monteagudo, Cesar Augusto (2010, Universidad Nacional Agraria La Molina)El estado peruano invierte más de 6,000 millones de dólares americanos al año en las adquisiciones y contrataciones, inversión que se realiza a través de alrededor de 2, 730 entidades públicas contratantes, provenientes del gobierno central, regional y local o municipal, las mismas que se encuentran distribuidas a lo largo y ancho del Perú. Es importante señalar que cerca del 60% del presupuesto de contrataciones se encuentra en Lima y el resto se distribuye en las demás regiones del país. En países de la región el uso de estos sistemas electrónicos de contratación aunados a modalidades nuevas como son la Subasta Inversa Electrónica y las compras o contrataciones a través de un catálogo electrónico de productos (Electronic Market Place), han dado márgenes de ahorro en la contratación que oscilan entre el 5% y 1 0% de sus presupuestos, más allá de que estos sistemas eliminan la necesidad de publicar en los diarios de circulación nacional los avisos de convocatorias, prórrogas, fe de erratas, buenas pro y/o declaratorias de desierto. Si aplicamos estas tasas promedio de ahorro para nuestro país podríamos estar hablando de ahorros que oscilarían entre los 3 00 y 600 millones de dólares que bien pueden ser utilizados u orientados para cubrir necesidades en los campos de educación, salud o seguridad. En tal sentido, es necesario que el estado peruano cuente con un sistema electrónico basado en Internet, que le permita a las entidades públicas contratantes realizar los procesos de contratación de manera electrónica, dándole a los procesos de selección transparencia, eficiencia y efectividad, además facilitando la implementación de nuevas modalidades de contratación, como las mencionadas anteriormente y sobre todo permitiendo que se ejerza un control de la ciudadanía sin limitaciones, pues toda la información de los procesos de contratación sería de acceso universal y gratuito. Por esto, el Perú no puede darse el lujo de no contar con un medio que permita hacer más transparente, efectiva y eficiente la ejecución de dichos fondos. En tal sentido el desarrollo del Sistema Electrónico de Adquisiciones y Contrataciones del Estado (SEACE) es el medio que más se acerca a garantizar la calidad del gasto y/o inversión en las contrataciones públicas. La versión actual del SEACE hasta mediados del 2009 ya contaba con más de nueve mil usuarios del sector público provenientes de todas las entidades públicas del país, y alrededor de cien mil usuarios del sector privado. Recíbe diariamente más de un millón de hits y su base de datos esta cercana a los dos terabytes. Es importante desatacar que para su desarrollo se utilizó una combinación de herramientas proveniente del desarrollo estructurado y de la orientación a objetos, tales como son los Casos de Uso, modelo de dominio y diagramas de clases, entre otros. El objetivo de esta monografía es mostrar los resultados técnicos del análisis y diseño del sistema electrónico de adquisiciones y contratacines del estado. Debo resaltar que gracias a la capacidad técnica y profesional, a la entrega y al esfuerzo de un grupo de trabajo multidisciplinario, se consiguió gradualmente su implantación en todo el aparato público y en todo el país.Item Open Access Análisis de la eficiencia de los algoritmos de encriptación RSA, DES, IDEA y AESVargas Campos, Kanebo (2002, Universidad Nacional Agraria La Molina)La encriptación o codificación se ha convertido en la técnica más segura, potente y eficiente para obtener confidencialidad así como la integridad y la disponibilidad de la información. A grandes rasgos se entiende que mantener la información segura (o fiable) consiste básicamente en garantizar tres aspectos: confidencialidad, integridad y disponibilidad. La confidencialidad nos dice que la información ha de ser accedidos únicamente por las personas autorizados a el; la integridad significa que la información sólo pueden ser modificados por las personas autorizados, y la disponibilidad indica que la información permanecer accesibles a las personas autorizados. Las técnicas o algoritmos de encriptación caen en el campo de la criptografía "Ciencia o técnica que permite proteger la información por medio de la aplicación de un método de encriptación". La criptografía tiene como base fundamental la matemática específicamente la aritmética modular, ya que nos permite entender los sistemas de codificación que utilizan los algoritmos para dar seguridad a la información. Por otro lado el criptoanálisis; es el estudio de las técnicas dedicadas a la obtención a partir de un texto encriptado el texto claro sin la debida autorización; es decir, trata de romper los criptosistemas (permite encriptar los mensajes de tal forma que una persona no autorizada no pueda desencriptar el mensaje) para apoderarse de la información encriptada. Los métodos de criptoanálisis más interesantes por sus resultados son: El análisis diferencial y el análisis lineal. A su vez la criptografía se divide en criptografía simétrica y asimetría. La criptografía simétrica utiliza una misma llave tanto para la encriptación como la desencriptación de la información; las técnicas simétricas estudiadas son; DES, IDEA Y AES. La criptografía asimétrica utiliza dos llaves; estas que son dependientes, una se utiliza para la encriptación y la otra para la desencriptación; la técnica asimétrica estudiada es el RSA. Para obtener la eficacia de cada algoritmo de encriptación estudiados se debe considerar sus respectivos parámetros de análisis, considerando estos parámetros al momento de la encriptación, entonces se obtendrán mensajes fuertemente encriptados. El algoritmo DES codifica mensajes de 64 bits de longitud con una clave de 64 bits. El algoritmo IDEA, codifica mensajes de 64 bits de longitud con una clave de 128 bits. El algoritmo AES, es muy variado en cuanto a la longitud de mensaje como de clave; 128, 196 ,256 bits de longitud. En el presente trabajo de tesis luego analizar la eficiencia; el algoritmo simétrico que brinda mayor seguridad y es considerado más potente por los diferentes conceptos que se utilizan en su proceso es el algoritmo AES, pero a la vez es el más complejo. Para el algoritmo RSA, se recomienda una clave de 1024 bits de longitud para garantizar la seguridad.Item Open Access Sistema de recomendación para rubros de consumo en una entidad financiera usando KNN RecommenderAllende Quintana, Ebson David (2024, Universidad Nacional Agraria La Molina)El presente trabajo de suficiencia profesional de Estadística e Informática se desarrolló con la información de un banco del sistema financiero peruano, banco que se ubica en los primeros lugares por su alta participación en la colocación de créditos directos en el sistema financiero peruano. Los directores orientaron sus esfuerzos y estrategias a transformar digitalmente al banco, en el proceso de transformación digital, uno de los pilares es la personalización de la comunicación con los clientes, comunicación tanto de ofertas como de beneficios, con la transformación digital, el banco mejoró en la aceptación de sus campañas (mejores ratios de efectividad de campañas), en la satisfacción de sus clientes (mayor NPS - Net Promote Score) y en la bancarización de más peruanos (crecimiento del 10% respecto al año anterior). El banco se apoyó en el uso de una herramienta estadística que le permitió direccionar sus acciones comerciales y de comunicación de manera personalizada. El rol que se desempeñó en el banco tuvo la misión de crear la herramienta estadística capaz de personalizar la comunicación de beneficios del banco a sus clientes, para lograrlo se desarrollaron las siguientes tareas: relevamiento de la problemática del negocio con los directores del banco, diagnóstico de la situación del negocio, mapeo de las fuentes de datos disponibles y necesarias para el desarrollo de la herramienta estadística, estructuración de las fuentes de datos, entrenamiento y validación del algoritmo de personalización KNN Recommender, medición del impacto al negocio, presentación al negocio y acompañamiento en la implementación de la solución en los sistemas digitales del banco.Item Open Access Clasificación de datos textuales provenientes de un streaming aplicando el método de representación de texto TF-IDF en una Regresión LogísticaFlores Cáceres, Fiorella Alexandra (2024, Universidad Nacional Agraria La Molina)El presente trabajo de investigación tuvo como finalidad implementar un modelo de regresión logística utilizando datos textuales transformados mediante el método de representación de texto TF-IDF, con el objetivo de clasificar comentarios de docentes en streamings de orientación sobre la estrategia Aprendo en Casa realizados por el Ministerio de Educación. El procedimiento de análisis se dividió en pre-procesamiento de los datos, análisis exploratorio de los datos, aplicación del método de representación de texto TF-IDF, estimación y evaluación del modelo; y clasificación de nuevos comentarios. Para la etapa de pre-procesamiento se realizó la limpieza y estandarización de los datos textuales de los comentarios; mientras que en el análisis exploratorio se obtuvieron indicadores descriptivos de los comentarios de cada categoría utilizando n-gramas. En la aplicación del método de representación de texto TF-IDF se elaboró la matriz documento-término a partir de la muestra de entrenamiento y se utilizó la prueba Chi Cuadrado para la selección de variables. En la estimación del modelo de clasificación se obtuvo el modelo final ajustado con los datos de entrenamiento provenientes de la matriz documento-término. Para la evaluación del modelo se aplicó el método TF-IDF a la muestra de prueba, a fin de obtener su matriz documento-término para realizar la clasificación y hallar los resultados de las métricas de evaluación, donde se consiguió una exactitud de 0.81. Posteriormente, se evaluó el modelo de clasificación mediante el método K-Fold de Validación Cruzada y se clasificaron nuevos comentarios. En base a los resultados de la presente investigación se concluye que la implementación del modelo desarrollado es adecuada.Item Open Access Estimar el capital económico basado en riesgos con los métodos de agregación de matrices de correlación y cópulasRau Campos, Selena Ana (2024, Universidad Nacional Agraria La Molina)En 2019, la Superintendencia de Banca, Seguros y AFP (SBS) propuso un nuevo modelo de solvencia, específicamente de capital basado en riesgos, con el objetivo de mantener una adecuada solvencia en las empresas de seguros, garantizando así que cuenten con los recursos suficientes para afrontar escenarios extremos de pérdidas. Para el cálculo de los capitales, la SBS, en calidad de ente regulador, planteó una metodología de agregación mediante matriz de correlación; sin embargo, las compañías de seguros deberían analizar otras alternativas de agregación para el cálculo de capital. Una metodología ampliamente utilizada para este fin es la agregación por cópulas, la cual se aplicó en este análisis (específicamente, la t-cópula). En ambas metodologías, se necesitó estimar las reservas matemáticas best estimate, incluidas en el pasivo de los estados financieros de la compañía. El beneficio de diversificación al utilizar la metodología de agregación de matrices de correlación fue de aproximadamente USD 516 000, mientras que para la agregación por t-cópulas fue de aproximadamente USD 532 000. Con estos resultados, se puede concluir que, a pesar de haber utilizado los mismos parámetros, la agregación por t-cópula permite obtener un mayor beneficio de diversificación para la empresa, liberando capital y permitiendo su empleo en inversiones con una rentabilidad esperada más alta.Item Open Access Construcción de un modelo de score para la evaluación de clientes potenciales en una entidad financieraCarrasco Reyes, Alessandra Stefany (2024, Universidad Nacional Agraria La Molina)El riesgo de crédito se encuentra dentro de las principales preocupaciones de las entidades financieras, por ello mantener una adecuada gestión es de vital importancia. Como parte de las estrategias definidas por las entidades se hace uso de análisis y modelos estadísticos para la admisión de clientes, generación de campañas, monitoreo de la calidad de cartera de clientes, manteniendo su apetito de riesgo. En el presente trabajo se describe la construcción de un modelo de score, específicamente, para clientes potenciales de una campaña crediticia de una entidad financiera, utilizando modelos Random Forest para la selección de variables y ajustando un modelo de Regresión Logística para la predicción de clientes morosos y no morosos. Dicho modelo logró una mejora de 14 puntos porcentuales en el indicador de Kolgomorov Smirnov en comparación con el modelo anterior de score.Item Open Access Validación del modelo estimador de ingresos para la banca minoristaCalisaya Mallco, Kenia Nora (2024, Universidad Nacional Agraria La Molina)El presente trabajo de suficiencia profesional, describe la evaluación de los controles de calidad de datos, la metodología de cálculo aplicada y los procedimientos de implementación de la Calibración del Modelo Estimador de Ingresos para Dependientes + RCC de la Banca Minorista; con el fin mitigar un incorrecto uso de la metodología y mejorar los modelos; además de cumplir con las normas que exige la Política de Gestión de Riesgos basados en las mejores prácticas conforme lo exige la Norma Internacional para la Práctica Profesional de la Auditoría Interna. Para ello, se revisaron el adecuado funcionamiento de los controles de calidad, se realizó la réplica del modelo machine learning basado en árboles llamado XGBoost. Utilizando los softwares SQL, SAS y Rstudio. En ese sentido, se concluye que el modelo cumple con los estándares establecidos por las mejores prácticas, en auditoría de Validación a la implementación. Además, dicho modelo fue implementado de forma adecuada siguiendo los lineamientos definidos por las unidades del banco; sin embargo, en los procedimientos metodológicos de la implementación del modelo se encontraron deficiencias, los mismos que fueron comunicados y subsanados por las áreas o unidades correspondientes.Item Open Access Clasificación de clientes potenciales de un operador telefónico contactados por un call center utilizando regresión logística y adaboostingLuque Carbajal, Rosario Del Pilar (2024, Universidad Nacional Agraria La Molina)El presente trabajo monográfico busca demostrar que, para los datos empleados en la realización de la investigación, el algoritmo adaboosting presenta mejores resultados en la clasificación de clientes potenciales de un call center a diferencia de la regresión logística. Sin embargo, no se busca determinar que un algoritmo sea mejor que el otro, sino comprobar que, dada las características de las variables independientes, un algoritmo puede presentar mejores resultados y viceversa. Se utiliza una solución analítica avanzada que parte desde el análisis descriptivo de las variables, selección de variables, imputación de los datos y modelamiento predictivo, validación de los resultados en el tiempo; hasta la puesta en marcha a partir de los grupos de ejecución que permiten el despliegue y acción sobre los resultados obtenidos dado el trabajo desarrollado, exactitud del adaboosting 86% y exactitud de la regresión logística 78%.

