All About Scoring y Machine Learningen Python y R
OBJETIVO
El objetivo del curso es enseñar al participante a desarrollar modernas y potentes herramientas de scoring en el ámbito de crédito, marketing, recuperaciones, fraude y Big Data.
El participante aprenderá a desarrollar modelos de credit scoring durante el ciclo del crédito: score de admisión, score de comportamiento, score de fraude en la etapa de admisión y seguimiento y score de recobro.
En el ámbito de Marketing aprenderá a desarrollar modelos Response Score, Income Score y Score de Abandono. El curso es completamente práctico para que el participante pueda construir modelos inmediatamente.
Respecto a la analítica de datos, se expone un módulo, sobre el tratamiento avanzado de los datos, explicando entre otros temas, el muestreo, análisis exploratorio, segmentación y detección de outliers.
Se muestran metodologías de machine learning, entre otras, árboles de decisión, random forest, redes neuronales, redes bayesianas, Support Vector Machines etc. Se explica, pormenorizadamente, la validación de estos modelos.
Se exponen las ventajas y desafíos de desarrollar un Credit Scoring con Big Data y analítica social.
Se muestran metodologías y ejercicios prácticos de Customer Life Time Value. Y, en otro contexto, se expone la analítica en las redes sociales mostrando las principales métricas y desarrollando ejercicios de visualización de gráficos y un modelo de scoring aprovechando esta valiosa información.
Innovadoramente el curso incluye modelos de scoring para la LGD y modelos de credit scoring para la admisión de de carteras de crédito de emprendedores y Start-Ups.
¿QUIÉNES DEBEN ASISTIR?
El Curso esta dirigido a profesionistas de entidades financieras interesados en el Big Data Analytics, así como a los responsables de los departamentos de marketing, crédito, riesgos, fraude, finanzas y recuperaciones.
Para la mejor comprensión de los temas es necesario que el participante tenga conocimientos de estadística.
Horarios:
-
Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h
-
España, Portugal: L a V 19-22 h
-
Ciudad de México, Quito, Bogotá, San José: L a V 19-22 h
Precio: 4.900 €
Nivel: Avanzado
Duración: 30 h
Material:
Presentaciones PDF, Ejercicios Excel, R y SAS
AGENDA
All About Scoring y Machine Learning
en python y R
Agenda Modular
Min
to your destination
Módulo 1: Credit Scoring y Modelos Predictivos
-
Modelos Predictivos en el entorno actual
-
Aplicaciones del Credit Scoring
-
Diseño y Construcción de Modelos de Credit Scoring
-
Ventajas y Desventajas
-
Modelos para afrontar crisis financierias
Módulo 2: Gestión avanzada de los datos
-
Tipología de datos
-
Datos transaccionales
-
Unstructured data embebida en documentos de texto
-
Social Media Data
-
Fuentes de datos
-
Revisión del dato
-
Definición del Target
-
Horizonte temporal de la variable objetivo
-
Muestreo
-
Muestreo Aleatorio
-
Muestreo Estratificado
-
Muestreo Rebalanceado
-
-
Análisis Exploratorio:
-
Histogramas
-
Q-Q Plot
-
Análisis de momentos
-
Box Plot
-
-
Tratamiento de los valores Missing
-
Imputación
-
Borrar
-
Mantener
-
-
Técnicas avanzadas de detección de Outliers y tratamiento
-
Z-Score
-
Distancia de Mahalanobis
-
-
Estandarización de los Datos
-
Categorización de variables
-
Equal Interval Binning
-
Equal Frecuency Binning
-
Prueba Ji-Cuadrada
-
-
Binary Coding
-
WOE Coding
-
Definición WOE
-
Análisis Univariante con variable Target
-
Selección de variables
-
Tratamiento de Variables continuas
-
Tratamiento de Variables Categóricas
-
Fisher Score
-
Gini
-
Information Value
-
Pearson Correlation
-
Cramer Von Misses
-
Optimización de variables continuas
-
Optimización de variables categóricas
-
Àrboles de Decisión
-
-
Segmentación
-
Decisión Experta
-
Estadística
-
Àrboles de Decisión
-
K Means Clustering
-
Finite Mixture Model
-
Mixtura gaussiana Univariante
-
Mixtura gaussiana Bivariante
-
-
-
Ejercicio 1: Análisis Exploratorio en R
-
Ejercicio 2: Detección y tratamiento de Outliers usando Z-score
-
Ejercicio 3: Técnicas de Muestreo rebalanceado en R
-
Ejercicio 4: Muestreo estratificado y Aleatorio
-
Ejercicio 5: Análisis del Weight of Evidence en Excel
-
Ejercicio 6: Análisis univariante en percentiles en R
-
Ejercicio 7: Análisis univariante óptimo variable continua en Excel
-
Ejercicio 8: Estimación del KS, Gini e IV de cada variable en Excel
-
Ejercicio 9: Validación de variables usando Pearson correlation y Fisher Score
-
Ejercicio 10: Optimización de variables categóricas en SAS
-
Ejercicio 11: Análisis Univariante con árboles de decisión en R
-
Ejercicio 12: Segmentación con árboles de decisión
-
Ejercicio 13: Segmentación usando K mans Clustering en R
-
Ejercicio 14: Segmentación con Mixtura gaussiana univariante y bivariante
Módulo 3: Machine Learning
-
Definición del Machine Learning
-
Metodología del Machine Learning
-
Almacenamiento de la Data
-
Abstracción
-
Generalización
-
Evaluación
-
-
Aprendizaje Supervisado
-
Aprendizaje No Supervisado
-
Aprendizaje por Refuerzo
-
Deep Learning
-
Tipología de algoritmos de Machine Learning
-
Pasos para implementar un algoritmo
-
Recogida de información
-
Análisis Exploratorio
-
Entrenamiento del modelo
-
Evaluación del Modelo
-
Mejoras al modelo
-
Machine Learning en riesgo crédito de consumo
-
-
Machine Learning en modelos de credit scoring
-
Análisis de principales herramientas: R, Python, Microsoft Azure, SAS Enterprise Miner, SAS Visual Analytics, Knime, IBM SPSS Modelller, Spark,,etc.
Módulo 4: Modelos Predictivos
-
Definición del Target
-
Default
-
Abandono
-
Concesión
-
Fraude
-
Gross Response
-
Customer Lifetime Value
-
Debt to Income
-
Recuperación
-
Pago de la deuda
-
Ingresos
-
Originación préstamo/línea crédito
-
Loyalty
-
Prepago
-
-
Definición del horizonte temporal del modelo predictivo
-
Componentes Principales para reducir variables
-
Modelos Econométricos
-
Regresión lineal
-
Regresión Logística
-
Regresión Logística Multinomial
-
Regresión Piecewise
-
Regresión Logística Panel Data
-
Regresión Cox
-
-
Interpretación de los coeficientes
-
Interpretación de los Odds Ratios
-
Uso de Random Forest
-
Árboles de Decisión
-
CART
-
CHAID
-
-
Redes Neuronales
-
Perceptrón Multicapa
-
-
Algoritmos Genéticos
-
Redes Bayesianas
-
Support Vector Machines
-
Ejercicio 15: Análisis de Componentes principales en R
-
Ejercicio 16: Regresión Logística método stepwise en R
-
Ejercicio 17: Regresión logística multinomial
-
Ejercicio 18: Regresión Piecewise en Excel y SAS
-
Ejercicio 19: Redes Neuronales: perceptron en R
-
Ejercicio 20: Árboles de decisión CHAID en R
-
Ejercicio 21: Regresión Logística Panel Data en R
-
Ejercicio 22: Cox Regression en R
-
Ejercicio 23: Redes Bayesianas en R
-
Ejercicio 24: Support vector machines en Python
-
Ejercicio 25: Random Forest en R
Módulo 5: Validación del modelo
-
Verificación p-values en regresiones
-
R cuadrado, MSE, MAD
-
Diagnóstico de los residuos
-
Test de Bondad de Ajuste
-
Deviance
-
Bayesian Information Criterion (BIC)
-
Akaike Information Criterion
-
-
Multicolinealidad Multivariante
-
Validación cruzada
-
Bootstrapping del error
-
Matriz de confusión caso binario
-
Matriz de confusión caso multinomial
-
Prueba de Estabilidad
-
Principales test de poder discriminante:
-
KS
-
Curva ROC
-
Curva Lift
-
Gini Index
-
Cumulative Accuracy Profile
-
Distancia de Kullback-Leibler
-
Pietra Index
-
Entropía condicional
-
Valor de Información
-
Tau de Kendall
-
Brier Score
-
Distancia de Mahalanobis
-
Divergencia
-
Hosmer Lemeshow
-
-
Intervalos de confianza
-
Jackknifing con test de poder discriminante
-
Bootstrapping con test de poder discriminante
-
Ejercicio 26: Test de Bondad de Ajuste Regresión líneal
-
Ejercicio 27: Test de Bondad de Ajuste Regresión Logística
-
Ejercicio 28: Validación cruzada en R
-
Ejercicio 29: Estimación Gini, Valor de la Información, Brier Score, Curva Lift, CAP, ROC, Divergencia
-
Ejercicio 30: Bootstrapping de parámetros R
-
Ejercicio 31: Jackkinifng en R
-
Ejercicio 32: Bootstrapping de Gini/ROC en R
Módulo 6: Desarrollo de Scorecards
-
Asignación de puntuación
-
Clasificación del Scorecard
-
Scorecard WOE
-
Scorecard Binario
-
Scorecard Continuo
-
-
Reescalamiento del Scorecard
-
Análisis del Factor y Offset
-
Scorecard WOE
-
Scorecard Binario
-
-
Técnicas de Reject Inference
-
Cut-Off
-
Parcelling
-
Fuzzy Augmentation
-
Extrapolation
-
-
Definición del punto de corte
-
Mantenimiento del punto de corte
-
Modelos tradicionales para establecer el punto de corte
-
Modelo de optimización para establecer el Cut-Off
-
Metodología ROC para el punto de corte (Cut-Off)
-
-
Ejercicio 33: Scorecard Binario en Excel y R
-
Ejercicio 34: Scorecard WOE en Excel, R y R
-
Ejercicio 35: Reject Inference Fuzzy Augmentation en R
-
Ejercicio 36: Selección del Punto de Corte en Excel
-
Ejercicio 37: Estimación optima del Cut-Off en Excel
-
Ejercicio 38: Estimación del Cut Off y la curva ROC
Agenda Total
Módulo 1: Credit Scoring y Modelos Predictivos
-
Modelos Predictivos en el entorno actual
-
Aplicaciones del Credit Scoring
-
Diseño y Construcción de Modelos de Credit Scoring
-
Ventajas y Desventajas
-
Modelos para afrontar crisis financierias
Módulo 2: Gestión avanzada de los datos
-
Tipología de datos
-
Datos transaccionales
-
Unstructured data embebida en documentos de texto
-
Social Media Data
-
Fuentes de datos
-
Revisión del dato
-
Definición del Target
-
Horizonte temporal de la variable objetivo
-
Muestreo
-
Muestreo Aleatorio
-
Muestreo Estratificado
-
Muestreo Rebalanceado
-
-
Análisis Exploratorio:
-
Histogramas
-
Q-Q Plot
-
Análisis de momentos
-
Box Plot
-
-
Tratamiento de los valores Missing
-
Imputación
-
Borrar
-
Mantener
-
-
Técnicas avanzadas de detección de Outliers y tratamiento
-
Z-Score
-
Distancia de Mahalanobis
-
-
Estandarización de los Datos
-
Categorización de variables
-
Equal Interval Binning
-
Equal Frecuency Binning
-
Prueba Ji-Cuadrada
-
-
Binary Coding
-
WOE Coding
-
Definición WOE
-
Análisis Univariante con variable Target
-
Selección de variables
-
Tratamiento de Variables continuas
-
Tratamiento de Variables Categóricas
-
Fisher Score
-
Gini
-
Information Value
-
Pearson Correlation
-
Cramer Von Misses
-
Optimización de variables continuas
-
Optimización de variables categóricas
-
Àrboles de Decisión
-
-
Segmentación
-
Decisión Experta
-
Estadística
-
Àrboles de Decisión
-
K Means Clustering
-
Finite Mixture Model
-
Mixtura gaussiana Univariante
-
Mixtura gaussiana Bivariante
-
-
-
Ejercicio 1: Análisis Exploratorio en R
-
Ejercicio 2: Detección y tratamiento de Outliers usando Z-score
-
Ejercicio 3: Técnicas de Muestreo rebalanceado en R
-
Ejercicio 4: Muestreo estratificado y Aleatorio
-
Ejercicio 5: Análisis del Weight of Evidence en Excel
-
Ejercicio 6: Análisis univariante en percentiles en R
-
Ejercicio 7: Análisis univariante óptimo variable continua en Excel
-
Ejercicio 8: Estimación del KS, Gini e IV de cada variable en Excel
-
Ejercicio 9: Validación de variables usando Pearson correlation y Fisher Score
-
Ejercicio 10: Optimización de variables categóricas en SAS
-
Ejercicio 11: Análisis Univariante con árboles de decisión en R
-
Ejercicio 12: Segmentación con árboles de decisión
-
Ejercicio 13: Segmentación usando K mans Clustering en R
-
Ejercicio 14: Segmentación con Mixtura gaussiana univariante y bivariante
Módulo 3: Machine Learning
-
Definición del Machine Learning
-
Metodología del Machine Learning
-
Almacenamiento de la Data
-
Abstracción
-
Generalización
-
Evaluación
-
-
Aprendizaje Supervisado
-
Aprendizaje No Supervisado
-
Aprendizaje por Refuerzo
-
Deep Learning
-
Tipología de algoritmos de Machine Learning
-
Pasos para implementar un algoritmo
-
Recogida de información
-
Análisis Exploratorio
-
Entrenamiento del modelo
-
Evaluación del Modelo
-
Mejoras al modelo
-
Machine Learning en riesgo crédito de consumo
-
-
Machine Learning en modelos de credit scoring
-
Análisis de principales herramientas: R, Python, Microsoft Azure, SAS Enterprise Miner, SAS Visual Analytics, Knime, IBM SPSS Modelller, Spark,,etc.
Módulo 4: Modelos Predictivos
-
Definición del Target
-
Default
-
Abandono
-
Concesión
-
Fraude
-
Gross Response
-
Customer Lifetime Value
-
Debt to Income
-
Recuperación
-
Pago de la deuda
-
Ingresos
-
Originación préstamo/línea crédito
-
Loyalty
-
Prepago
-
-
Definición del horizonte temporal del modelo predictivo
-
Componentes Principales para reducir variables
-
Modelos Econométricos
-
Regresión lineal
-
Regresión Logística
-
Regresión Logística Multinomial
-
Regresión Piecewise
-
Regresión Logística Panel Data
-
Regresión Cox
-
-
Interpretación de los coeficientes
-
Interpretación de los Odds Ratios
-
Uso de Random Forest
-
Árboles de Decisión
-
CART
-
CHAID
-
-
Redes Neuronales
-
Perceptrón Multicapa
-
-
Algoritmos Genéticos
-
Redes Bayesianas
-
Support Vector Machines
-
Ejercicio 15: Análisis de Componentes principales en R
-
Ejercicio 16: Regresión Logística método stepwise en R
-
Ejercicio 17: Regresión logística multinomial
-
Ejercicio 18: Regresión Piecewise en Excel y SAS
-
Ejercicio 19: Redes Neuronales: perceptron en R
-
Ejercicio 20: Árboles de decisión CHAID en R
-
Ejercicio 21: Regresión Logística Panel Data en R
-
Ejercicio 22: Cox Regression en R
-
Ejercicio 23: Redes Bayesianas en R
-
Ejercicio 24: Support vector machines en Python
-
Ejercicio 25: Random Forest en R
Módulo 5: Validación del modelo
-
Verificación p-values en regresiones
-
R cuadrado, MSE, MAD
-
Diagnóstico de los residuos
-
Test de Bondad de Ajuste
-
Deviance
-
Bayesian Information Criterion (BIC)
-
Akaike Information Criterion
-
-
Multicolinealidad Multivariante
-
Validación cruzada
-
Bootstrapping del error
-
Matriz de confusión caso binario
-
Matriz de confusión caso multinomial
-
Prueba de Estabilidad
-
Principales test de poder discriminante:
-
KS
-
Curva ROC
-
Curva Lift
-
Gini Index
-
Cumulative Accuracy Profile
-
Distancia de Kullback-Leibler
-
Pietra Index
-
Entropía condicional
-
Valor de Información
-
Tau de Kendall
-
Brier Score
-
Distancia de Mahalanobis
-
Divergencia
-
Hosmer Lemeshow
-
-
Intervalos de confianza
-
Jackknifing con test de poder discriminante
-
Bootstrapping con test de poder discriminante
-
Ejercicio 26: Test de Bondad de Ajuste Regresión líneal
-
Ejercicio 27: Test de Bondad de Ajuste Regresión Logística
-
Ejercicio 28: Validación cruzada en R
-
Ejercicio 29: Estimación Gini, Valor de la Información, Brier Score, Curva Lift, CAP, ROC, Divergencia
-
Ejercicio 30: Bootstrapping de parámetros R
-
Ejercicio 31: Jackkinifng en R
-
Ejercicio 32: Bootstrapping de Gini/ROC en R
Módulo 6: Desarrollo de Scorecards
-
Asignación de puntuación
-
Clasificación del Scorecard
-
Scorecard WOE
-
Scorecard Binario
-
Scorecard Continuo
-
-
Reescalamiento del Scorecard
-
Análisis del Factor y Offset
-
Scorecard WOE
-
Scorecard Binario
-
-
Técnicas de Reject Inference
-
Cut-Off
-
Parcelling
-
Fuzzy Augmentation
-
Extrapolation
-
-
Definición del punto de corte
-
Mantenimiento del punto de corte
-
Modelos tradicionales para establecer el punto de corte
-
Modelo de optimización para establecer el Cut-Off
-
Metodología ROC para el punto de corte (Cut-Off)
-
-
Ejercicio 33: Scorecard Binario en Excel y R
-
Ejercicio 34: Scorecard WOE en Excel, R y R
-
Ejercicio 35: Reject Inference Fuzzy Augmentation en R
-
Ejercicio 36: Selección del Punto de Corte en Excel
-
Ejercicio 37: Estimación optima del Cut-Off en Excel
-
Ejercicio 38: Estimación del Cut Off y la curva ROC
Módulo 7: Tipología de Scores
-
Response Scoring
-
Income Score
-
DTI Score
-
Credit Scoring de Admisión
-
Score de Tarjetas de crédito
-
Score de Hipotecas
-
Score de consumo
-
Score de Automóvil
-
-
Behavior Score
-
Response Score
-
Transaction Score
-
Score de Ingresos
-
Score de Abandono
-
Score de Fraude en Admisión
-
Score de Fraude en Seguimiento
-
Collection Score
-
Recovery Score
-
Revenue Score
-
Big Data Scoring
-
Ventajas y criticas
-
-
Ejercicio 39: Bevavior Score con regresión logìstica en R
-
Ejercicio 40: Behavior Score Redes Neuronales en Python
-
Ejercicio 41: Behaviour Score con Árboles de Decisión R
-
Ejercicio 42: Behavior Score Regresión Logística Panel Data
-
Ejercicio 43 : Fraud Score con redes neuronales
-
Ejercicio 44: Score de Ingresos en R
-
Ejercicio 45: Collection Score en R
-
Ejercicio 46: Recovery Score Excel y R
-
Ejercicio 47: Debt To Income Score en R
-
Ejercicio 48 :Score de Abandono en R
Módulo 8: Customer Life Time Value (CLV)
-
Definición CLV
-
Estrategias para incrementar el CLV
-
Customer Loyalty
-
Enfoque RFM
-
Past Customer Value
-
Share Of Wallet
-
-
Modelización del CLV
-
Enfoque Agregado
-
Enfoque Individual
-
Componentes del CLV
-
Drivers del CLV
-
Modelo de Retención simple
-
Modelo de Retención General
-
Modelos Supervivencia
-
Scoring CLV
-
Ejercicio 49: Estimación CLV en Excel
-
Ejercicio 50: Modelo de Scoring de Retención simple en R
-
Ejercicio 51: Modelo de Scoring de Retención General y análisis de supervivencia y Hazard rates en R
Módulo 9: Analítica Social para construir Modelos de Scoring
-
Analítica en las Redes Sociales
-
Definiciones de redes
-
Gráficos
-
Sociogramas
-
Vértices, bordes, nodos, pesos
-
Principales Métricas en la Analítica Social
-
Medidas de centralidad en las redes
-
Social Network learner
-
Local Model
-
Network Model
-
Probabilistic Relational Neighbor Classifier
-
Relational Logisitic Regression
-
Collective Inferencing
-
Visualización de las Redes Sociales
-
Taxonomía de las visualizaciones
-
Visualización y analítica
-
Analítica Social en Facebook usando R
-
Analítica Social en Twitter usando R
-
Analítica Social en Google Analytics usando R
-
Ejercicio 52: Carga de datos y Gráficos en R
-
Ejercicio 53: Añadir Vértices en los gráficos R
-
Ejercicio 54: Visualización de Social Networks en R
-
Ejercicio 55 : Score de Abandono en Python
Módulo 10: Modelos Predictivos de la LGD y EAD
-
Ventajas e inconvenientes de los Modelos Predictivos de LGD
-
Modelos paramétricos, no paramétricos y transformation regressions
-
Tipología de Modelos Multivariantes de LGD
-
Regresión Lineal y transformación Beta
-
Regresión Lineal y transformación Logit
-
Regresión Líneal y trasnsformación Box Cox
-
Regresión Logística y Lineal
-
Regresión Lógistica y no Lineal
-
Censored Regression
-
Generalized Additived Model
-
Redes Neuronales
-
Regresión Beta
-
Inflated beta regression
-
Fractional Response Regression
-
-
Ejercicio 59: Regresión Logística y lineal LGD en R
-
Ejercicio 60: Redes Neuronales LGD
-
Ejercicio 61: Generalized Additived Model EAD en R
-
Ejercicio 62: Beta Regression Model LGD y EAD en R y
-
Ejercicio 63: Censored Regression Model LGD en R
-
Ejercicio 64: Inflated Beta Regression en R
-
Ejercicio 65: Comparativo del performance de los modelos usando test de Calibración y precisión.
Módulo 11: Credit Scoring Psicométricos para Emprendedores
-
Fuentes de Información
-
Muestra
-
Variables Estándar
-
Variables Psicológicas
-
Inteligencia Emocional
-
Análisis Univariante de las variables Psicológicas
-
Modelos Multivariante
-
Regresión Logística
-
Árbol de Decisión
-
Análisis Discriminante
-
Validación Credit Scoring Psicométrico
-
Ejercicio 66: Comparativo entre Regresión Logística, Árbol de Decisión y Análisis discriminante
Módulo 12: Credit Scoring para Start Up
-
Definición de Start Up
-
Start Up en España y América Latina
-
Start Up lideradas por Mujeres
-
Fuentes de Información
-
Análisis del Sector
-
Variables Relevantes
-
Variables Económicas
-
Regresión Logística
-
Árbol de Decisión
-
Validación del Credit Scoring
-
Ventajas e Inconvenientes del credit scoring para las StartUps
-
Ejercicio 67: Comparativo entre Regresión Logística y Árbol de Decisión
Módulo 14: Modelos Avanzados de Credit Scoring con Machine Learning
-
Behavior Score
-
Horizonte temporal
-
Información de datos de panel
-
Regresión de datos de panel
-
Machine Learning y Deep Learning
-
Behavior Score con variables macroeconómicas
-
Matrices de transición
-
Behavior Score con matrices de transición
-
Transaction Score
-
-
BEHAVIOR SCORE EN TARJETAS DE CRÉDITO
-
Ejercicio 68: Behavior Score Regresión Logística en Python data 2
-
Ejercicio 69: Behavior Score Support Vector Machines en python
-
Ejercicio 70: Behavior Score Random Forest en python
-
Ejercicio 71: Behavior Score Gradient Boosting Trees en python
-
Ejercicio 72: Behavior Score Deep Learning en python