Credit Scoring, Validación y Machine Learning Nivel 1

OBJETIVO

El objetivo del curso es mostrar aplicaciones de la analítica de datos en la banca, por lo que se muestra, una amplia variedad de modelos de score aplicados al marketing, crédito, rentabilidad, fraude y recuperaciones. Además se explican las ventajas e inconvenientes de desarrollar un Credit Scoring con Big Data.

El curso ayudará a los participantes a comprender mejor la información contenida en los datos, y a desarrollar modelos analíticos que ayuden a la toma de decisiones en la banca.

Se exponen las definiciones, características y métricas sobre la analítica de Datos, la analítica Web y la analítica social.

Respecto a la analítica de datos, se expone un módulo, sobre el tratamiento avanzado de los datos, explicando entre otros temas, el muestreo, análisis exploratorio, segmentación y detección de outliers.

Se muestran modelos predictivos de tipo econométricos, árboles de decisión, redes neuronales, redes bayesianas, Support Vector Machines etc. Más adelante se explica, detalladamente, la validación de estos modelos.

Se muestran metodologías y ejercicios prácticos de Customer Life Time Value. Y, en otro contexto, se exponen temas como la analítica en las redes sociales mostrando las principales métricas y desarrollando ejercicios de visualización de gráficos.

El curso incluye metodologías como Text Mining, análisis de sentimientos y lingüística computacional. Así como ejercicios de Text Mining para tratar datos no estructurados.

¿QUIÉNES DEBEN ASISTIR?

El Curso esta dirigido a profesionistas de entidades financieras interesados en el Big Data Analytics, así como a los responsables de los departamentos de marketing, crédito, riesgos, fraude, finanzas y recuperaciones. Para la mejor comprensión de los temas es recomendable que el participante tenga conocimientos de estadística.

Horarios:

Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h

España, Portugal: L a V 19-22 h

Ciudad de México, Quito, Bogotá, San José: L a V 19-22 h

Precio: 2.900 €

Nivel: Intermedio

Duración: 21 h

Material:

Presentaciones PDF

Ejercicios en R, SAS y Excel

AGENDA Credit Scoring, Validación y Machine Learning

Anchor 10

Módulo 1: BIG DATA ANALYTICS

Analítica de datos
- Tecnologías, herramientas y tendencias en Big Data Analytics
- Proveedores de analítica de Big Data
- Tecnologías de código abierto
- Características de una plataforma de Biga Data
- Ejemplos de aplicaciones de Big Data Analytic
- Modelo de proceso analítico
  - Actores en el Big Data Analytics
  - Data warehouse administrator
  - Experto en Negocios
  - Data Scientist
  - Software tool vendors
Analítica Web
- Analítica Web 2.0
- Métricas: visitas, visitantes, tasa de salida, etc.
- KPIs
- Google Analytics
- Informes
- Segmentación
- Herramientas de analítica Web
- Analítica Web móvil
Analítica Social
- Definición
- Métricas sociales
- KPIs
- Herramienta de analítica social
- Estadística social
- Herramienta de investigación y monitorización
- Herramienta de analítica de Web social
- Herramienta de reputación e influencia social
- Herramientas de análisis de actividad en redes sociales
- Facebook
- Twitter
- Análisis de sentimientos
- Casos de estudio de analítica social
- Internacional Privacy Regulations

Módulo 2: Gestión avanzada de los datos

Tipología de datos
Datos transaccionales
Unstructured data embebida en documentos de texto
Social Media Data
Fuentes de datos
Revisión del dato
Definición del Target
Horizonte temporal de la variable objetivo
Muestreo
- Muestreo Aleatorio
- Muestreo Estratificado
- Muestreo Rebalanceado
Análisis Exploratorio:
- Histogramas
- Q-Q Plot
- Análisis de momentos
- Box Plot
Tratamiento de los valores Missing
- Imputación
- Borrar
- Mantener
Técnicas avanzadas de detección de Outliers y tratamiento
- Z-Score
- Distancia de Mahalanobis
Estandarización de los Datos
Categorización de variables
- Equal Interval Binning
- Equal Frecuency Binning
- Prueba Ji-Cuadrada
Binary Coding
WOE Coding
- Definición WOE
- Análisis Univariante con variable Target
- Selección de variables
- Tratamiento de Variables continuas
- Tratamiento de Variables Categóricas
- Fisher Score
- Gini
- Information Value
- Pearson Correlation
- Cramer Von Misses
- Optimización de variables continuas
- Optimización de variables categóricas
- Àrboles de Decisión
Segmentación
- Decisión Experta
- Estadística
  - Àrboles de Decisión
  - K Means Clustering
  - Finite Mixture Model
  - Mixtura gaussiana Univariante
  - Mixtura gaussiana Bivariante
Ejercicio 1: Análisis Exploratorio en SAS
Ejercicio 2: Detección y tratamiento de Outliers usando Z-score
Ejercicio 3: Técnicas de Muestreo rebalanceado en SAS
Ejercicio 4: Muestreo estratificado y Aleatorio
Ejercicio 5: Análisis del Weight of Evidence en Excel
Ejercicio 6: Análisis univariante en percentiles en SAS
Ejercicio 7: Análisis univariante óptimo variable continua en Excel
Ejercicio 8: Estimación del KS, Gini e IV de cada variable en Excel
Ejercicio 9: Validación de variables usando Pearson correlation y Fisher Score
Ejercicio 10: Optimización de variables categóricas en SAS
Ejercicio 11: Análisis Univariante con árboles de decisión en SPSS
Ejericicio 12: Segmentación con árboles de decisión
Ejercicio 13: Segmentación usando K mans Clustering en R
Ejercicio 14: Segmentación con Mixtura gaussiana univariante y bivariante

Módulo 3: Modelos Predictivos

Definición del Target
- Default
- Abandono
- Concesión
- Fraude
- Gross Response
- Customer Lifetime Value
- Debt to Income
- Recuperación
- Pago de la deuda
- Ingresos
- Originación préstamo/línea crédito
- Loyalty
- Prepago
Definición del horizonte temporal del modelo predictivo
Componentes Principales para reducir variables
Modelos Econométricos
- Regresión lineal
- Regresión Logística
- Regresión Logística Multinomial
- Regresión Piecewise
- Regresión Logística Panel Data
- Regresión Cox
Interpretación de los coeficientes
Interpretación de los Odds Ratios
Uso de Random Forest
Árboles de Decisión
- CART
- CHAID
Redes Neuronales
- Perceptrón Multicapa
Algoritmos Genéticos
Redes Bayesianas
Support Vector Machines
Ejercicio 15: Análisis de Componentes principales en SAS
Ejercicio 16: Regresión Logística método stepwise en SAS
Ejercicio 17: Regresión logística multinomial
Ejercicio 18: Regresión Piecewise en Excel y SAS
Ejercicio 19: Redes Neuronales: perceptron en SAS
Ejercicio 20: Árboles de decisión CHAID en SAS
Ejercicio 21: Regresión Logística Panel Data en Stata
Ejercicio 22: Cox Regression en R y SAS
Ejercicio 23: Redes Bayesianas en R
Ejercicio 24: Support vector machines en R
Ejercicio 25: Random Forest en R

Módulo 4: Validación del modelo

Verificación p-values en regresiones
R cuadrado, MSE, MAD
Diagnóstico de los residuos
Test de Bondad de Ajuste
- Deviance
- Bayesian Information Criterion (BIC)
- Akaike Information Criterion
Multicolinealidad Multivariante
Validación cruzada
Bootstrapping del error
Matriz de confusión caso binario
Matriz de confusión caso multinomial
Prueba de Estabilidad
Principales test de poder discriminante:
- KS
- Curva ROC
- Curva Lift
- Gini Index
- Cumulative Accuracy Profile
- Distancia de Kullback-Leibler
- Pietra Index
- Entropía condicional
- Valor de Información
- Tau de Kendall
- Brier Score
- Distancia de Mahalanobis
- Divergencia
- Hosmer Lemeshow
Intervalos de confianza
Jackknifing con test de poder discriminante
Bootstrapping con test de poder discriminante
Ejercicio 26: Test de Bondad de Ajuste Regresión líneal
Ejercicio 27: Test de Bondad de Ajuste Regresión Logística
Ejercicio 28: Validación cruzada en SAS
Ejercicio 29: Estimación Gini, Valor de la Información, Brier Score, Curva Lift, CAP, ROC, Divergencia en SAS
Ejercicio 30: Bootstrapping de parámetros SAS
Ejercicio 31: Jackkinifng en SAS
Ejercicio 32: Bootstrapping de Gini/ROC en SAS

Módulo 5: Desarrollo de Scorecards

Asignación de puntuación
Clasificación del Scorecard
- Scorecard WOE
- Scorecard Binario
- Scorecard Continuo
Reescalamiento del Scorecard
- Análisis del Factor y Offset
- Scorecard WOE
- Scorecard Binario
Técnicas de Reject Inference
- Cut-Off
- Parcelling
- Fuzzy Augmentation
Técnicas Avanzadas de punto de corte
Ejercicio 33: Scorecard Binario en Excel y SAS
Ejercicio 34: Scorecard WOE en Excel, R y SAS
Ejercicio 35: Reject Inference Fuzzy Augmentation en SAS
Ejercicio 36: Selección del Punto de Corte en Excel y SAS

Módulo 6: Tipología de Scores

Response Scoring
Income Score
DTI Score
Credit Scoring de Admisión
- Score de Tarjetas de crédito
- Score de Hipotecas
- Score de consumo
- Score de Automóvil
Behavior Score
Transaction Score
Score de Ingresos
Score de Abandono
Score de Fraude en Admisión
Score de Fraude en Seguimiento
Collection Score
Recovery Score
Revenue Score
Big Data Scoring
- Ventajas y criticas
Ejercicio 37:Bevavior Score con regresión logìstica en SAS
Ejercicio 38: Behavior Score Regresión Cox
Ejercicio 39: Behavior Score Regresión Logística Panel Data
Ejercicio 40: Score de Ingresos en SAS
Ejercicio 41: Collection Score en SAS
Ejercicio 42: Recovery Score Excel y SAS
Ejercicio 43: Debt To Income Score en SAS

Módulo 7: Customer Life Time Value (CLV)

Definición CLV
Estrategias para incrementar el CLV
Customer Loyalty
- Enfoque RFM
- Past Customer Value
- Share Of Wallet
Modelización del CLV
Enfoque Agregado
Enfoque Individual
Componentes del CLV
Drivers del CLV
Modelo de Retención simple
Modelo de Retención General
Modelos Supervivencia
Ejercicio 44: Estimación CLV en Excel
Ejercicio 45: Modelo de Retención simple en SAS
Ejercicio 46: Modelo de Retención General y análisis de supervivencia y Hazard rates en SAS

Módulo 8: Analítica Social

Analítica en las Redes Sociales
Definiciones de redes
Gráficos
Sociogramas
Vértices, bordes, nodos, pesos
Principales Métricas en la Analìtica Social
Medidas de centralidad en las redes
Social Network learner
Local Model
Network Model
Probabilistic Relational Neighbor Classifier
Relational Logisitic Regression
Collective Inferencing
Visualización de las Redes Sociales
Taxonomía de las visualizaciones
Visualización y analítica
Analítica Social en Facebook usando R
Analítica Social en Twitter usando R
Analítica Social en Google Analytics usando R
Ejercicio 47: Carga de datos y Gráficos en R
Ejercicio 48: Añadir Vértices en los gráficos R
Ejercicio 49: Visualización de Social Networks en R

Módulo 9: Text Mining

Definición Text Mining
Unstructured Data
Análisis Exploratorio
Modelización predictiva en el Text Mining
- K-Nearest Neighbors
Text Mining en las Redes Sociales
- Keyword Search
- Algortimos de clasificación
- Algoritmos Clustering
Análisis de Sentimientos
Sentimiento en lingüística y Psicología
- Subjetividad
- Facticidad
Lingüística Computacional
- Lexicón y Corpora
- Enfoque basado en reglas
- Enfoque Machine Learning
Ejercicio 50: Text Mining de un documento en R
Ejercicio 51: Text Mining de un documento la Web en R
Ejercicio 52: Cleaning Text Data en R
Ejercicio 53: Modelo predictivo Text Mining