top of page
robot-futurista-inteligencia-artificial-revolucionario-concepto-tecnologia-ai.jpg

Credit Scoring, Inteligencia Artificial y Machine Learning Cuántico 

 

 

 

OBJETIVO DEL CURSO

Curso intensivo para desarrollar herramientas de credit scoring, calibrar la probabilidad de default, PD, y validar modelos. Se explican metodologías  de machine learning tradicional, probabilístico y cuántico. Además se explica como automatizar la construcción y calibración de la PD con la propia inteligencia artificial.

 

El participante aprenderá a desarrollar modelos de credit scoring, tradicionales y avanzados, en la etapa de admisión y seguimiento del crédito. Es decir, se explica la construcción del credit y behavior scoring empleando volúmenes de información enormes.

 

Respecto a la analítica de datos, se expone un módulo, sobre el tratamiento avanzado de los datos, explicando entre otros temas, el muestreo, análisis exploratorio, segmentación y detección de outliers. 

 

Se exponen las principales técnicas del machine learning, aprendizaje supervisado, no supervisado y de refuerzo, aplicados a la creación de herramientas de credit scoring.

Se exponen metodologías tradicionales como la regresión logística y otras, innovadoras, de machine learning, tales como: árboles de decisión, naive bayes, KKN, Regresión logística LASSO, random forest, redes neuronales, redes bayesianas, Support Vector Machines, gradient boosting tree, etc .

Se explica el uso de redes neuronales de deep learning para desarrollar potentes modelos de credit scoring que los bancos pueden implementar como herramientas desafiantes o herramientas útiles en el proceso de admisión y seguimiento. Se  exponen las redes neuronales feed forward, convolucionales, recurrentes y redes generativas antagónicas. Se explica una metodología propia, de Fermac Risk, para controlar los modelos de deep learning y hacerles interpretables. Lo anterior, evitará las inaceptables cajas negras.

Los hiperparámetros son parámetros cuyos valores controlan el proceso de aprendizaje y determinan los valores de los parámetros del modelo que termina aprendiendo un algoritmo de aprendizaje. El prefijo hiper sugiere que son parámetros de 'nivel superior' que controlan el proceso de aprendizaje y los parámetros del modelo que resultan de él.

Se muestran técnicas para calcular los hiperparámetros, tales como grid search, random search y optimización bayesiana.  

Se entregan más de 20 modelos de credit scoring, con distintas metodologías en diversos lenguajes de programación como lo son: R, Python, Jupyterlab, Tensorflow y SAS. Se entregan modelos de credit scoring de admisión, seguimiento, recobro, ingresos y abandono.

​Se enseñan metodologías avanzadas para calibrar el parámetro de riesgo PD IRB. Se aborda la calibración por ajuste a la tendencia central, la filosofía del rating  PD PIT y PD TTC, la calibración de modelos de machine learning para que produzcan probabilidades de default. Además se ha incluido un modulo para desarrollar y calibrar la PD Lifetime de IFRS 9 empleando modelos de deep learning.

El aprendizaje automático automatizado, también denominado ML automatizado o AutoML, es el proceso de automatizar las tareas iterativas del desarrollo de modelos de Machine Learning. Permite que los analistas de riesgos creen modelos de aprendizaje automático con un escalado, eficiencia y productividad altos, al mismo tiempo que mantiene la calidad del modelo, pueden ayudar no solo a la auto construcción de modelos sino a la validación de modelos de credit scoring.

Se muestran técnicas de machine learning probabilístico para construir modelos de credit scoring como lo son las redes neuronales bayesianas entre otros modelos.

Se explican metodologías de aprendizaje automático automatizado usando algoritmos genéticos entre otras técnicas avanzadas.

Se indican las mejores prácticas de validación de modelos de credit scoring de las entidades financieras usando la inteligencia artificial y los requerimientos regulatorios en Europa para usar este tipo de modelos. 

El Machine Learning cuántico es la integración de algoritmos cuánticos dentro de programas de Machine Learning. Los algoritmos de machine learning se utilizan para calcular inmensas cantidades de datos, el aprendizaje automático cuántico utiliza qubits y operaciones cuánticas o sistemas cuánticos especializados para mejorar la velocidad de cálculo y el almacenamiento de datos realizado por algoritmos en un programa. Por ejemplo, algunas técnicas matemáticas y numéricas de la física cuántica son aplicables al deep learning clásico. Una red neuronal cuántica tiene capacidades computacionales para disminuir la cantidad de pasos, los qubits utilizados y el tiempo de cómputo. 

El objetivo del curso es mostrar el uso de la computación cuántica y redes tensoriales para el cálculo de algoritmos de machine learning.

Consideramos que la computación cuántica comenzará a transformar el panorama de los servicios financieros en los próximos años. Los bancos que adopten algoritmos cuánticos tendrán ventajas competitivas, incluido el potencial de superar a los competidores para convertirse en líderes indiscutibles del mercado.

¿QUIÉNES DEBEN ASISTIR?

 

El Curso está dirigido a profesionistas de entidades financieras interesados en el desarrollar potentes modelos de credit scoring y calibrar la salida de los mismos, así como a responsables de modelos en los departamentos de riesgo crédito y ciencia de datos.

 

Para la mejor comprensión de los temas es necesario que el participante tenga conocimientos de estadística y matemáticas. Puedes beneficiarte de las tecnologías de computación cuántica sin necesidad de tener conocimientos de física cuántica.

 

 

 

Credit Scoring

Credit Scoring

Watch Now
fondo-azul-degradado-lujo-abstracto-azul-oscuro-liso-banner-estudio-vineta-negra.jpg
Time.png

Horarios:

  • Santiago de Chile, Sao Paulo, Buenos Aires, Santo Domingo: L a V: 18-21h

  • España, Portugal: L a V 19-22 h

 

  • Ciudad de México, Quito, Bogotá, San JoséL a V 19-22 h

Price.png

Precio: 7 900 €

 

Level.png

Nivel: Avanzado

 

Duration.png

Duración: 40 h

 

Material.png

     Material: 

  • Presentaciones PDF

  • Ejercicios en Excel, R , SAS, Python, Jupyterlab y Tensorflow

Diapositiva4.png
fondo-azul-degradado-lujo-abstracto-azul-oscuro-liso-banner-estudio-vineta-negra.jpg

AGENDA
 Credit Scoring, Inteligencia Artificial y Machine Learning Cuántico 

 

 

CREDIT SCORING

Módulo 0: Computación Cuántica y algoritmos (Opcional)

 

  • Futuro de la computación cuántica en la banca

  • ¿Es necesario saber mecánica cuántica ?

  • Aplicaciones y hardware de QIS

  • Operaciones cuánticas

  • Representación de Qubit

  • Medición

  • Superposición

  • Multiplicación de matrices

  • Operaciones de Qubits

  • Múltiples Circuitos cuánticos

  • Entanglement

  • Algoritmo de Deutsch

  • Transformada cuántica de Fourier y algoritmos de búsqueda

  • Algoritmos híbridos cuánticos-clásicos

  • Quantum annealing, simulación y optimización de algoritmos

  • Algoritmos cuánticos de machine learning

  • Ejercicio 1: Operaciones cuánticas 

Módulo 1: Inteligencia Artificial para el Credit Scoring

 

  • Definición de Big Data

  • Big Data en las entidades financieras y fintech

  • Big data en las Bigtech

  • Tipología de datos

    • Estructurados

    • Semiestructurados

    • Datos No Estructurados

  • Big data: Volumen, Velocidad, Variedad, Veracidad y Valor

  • Tamaño de los Big Data

  • Fuentes de grandes volúmenes de datos

    • Data transaccional

    • Data de redes sociales

    • Data de buró de crédito

    • Origen de las fuentes de datos

    • Los datos de la web

    • Datos de Texto

    • Datos de sensores

    • Datos de RFID y NFC

    • Datos de operadores de telecos

    • Datos de redes inteligentes

  • Digitalización bancaria​

  • Inclusión financiera

  • Regulación en Europa, EEUU y Latinoamérica

  • Inteligencia Artificial en la banca

  • Inteligencia Artificial en el ciclo de crédito

 

Módulo 2: AI en el Credit Scoring 

 

  • AI en el Credit Scoring para Banca y Fintech

  • Credit scoring offline y online

  • Diseño y Construcción de Modelos de Credit Scoring

  • Ventajas e Inconvenientes

  • Modelos para afrontar nuevas crisis financierias

  • Machine Learning para desarrollar y validar credit scoring

  • Importancia del Bureau Score

  • Gestión de los Credit Scorecards

  • Estimación de la Probabilidad de Default PD 

Módulo 3: Machine Learning

 

  • Definición del Machine Learning 

  • Metodología del Machine Learning

    • Almacenamiento de la Data

    • Abstracción

    • Generalización

    • Evaluación

  • Aprendizaje Supervisado

  • Aprendizaje No Supervisado

  • Aprendizaje por Refuerzo

  • Deep Learning

  • Tipología de algoritmos de Machine Learning

  • Pasos para implementar un algoritmo

    • Recogida de información

    • Análisis Exploratorio

    • Entrenamiento del modelo

    • Evaluación del Modelo

    • Mejoras al modelo

    • Machine Learning en riesgo crédito de consumo

  • Machine Learning en modelos de credit scoring

  • Machine Learning cuántico 

 

MODELIZACIÓN

Módulo 4: Análisis Exploratorio 

  • Tipología de datos 

  • Datos transaccionales

  • Unstructured data embebida en documentos de texto

  • Social Media Data

  • Fuentes de datos

  • Revisión del dato

  • Definición del Target

  • Horizonte temporal de la variable objetivo

  • Muestreo

    • Muestreo Aleatorio

    • Muestreo Estratificado

    • Muestreo Rebalanceado

  • Análisis Exploratorio:

    • Histogramas

    • Q-Q Plot

    • Análisis de momentos

    • Box Plot

  • Tratamiento de los valores Missing

    • Modelo Multivariante de Imputación

  • Técnicas avanzadas de detección de Outliers y tratamiento

    • Técnica univariante: winsorized y trimming

    • Técnica Multivariante: Distancia de Mahalanobis

Módulo 5: Análisis Univariante

  • Estandarización de los Datos

  • Categorización de variables

    • Equal Interval Binning

    • Equal Frecuency Binning

    • Prueba Ji-Cuadrada

  • Binary Coding

  • WOE Coding

    • Definición WOE

    • Análisis Univariante con variable Target

    • Selección de variables

    • Tratamiento de Variables continuas

    • Tratamiento de Variables Categóricas

    • Gini

    • Information Value

    • Optimización de variables continuas

    • Optimización de variables categóricas

  • ​Ejercicio 1: Análisis Exploratorio en R

  • Ejercicio 2: Detección y tratamiento de Outliers Avanzado

  • Ejercicio 3: Muestreo estratificado y Aleatorio en R

  • Ejercicio 4: Modelo multivariante de impuación

  • Ejercicio 5: Análisis univariante en percentiles en R

  • Ejercicio 6: Análisis univariante óptimo variable continua en Excel

  • Ejercicio 7: Estimación del KS, Gini e IV de cada variable en Excel

  • Ejercicio 8: Análisis Word Cloud de variables en R

MACHINE LEARNING

Aprendizaje No Supervisado

Módulo 6: Modelos no supervisados

  • Clusters Jerárquicos

  • K-Means

  • Algoritmo estándar

  • Distancia Euclidiana

  • Análisis de Componentes principales (PCA)

  • Visualización avanzada de PCA

  • Eigenvectores e Eigenvalores
  • Ejercicio 14: Componentes principales en R y SAS

  • Ejercicio 15: Segmentación de la data con K-Means R

 

Aprendizaje Supervisado

Módulo 7: Regresión Logística y Regresión LASSO

 

  • Modelos Econométricos 

    • Regresión Logit

    • Regresión probit
    • Regresión Piecewise

    • Modelos de supervivencia

  • Modelos de Machine Learning

    • Regresión Lasso

    • Regresión Ridge

  • Riesgo de Modelo en la regresión logística

  • Ejercicio 16: Credit Scoring Regresión Logística en SAS y R

  • Ejercicio 17: Credit Scoring Regresión Logística Lasso en R

  • Ejercicio 18: Riesgo de Modelo usando Intervalos de confianza de coeficientes de regresión logística 

Módulo 8: Árboles, KNN y Naive Bayes

 

  • Árboles de Decisión

    • Modelización

    • Ventajas e inconvenientes

    • Procesos de Recursión y Particionamiento

    • Recursive partitioning tree

    • Pruning Decision tree

    • Conditional inference tree

    • Visualización de árboles

    • Medición de la predicción de árboles de decisión

    • Modelo CHAID

    • Modelo C5.0

  • K-Nearest Neighbors KNN

    • Modelización

    • Ventajas e inconvenientes

    • Distancia Euclidiana

    • Distancia Manhattan

    • Selección del valor K

  • Modelo Probabilístico: Naive  Bayes

    • Bayes Ingenuo

    • Teorema de Bayes

    • Estimador de Laplace

    • Clasificación con Naive Bayes

    • Ventajas e inconvenientes

  • Ejercicio 19: Credit Scoring Árbol de decisión en SAS y R

  • Ejercicio 20: Credit Scoring KNN en R y SAS

  • Ejercicio 21: Credit Scoring Naive Bayes en R

Módulo 9: Support Vector Machine SVM

  • SVM con variables dummy

  • SVM

  • Hiperplano óptimo

  • Support Vectors

  • Añadir costes

  • Ventajas e Inconvenientes

  • Visualiización del SVM

  • Tuning SVM

  • Truco de Kernel

  • Ejercicio 22: Credit Scoring Support Vector Machine en R data 1

  • Ejercicio 23: Credit Scoring Support Vector Machine en Python data 2

Módulo 10: Ensemble Learning

  • Modelos de conjuntos

  • Bagging

  • Bagging trees

  • Random Forest