
Predicción de riesgo crediticio con modelos de lenguaje: evidencia desde Chile
Académico de FEN U. de Chile expone resultados pioneros sobre inteligencia artificial aplicada al sistema financiero
Recientemente se desarrolló el seminario académico “Can Large Language Models Predict Credit Risk? An Empirical Study on Consumer Loans in Chile”, presentado por David Díaz, profesor asociado del Departamento de Administración de la Facultad de Economía y Negocios de la Universidad de Chile. Estudio realizado en conjunto con Diego Beas L., de la Comisión para el Mercado Financiero (CMF).
La presentación exploró si los modelos de lenguaje de gran escala (LLMs), como ChatGPT o LLaMA, pueden ser utilizados para predecir riesgo de crédito en consumidores chilenos, comparándolos con métodos clásicos de machine learning. Se evaluó su precisión, estabilidad, explicabilidad y utilidad práctica, con resultados promisorios para su uso en el sistema financiero.
IA y crédito: más que una. tendencia
Para esto, se utilizó una muestra de 10.000 operaciones de crédito de consumo otorgadas por bancos en Chile entre 2010 y 2020 con el fin de comparar el desempeño de los modelos de lenguaje de gran escala (LLMs) frente a técnicas tradicionales como regresión logística y LightGBM. Las predicciones fueron evaluadas mediante métricas estándar del aprendizaje automático, tales como AUROC, precisión, recall y estabilidad.
Los resultados indicaron que los LLMs ajustados mediante fine-tuning alcanzaron un rendimiento similar al de los modelos tradicionales, con AUROC cercano al 80% y una precisión promedio destacada. Incluso los modelos sin entrenamiento adicional (“use as is”) demostraron un rendimiento competitivo, lo que sugiere su viabilidad en contextos reales de evaluación crediticia.
Explicabilidad y control humano: claves para su adopción
Uno de los puntos más innovadores del estudio fue la capacidad explicativa de los LLMs. A través de técnicas de prompt engineering, los modelos no solo entregaron predicciones, sino también justificaciones de sus decisiones. Estas explicaciones fueron evaluadas por un experto humano con una calificación promedio de 5,5 sobre 7, lo que es un hallazgo prometedor respecto de su utilidad interpretativa.
Sin embargo, el académico enfatizó que la supervisión humana es indispensable para garantizar la trazabilidad, el cumplimiento regulatorio y la corrección de posibles inconsistencias del modelo y que todavía existe mucho trabajo por hacer respecto de validar los resultados en otros contextos y condiciones.
Aplicaciones prácticas: una herramienta para la inclusión financiera
El estudio concluye que los LLMs tienen potencial para transformar el análisis de riesgo crediticio, especialmente en instituciones que no cuentan con amplias capacidades técnicas o presupuestos para desarrollar modelos propios.
Entre sus aplicaciones futuras destacan:
- Automatización de evaluaciones crediticias con criterios explicables.
- Mejora en la experiencia del cliente al brindar transparencia en las decisiones.
- Generación de reportes personalizados para reguladores y supervisores.
- Implementación rápida por parte de pequeñas instituciones financieras o fintechs.
Esta actividad forma parte de la agenda de seminarios académicos impulsados por el Departamento de Administración FEN U. de Chile, reafirmando su liderazgo en la investigación aplicada y en la vinculación entre inteligencia artificial, finanzas y política pública.










