Skip to content
Arquitectura de datos financieros

1. Qué es arquitectura de datos

Una arquitectura de datos es el diseño que define cómo una organización:
Captura datos desde sus fuentes.
Los almacena en estructuras adecuadas.
Los transforma para hacerlos confiables.
Los protege con controles de acceso.
Los documenta con metadatos y linaje.
Los expone para análisis, modelos, reportes y decisiones.
Los monitorea para asegurar calidad y cumplimiento.
En una institución financiera, esta arquitectura debe resolver una tensión permanente: los datos deben estar suficientemente disponibles para generar valor, pero suficientemente controlados para evitar riesgo operativo, reputacional y regulatorio.

2. Data warehouse

El data warehouse es un repositorio estructurado, curado y orientado al análisis. Normalmente almacena datos ya transformados, organizados en modelos dimensionales o relacionales, con definiciones estables y consistentes.

Para qué sirve en finanzas

El data warehouse es especialmente útil cuando la institución necesita reportes consistentes y repetibles. Por ejemplo:
Caso financiero
Por qué conviene un warehouse
Reportes regulatorios
Requieren consistencia, trazabilidad y definiciones estables
Rentabilidad por cliente
Necesita datos limpios y reglas de negocio claras
Indicadores de riesgo
Exigen cálculos controlados y auditables
Tableros ejecutivos
Requieren una “versión única de la verdad”
Cierre financiero
Depende de conciliaciones y datos certificados
El warehouse no está diseñado para guardar todo. Está diseñado para guardar lo que ya fue entendido, modelado, validado y puesto al servicio de decisiones recurrentes.

3. Data lake

El data lake es un repositorio más flexible que permite almacenar datos estructurados, semiestructurados y no estructurados en su formato original o casi original. Puede incluir tablas, archivos, logs, documentos, imágenes, texto, audio, eventos digitales, feeds de mercado y datos externos.

Para qué sirve en finanzas

Caso financiero
Por qué conviene un lake
Análisis exploratorio
Permite trabajar con datos aún no modelados
Fraude digital
Integra eventos, logs, comportamiento y transacciones
Churn bancario
Combina transacciones, CRM, app, call center y redes
Trading cuantitativo
Integra precios, noticias, sentimiento y datos alternativos
Modelos de ML
Requiere muchas variables, históricos amplios y datos diversos
El lake permite descubrir valor antes de que la organización sepa exactamente qué estructura necesitará. Su riesgo principal es convertirse en un data swamp: un pantano de datos sin catálogo, calidad, dueño ni reglas de uso.

4. Lakehouse

El lakehouse combina la flexibilidad del data lake con algunas capacidades de gobierno, estructura y desempeño del data warehouse. En la práctica, muchas arquitecturas modernas buscan este enfoque porque permite manejar datos diversos, pero con mayor control transaccional, metadatos, calidad y trazabilidad.

Uso financiero típico

Un banco puede usar un lakehouse para:
Recibir datos crudos de transacciones, app móvil, web, call center y buró.
Limpiarlos y estandarizarlos.
Crear variables analíticas para modelos de riesgo, propensión o fraude.
Publicar datasets certificados para BI, ML y reportes.
Mantener linaje desde el dato original hasta el modelo o tablero final.

5. Cuándo usar lake vs. warehouse

La decisión no debe plantearse como una guerra entre data lake y data warehouse. En instituciones financieras maduras, ambos conviven.
Criterio
Data lake
Data warehouse
Tipo de dato
Crudo, diverso, estructurado o no estructurado
Curado, estructurado y modelado
Uso principal
Exploración, ML, integración masiva
Reporteo, BI, KPIs, regulación
Flexibilidad
Alta
Media-baja
Control semántico
Requiere gobierno fuerte
Alto por diseño
Usuarios típicos
Data engineers, data scientists, analistas avanzados
Finanzas, riesgos, dirección, auditoría
Riesgo principal
Data swamp
Rigidez y lentitud ante nuevas fuentes
Usa lake cuando todavía estás descubriendo el valor del dato. Usa warehouse cuando ya sabes qué significa el dato y necesitas reportarlo de forma consistente.

Want to print your doc?
This is not the way.
Try clicking the ··· in the right corner or using a keyboard shortcut (
CtrlP
) instead.