Matriz de decisión: vistas materializadas, modelos incrementales y tablas
Describe las características de tu caso de uso y la matriz calcula qué estrategia de almacenamiento se ajusta mejor al patrón real, no a la convención del equipo.
Cada dimensión pondera características específicas de tu caso de uso contra los trade-offs reales de cada estrategia.
Cuándo cada estrategia gana y cuándo pierde
Las tres estrategias tienen casos de uso legítimos. El error más frecuente es elegir por convención del equipo o por la herramienta disponible, no por las características del problema.
Ganan cuando los datos de origen cambian poco, la consulta es costosa y los consumidores la ejecutan muchas veces sobre los mismos datos. El resultado precalculado se sirve directamente sin recalcular. Pierden cuando los datos cambian con frecuencia (cada recálculo invalida el caché), cuando el volumen es muy grande (el recálculo completo es costoso), o cuando se necesita historial de cambios.
Ganan cuando el volumen de datos crece continuamente, solo una fracción de los registros cambia en cada ejecución, y se necesitan puntos de restauración ante errores. Procesan solo el delta, no el dataset completo. Pierden cuando la lógica requiere comparaciones entre todos los registros históricos (la ventana incremental no captura el estado completo) o cuando las ejecuciones fallidas pueden generar inconsistencias difíciles de reconciliar.
Ganan cuando se necesita el máximo control sobre el esquema, el historial completo de cambios, y la flexibilidad para que cualquier consulta acceda al dato crudo sin restricciones de la capa de transformación. Son el punto de partida del pipeline, no el destino final. Pierden en costo cuando no están correctamente particionadas y cualquier consulta escanea el dataset completo.