Skip to content

Análisis de la base de datos

1. Business Understanding (Comprensión del Negocio)

1.1 Contexto del Negocio

La base de datos contiene transacciones de ventas de una empresa que comercializa productos de construcción y materiales, con operaciones en múltiples zonas y áreas geográficas.

1.2 Objetivos de Negocio Identificados

Segmentación de clientes: Clasificar clientes por comportamiento de compra (Autoconstrucción, Ferretero/Distribuidor, Gobierno, Industrial, etc.)
Análisis de elasticidad: Determinar sensibilidad de clientes a precios y promociones
Optimización de cartera: Identificar patrones de compra por presentación de producto
Gestión de clientes: Evaluar recencia, frecuencia y valor de clientes

1.3 Criterios de Éxito

Base de datos limpia y estructurada para modelado
Variables de segmentación definidas
Métricas de comportamiento por cliente disponibles

2. Data Understanding (Comprensión de los Datos)

2.1 Estructura de Datos

Fuente Principal (SAP): Transacciones de ventas
python

Dimensiones identificadas

Temporal: Created On (2023-12-01 a 2026-01-06)
Geográfica: Zona, Area
Producto: Product, Presentacion PDM
Cliente: Customer Number, Customer Name
Transaccional: Amount, Price, Volumen, Order Number Fuente Secundaria (Diccionario): Catálogo de productos
python
Product: Código de producto
Presentacion PDM: Clasificación por presentación

2.2 Análisis Exploratorio Inicial

Aspecto
Hallazgo
Implicación
Calidad de fechas
Múltiples formatos en 'Created On'
Necesidad de estandarización
Calidad de Amount
Caracteres especiales ($, ,, -)
Requiere limpieza de formato
Calidad de datos geográficos
Inconsistencias en 'Area' y 'Zona' (Juárez vs Juarez)
Estandarización necesaria
Productos
23 productos específicos filtrados
Enfoque en productos core
Monedas
MXN, USD, EUR
Solo MXN para análisis local
Segmentos excluidos
Filiales, Exportación, Empleados
Enfoque en mercado nacional
There are no rows in this table

3.2 Transformaciones Realizadas

Etapa
Operación
Justificación
Fechas
Normalización y eliminación de horas
Análisis diario sin ruido temporal
Amount
Limpieza de caracteres + conversión numérica
Cálculos matemáticos precisos
Geografía
Corrección de tildes y asignaciones
Agrupaciones consistentes
Productos
Reetiquetado y filtrado
Enfoque en productos relevantes
Monedas
Filtrado USD/EUR
Análisis en moneda local
There are no rows in this table

3.3 Datos Eliminados por Categoría

Categoría
Valores Eliminados
% Estimado
Filiales
Sales Group = 'FIL'
Bajo
Exportación
Area Exportación USA/SUD
Medio
Moneda extranjera
USD, EUR
Bajo
Segmentos no comerciales
Empleados, Público General
Bajo
Valores negativos
Amount ≤ 0
Muy bajo
There are no rows in this table

Variables de Comportamiento

Variable
Cálculo
Insight de Negocio
Presencia Area
nunique('Area')
Alcance geográfico del cliente
Presencia Zona
nunique('Zona')
Distribución regional
Unique Products
nunique('Product')
Diversidad de cartera comprada
Monto por Presentación
Pivot por Presentacion PDM
Preferencia de formato
There are no rows in this table

Validación de Negocio

Hallazgos Clave:
Segmentación válida: Los segmentos creados (Ferretero/Distribuidor, Gobierno, etc.) son mutuamente excluyentes
Recencia medible: Rango de días desde último pedido identificado
Comportamiento por presentación: Posibilidad de análisis por formato de producto
Alcance geográfico: Presencia en áreas y zonas cuantificada
Want to print your doc?
This is not the way.
Try clicking the ··· in the right corner or using a keyboard shortcut (
CtrlP
) instead.