Skip to content
Gallery
crisp-dm
CRISP-DM
Share
Explore
Elaborado por de


La aplicación de la analítica, tomando a esta como el herramental técnico que permite describir y predecir eventos, así como sus posibles causas y medidas correctivas, ofrece una oportunidad patente para mejorar el desempeño de los negocios. Pero esta oportunidad puede ser infructuosa o, en el mejor de los casos, momentánea si no se desarrolla como una capacidad organizacional.


megaphone
Analítica aplicada a los negocios. Agrupamos los métodos y herramientas de Analytics tres: analítica descriptiva, que nos dice lo que ya ha sucedido; analítica predictiva, que nos muestra lo que podría suceder, y finalmente, analítica prescriptiva, que nos informa de lo que debería suceder en el futuro. Si bien cada uno de estos métodos es útil cuando se usa individualmente, se vuelven especialmente poderosos cuando se usan juntos.

image.png

La promesa

image.png

El problema

image.png

La solución

Los métodos y herramientas de Analytics son variados por lo que saber cuándo y cómo usar cada grupo de herramientas es una capacidad indispensable para obtener valor económico en las organizaciones. Afortunadamente, existe un marco de referencia, el más usado, como un proceso eficiente para aprovechar las oportunidades que ofrece la analítica aplicada a los negocios, este es el Cross Industry Standard Process for Data Mining.

megaphone
CRISP-DM (del inglés Cross Industry Standard Process for Data Mining)​ se trata de un modelo del proceso que describe los enfoques comunes que utilizan los expertos en .


image.png
CrispDM 1 0.pdf
625.7 kB
CRISP-DM.pptx
55.6 kB

Business Understanding


image.png
“Ya tengo mi data lake y ahora quiero sacarle provecho. ¿Qué me recomiendas hacer?

La fase inicial se centra en comprender los objetivos y requisitos del proyecto desde una perspectiva de negocio, convirtiendo este conocimiento en una definición del problema de minería de datos y un plan preliminar diseñado para lograr los objetivos.
image.png
Pero requiere también que esos objetivos y requisitos sean entendidos dentro de una profunda comprensión del
modelo de negocio
, así como de sus componentes e indicadores. No tener en cuenta esto produce modelos y herramientas inútiles.

Actividades y entregables Entendimieto de Negocio
Actividad
Descripción
Entregables
Notes
1
Determinar el reto de negocio
Antecedentes
Objetivos de negocio
Criterios de éxito de negocio
2
Diagnosticar la situación
3
Determinar los objetivos de ciencia de datos
4
Elaborar el plan de proyecto
There are no rows in this table

Mejores prácticas

Hacer un recorrido inicial de estas tres primeras actividades dentro de talleres de haciendo énfasis en , dolores, user stories y matriz de hipótesis, y consultando prácticas analíticas existentes para la industria a la que pertenece el negocio (ver )
Así mismo, se recomienda que el Initial Assessment of Tools & Techniques contenga la existente y deseable.

Data Understanding

image.png

La fase de comprensión de datos comienza con una recopilación inicial de datos y continúa con actividades para familiarizarse con los datos, identificar problemas de calidad de datos, descubrir los primeros conocimientos sobre los datos o detectar subconjuntos interesantes para formar hipótesis para información oculta.
image.png

Dimensiones de la calidad de datos

Accuracy
¿Es correcta la información en todos los detalles?
Completeness
¿Qué tan completa es la información?
Reliability
¿La información contradice otras fuentes confiables?
Relevance
¿Realmente necesitas esta información?
Timeliness
¿Qué tan actualizada está la información? ¿Se puede utilizar para informes en tiempo real?

Mejores prácticas

Durante todo el proceso y el siguiente se estará pidiendo datos a distintos actores en distintos momentos y medios por lo que un control adecuado de estos datos solicitados y recibidos es imprescindible. Dada lo anterior se recomienda como mejor práctica generar un .
Al finalizar este proceso es conveniente agregar una actividad que permita determinar qué se puede hacer para contar con datos inexistentes y la facilidad de hacerlo ya sea por medio de la práctica de o de las técnicas para generar .

Data Preparation

image.png
La fase de preparación de datos cubre todas las actividades para construir el conjunto de datos final (datos que se introducirán en la(s) herramienta(s) de modelado) a partir de los datos sin procesar iniciales. Es probable que las tareas de preparación de datos se realicen varias veces y no en ningún orden prescrito. Las tareas incluyen la selección de tablas, registros y atributos, así como la transformación y limpieza de datos para herramientas de modelado.
image.png
Actividades y entregables Preparación de datos
Actividad
Descripción
Entregables
Notes
1
Seleccionar los datos
2
Limpiar los datos
3
Construir los datos
Esta tarea incluye operaciones constructivas de preparación de datos, como la producción de atributos derivados, registros completamente nuevos o valores transformados para atributos existentes.
Atributos derivados
Los atributos derivados son atributos nuevos que se construyen a partir de uno o varios atributos existentes en el mismo registro. Ejemplos: área = largo * ancho.
Registros generados
Describe la creación de registros completamente nuevos. Ejemplo: crear registros para clientes que no realizaron ninguna compra durante el año pasado. No había ninguna razón para tener tales registros en los datos sin procesar, pero para fines de modelado, podría tener sentido representar explícitamente el hecho de que ciertos clientes no realizaron ninguna compra.
RFM
se puede considerar una técnica para agregar atributos a los datos de consumidor.
4
Integrar los datos
5

Formatear los datos

There are no rows in this table



Modeling

image.png
En esta fase, se seleccionan y aplican varias técnicas de modelado y sus parámetros se calibran a valores óptimos. Normalmente, existen varias técnicas para el mismo tipo de problema de minería de datos. Algunas técnicas tienen requisitos específicos sobre la forma de los datos. Por lo tanto, a menudo es necesario volver a la fase de preparación de datos.
image.png

Understanding Statistics and Experimental Design.pdf
3.5 MB


Evaluation

En esta etapa del proyecto, ha creado un modelo (o modelos) que parece tener alta calidad desde una perspectiva de análisis de datos. Antes de proceder a la implementación final del modelo, es importante evaluar más a fondo el modelo y revisar los pasos ejecutados para construir el modelo para asegurarse de que logra correctamente los objetivos comerciales. Un objetivo clave es determinar si hay algún problema comercial importante que no se haya considerado lo suficiente. Al final de esta fase, se debe llegar a una decisión sobre el uso de los resultados de la minería de datos.
image.png
Actividades y entregables Evaluación
Actividad
Entregables
Notas
1
Evaluación de resultados
Diagnóstico de los resultados analíticos
Modelo(s) aprobados
Hay medidas de precision de los modelos como MAPE.
Los entregables deben de seguir los criterios de
2
Revisión del proceso
Documento describiendo el proceso llevado
3
Determinación de próximos pasos
Listado de próximas acciones
Decisión(es) sugerida(s)
There are no rows in this table

Deployment

La creación del modelo generalmente no es el final del proyecto. Incluso si el propósito del modelo es aumentar el conocimiento de los datos, el conocimiento adquirido deberá organizarse y presentarse de manera que el cliente pueda usarlo. A menudo implica aplicar modelos "en vivo" dentro de los procesos de toma de decisiones de una organización, por ejemplo, en la personalización en tiempo real de páginas web o la puntuación repetida de bases de datos de marketing. Sin embargo, dependiendo de los requisitos, la fase de implementación puede ser tan simple como generar un informe o tan compleja como implementar un proceso de minería de datos repetible en toda la empresa. En muchos casos, es el cliente, no el analista de datos, quien lleva a cabo los pasos de implementación. Sin embargo, incluso si el analista no llevará a cabo el esfuerzo de implementación, es importante que el cliente comprenda por adelantado qué acciones deben llevarse a cabo para hacer uso real de los modelos creados.
image.png
CRISP-DM – Phase 6 Deployment.pptx
50.7 kB
Actividades y entregables Implantación
Actividad
Entregable
1
Desarrollar el plan de implantación
Plan de implantación
2
Monitorear y dar mantenimiento al plan
Plan de monitoreo y mantenimiento
3
Elaborar reporte final
Reporte final
Presentación final
There are no rows in this table

Mejor práctica

Se recomienda conforme avanzan las ejecuciones del CRISP-DM se vaya avanzando en del desarrollo y afinación del

Business Intelligence (BI) como caso específico de Analytics

megaphone
BI es una solución que se alimenta de datos de negocios y presenta reportes, tableros, tablas y gráficos de forma amigable para el usuario.

Want to print your doc?
This is not the way.
Try clicking the ⋯ next to your doc name or using a keyboard shortcut (
CtrlP
) instead.