Consultoría Crisp DM (Cross Industry Standard Process for Data Mining) para la adopción de Ciencia de Datos:
Haciendo uso de CRISP-DM (Cross Industry Standard Process for Data Mining) se sigue un proceso estandarizado de entendimiento del negocio y sus datos, de forma análoga a como se hace en la ingeniería del software con los modelos de ciclo de vida de desarrollo de software.
COMPRENSIÓN DEL NEGOCIO
Definición de necesidades de la organización
COMPRENSIÓN DE DATOS
Inicia con la recolección de datos inicial y continúa con las actividades que permiten familiarizarse con los datos, identificar los problemas de calidad, descubrir conocimiento preliminar sobre los datos, y/o descubrir subconjuntos interesantes para formar hipótesis en cuanto a la información oculta.
PREPARACIÓN DE DATOS
Análisis de los datos y selección de características. Transformación y la limpieza de datos para las herramientas de modelado de Ciencia de Datos.
MODELADO
Seleccionar y aplicar las técnicas adecuadas de modelado de Ciencia de Datos que sean pertinentes al problema (cuantas más mejor), y se calibran sus parámetros a valores óptimos.
EVALUACIÓN
En esta etapa en el proyecto, se han construido uno o varios modelos que parecen alcanzar calidad suficiente desde la una perspectiva de análisis de datos. Un objetivo clave es determinar si hay alguna cuestión importante de negocio que no haya sido considerada suficientemente. Al final de esta fase, se debería obtener una decisión sobre la aplicación de los resultados del proceso de análisis de datos.
DESPLIEGUE
El conocimiento obtenido tendrá que organizarse y presentarse para que la organización pueda usarlo.
Duración: este proceso tiene una duración estandarizada de 80 horas, se pueden ejecutar tantos ciclos como se requieran y de manera iterativa. Incluso acortarse de acuerdo al tamaño y áreas de la organización.