Los días en que las empresas se preguntaban si deberían subirse de lleno a la ciencia de datos, o si debían tener un solo analista de datos, se han ido. Para las empresas de hoy, el enfoque se ha centrado en construir el equipo adecuado para aprovechar al máximo todo lo que los datos tienen para ofrecer.
Los roles digitales están cambiando junto con una mayor adopción y avances en la tecnología, y los títulos son imprecisos ya que diferentes empresas y sectores usan diferentes nombres para trabajos similares. Algunos pueden tener un analista digital que realiza una variedad de tareas, mientras que otros están en camino de construir un equipo de expertos en diferentes áreas.
A medida que las empresas buscan adoptar completamente los datos y aumentar sus departamentos de análisis, crear la operación correcta es clave. Aquí hay algunos roles clave que BDS pone a disposición de APT en un formato de célula de AA-ML scrum.
Ingeniero de datos
Los ingenieros de datos son una parte central de una célula AA-ML scrum. Los ingenieros recopilan y administran datos, y administran el almacenamiento de los datos. Su trabajo es la base de una operación de datos, ya que toman grandes cantidades de datos en bruto y los preparan para otros que toman decisiones comerciales, escriben algoritmos de predicción y similares.
Funciones
Dentro de un equipo Scrum de Analytics, el ingeniero de datos desempeña varias funciones clave para asegurar que los datos sean accesibles, fiables y manejables. Las siete principales funciones de nuestros ingenieros de datos son:
Diseño y Construcción de Infraestructuras de Datos: Crear y mantener la infraestructura necesaria para el análisis de datos, como bases de datos, data lakes y data warehouses. Esto implica asegurar que la infraestructura sea escalable, segura y eficiente.
Integración y Almacenamiento de Datos: Desarrollar procesos para recolectar, almacenar e integrar datos de diferentes fuentes. Esto incluye la implementación de ETL (Extract, Transform, Load) o procesos ELT (Extract, Load, Transform) para asegurar que los datos estén disponibles para el análisis.
Garantizar la Calidad y Fiabilidad de los Datos: Establecer y mantener prácticas de calidad de datos para asegurar la precisión, integridad y confiabilidad de los datos. Esto puede incluir la limpieza de datos, la detección y corrección de errores, y la gestión de duplicados.
Optimización del Rendimiento de las Consultas: Optimizar las consultas para mejorar la eficiencia y la velocidad al acceder a los datos. Esto es crucial en entornos de big data donde se manejan grandes volúmenes de información.
Seguridad de los Datos: Implementar medidas de seguridad para proteger los datos contra accesos no autorizados y brechas de seguridad. Esto incluye la gestión de permisos, el cifrado de datos y el cumplimiento de normativas como GDPR o HIPAA.
Automatización de Procesos de Datos: Desarrollar y mantener scripts y herramientas para automatizar tareas repetitivas relacionadas con la gestión de datos, como backups, monitoreo del rendimiento de las bases de datos y actualizaciones automáticas.
Colaboración y Comunicación con el Equipo: Trabajar estrechamente con otros miembros del equipo, como científicos de datos, analistas de negocios y desarrolladores, para comprender sus necesidades de datos y asegurar que la infraestructura y los procesos de datos respalden eficazmente estos requisitos.
Estas funciones reflejan la importancia de un ingeniero de datos en el apoyo y facilitación de Analyrtics efectivos y eficientes dentro de un equipo de Scrum.
Habilidades
Nuestros ingenieros de datos trabajan exitosamente en AA/ML Scrum Teams gracias a una combinación de habilidades técnicas y metodológicas. Las siete más importantes son:
Dominio de Lenguajes de Programación: Conocimiento profundo de lenguajes de programación relevantes para el manejo de datos como Python, SQL, y ocasionalmente R. Python es especialmente valioso por su versatilidad y la amplia gama de bibliotecas de análisis de datos.
Experiencia en Manejo de Bases de Datos: Habilidad para trabajar con diversas bases de datos, ya sean SQL (como PostgreSQL o MySQL) o NoSQL (como MongoDB o Cassandra). Esto incluye conocimientos en diseño, mantenimiento y optimización de bases de datos.
Conocimientos en Big Data: Familiaridad con herramientas y tecnologías de big data como Hadoop, Spark, y Kafka. Estas tecnologías son cruciales para manejar grandes volúmenes de datos de manera eficiente.
Análisis y Visualización de Datos: Capacidades básicas para analizar y visualizar datos utilizando herramientas como Tableau, Power BI, o bibliotecas de Python como Matplotlib y Seaborn. Esto es esencial para convertir los datos en insights comprensibles.
Conocimientos en Machine Learning: Tiene bases en machine learning.
Prácticas de Ingeniería de Software: Habilidades en ingeniería de software, como control de versiones (Git), pruebas automatizadas, integración continua, y despliegue continuo.
Metodologías Ágiles y Scrum: Comprensión de la metodología ágile Scrum. Esto incluye familiaridad con el desarrollo iterativo, gestión de sprints, reuniones diarias, revisiones de sprint y retrospectivas. La capacidad para colaborar estrechamente con el equipo y adaptarse rápidamente a los cambios es crucial en un ambiente ágil.
Estas habilidades no sólo permiten al ingeniero de datos contribuir efectivamente en un AA/ML Scrum Team, sino que también le permite liderar y guiar aspectos técnicos complejos del proyecto.
Data scientist
Mientras que los ingenieros mantienen los datos, los científicos de datos descubren qué hacer con ellos. Nuestros científicos de datos están orientados al negocio, mientras que los ingenieros de datos se centran más en la infraestructura, la escala y la calidad de los datos.
Funciones
El científico de datos del AA/ML Scrum Team desempeña un rol central, aportando habilidades técnicas y conocimientos analíticos para convertir grandes volúmenes de datos en insights valiosos. Las siete principales funciones de un científico de datos en este contexto son:
Recopilación y Preprocesamiento de Datos: Recolectar y preparar datos de diversas fuentes para análisis. Esto incluye la limpieza de datos, manejo de datos faltantes, y transformación de datos para asegurar que sean de alta calidad y aptos para el análisis.
Análisis Exploratorio de Datos (EDA): Realizar análisis exploratorios para entender las características fundamentales de los datos, identificar patrones, anomalías y relaciones clave.
Desarrollo y Validación de Modelos de Machine Learning: Construir y validar modelos de analítica avanzada y machine learning para predecir, clasificar, o descubrir insights en los datos. Esto implica seleccionar algoritmos apropiados, ajustar parámetros y evaluar el rendimiento del modelo.
Interpretación y Comunicación de Resultados: Interpretar los resultados de los análisis y modelos, y comunicar estos hallazgos de manera clara y efectiva a los stakeholders no técnicos. Esto puede incluir la creación de visualizaciones de datos, informes y presentaciones.
Colaboración con Otros Roles: Trabajar en estrecha colaboración con ingenieros de datos, analistas, ingenieros de visualización de datos y otros miembros del equipo para asegurar que los análisis son relevantes y los datos son accesibles y correctamente manipulados.
Implementación y Mantenimiento de Soluciones Analíticas: Participar en la implementación de soluciones analíticas y asegurar su correcto funcionamiento a lo largo del tiempo. Esto puede incluir la integración de modelos en sistemas existentes y la monitorización de su rendimiento.
Innovación y Mejora Continua: Mantenerse actualizado con las últimas tendencias y técnicas en ciencia de datos y buscar constantemente formas de mejorar los métodos y procesos analíticos del equipo.
Estas funciones resaltan la importancia del papel del científico de datos en extraer valor de grandes conjuntos de datos y en apoyar la toma de decisiones basada en datos dentro de un AA/ML Scrum Team.
Habilidades
Nuestros científicos de datos tienen la siguiente mezcla de habilidades técnicas y metodológicas:
Dominio de Lenguajes de Programación: Dominio de lenguajes de programación como Python o R, que son fundamentales para el análisis de datos, manipulación de datos y desarrollo de modelos.
Conocimientos Avanzados en Estadística y Matemáticas: Entendimiento de conceptos estadísticos y matemáticos para realizar análisis de datos efectivos y desarrollar modelos predictivos precisos.
Experiencia en Machine Learning y Modelado Estadístico: Habilidad para construir y validar modelos predictivos y algoritmos de machine learning, incluyendo tanto técnicas supervisadas como no supervisadas.
Manejo de Grandes Conjuntos de Datos (Big Data): Capacidad para trabajar con grandes volúmenes de datos, utilizando herramientas como Hadoop, Spark, o plataformas de almacenamiento en la nube.
Visualización de Datos: Habilidades para crear visualizaciones de datos efectivas, usando herramientas como Tableau, Power BI o bibliotecas de Python como Matplotlib y Seaborn.
Conocimientos de Software de Ingeniería y Gestión de Datos: Familiaridad con sistemas de control de versiones como Git, así como experiencia en el uso de bases de datos SQL y NoSQL.
Metodologías Ágiles y Scrum: Comprensión de las metodologías ágiles, en particular Scrum, incluyendo la capacidad de trabajar en sprints, adaptarse a cambios rápidos y colaborar efectivamente en un equipo.
Estas habilidades aseguran que nuestros científicos de datos no sólo puedan contribuir técnicamente al equipo, sino también adaptarse a la dinámica y ritmo de un entorno ágil, colaborando eficazmente con otros miembros del equipo.
Business Analyst/Data Translator
Funciones
Habilidades
Visualization Engineer
Funciones
Los ingenieros de visualización de datos del AA/ML Scrum Team desempeña un papel crucial al transformar datos complejos en representaciones visuales comprensibles y útiles para la toma de decisiones.
Las funciones de este rol son:
Diseño y Desarrollo de Dashboards y Reportes: Crear paneles de control y reportes interactivos que resuman y presenten los datos de manera clara y efectiva. Estos dashboards son herramientas esenciales para que los stakeholders comprendan rápidamente los insights derivados de los datos.
Selección de Herramientas de Visualización Apropiadas: Escoger las herramientas y plataformas más adecuadas para la visualización de datos, como Tableau, Power BI, o bibliotecas de visualización en Python (por ejemplo, Matplotlib, Seaborn).
Colaboración en la Definición de Requerimientos: Trabajar con analistas de negocio, científicos de datos y usuarios finales para entender sus necesidades y objetivos, asegurando que las visualizaciones de datos sean relevantes y valiosas.
Optimización de Visualizaciones para Diversos Dispositivos: Asegurar que las visualizaciones sean accesibles y efectivas en diferentes dispositivos, incluyendo computadoras de escritorio, tablets y teléfonos móviles.
Asegurar la Exactitud y Consistencia de los Datos: Trabajar estrechamente con ingenieros de datos y analistas para garantizar que las visualizaciones reflejen con precisión los datos y sean consistentes en diferentes informes y dashboards.
Desarrollo y Mantenimiento de Bibliotecas de Visualización: Crear y mantener una biblioteca de plantillas y estándares de visualización para uso en todo el equipo, lo que ayuda a garantizar la coherencia y la eficiencia en el desarrollo de nuevas visualizaciones.
Capacitación y Soporte a Usuarios: Ofrecer formación y soporte a los usuarios finales en el uso de herramientas de visualización, ayudando a asegurar que puedan interpretar y aprovechar eficazmente las visualizaciones en su toma de decisiones.
Estas funciones reflejan la importancia de un ingeniero de visualización de datos en la comunicación efectiva de insights complejos, facilitando una mejor comprensión y toma de decisiones basada en datos dentro de la organización.
Habilidades
Para trabajar con éxito en un equipo Scrum de Analytics, un ingeniero de visualización de datos necesita una combinación de habilidades técnicas y metodológicas específicas. Las siete más importantes son:
Dominio de Herramientas de Visualización de Datos: Dominio de herramientas como Tableau, Power BI, Qlik, o similares, así como en bibliotecas de visualización en lenguajes de programación como Matplotlib, Seaborn, ggplot2 en R, etc.
Conocimientos en Diseño Gráfico y UX/UI: Entender principios de diseño gráfico y experiencia de usuario, para crear visualizaciones que no solo sean informativas, sino también atractivas y fáciles de entender para los usuarios.
Habilidad en el Manejo de Datos: Capacidad para manipular y preparar datos para la visualización, lo que implica conocimientos en SQL, Python, R u otros lenguajes de programación utilizados en la ciencia de datos.
Comprensión de Principios Estadísticos: Entender conceptos estadísticos básicos para representar correctamente los datos y evitar malinterpretaciones o representaciones engañosas.
Capacidad para Contar Historias con Datos (Data Storytelling): Habilidad para narrar historias a través de los datos, lo cual es crucial para transmitir el mensaje subyacente de los datos de manera efectiva.
Experiencia en Trabajo Colaborativo y Comunicación: Capacidad para trabajar en equipo y comunicarse efectivamente con miembros del equipo y stakeholders, especialmente para entender sus necesidades y explicar las visualizaciones.
Conocimiento de Metodologías Ágiles y Scrum: Entender las metodologías ágiles y el marco de trabajo de Scrum, incluyendo cómo encajan las tareas de visualización dentro de los sprints y cómo adaptarse a los cambios rápidos y a las prioridades dinámicas.
Estas habilidades aseguran que el ingeniero de visualización de datos pueda contribuir efectivamente al equipo de Scrum, no solo en la creación de visualizaciones de datos impactantes, sino también en la comunicación y colaboración efectiva dentro de un entorno ágil.
Analistas de Negocio/Data translator
Los traductores de datos sirven como puente entre los datos y las operaciones comerciales tradicionales al traducir los conocimientos obtenidos de la analítica en acciones que el cliente puede tomar para ganar valor.
Nuestros analistas de negocio saben lo que hacen los modelos para ser traductores, pero no son los que programan los mismos. Tienen habilidades de consultores de ciencia de datos y los consultores clásicos, ya que administran un equipo de ciencia de datos y comunican las necesidades y los resultados a los clientes en otras partes de la organización.
Nuestros analistas tienen conocimientos en:
Investigación de mercados
Documentación de requerimientos y elaboración de historias de usuario
Análisis y administración del riesgo
Interpretación de información
Definición de indicadores (KPI’s)
Herramientas: Word, Excel; disponibles dependiendo del requerimiento de la célula: Power BI, Tableau, QlikView, Qlik Sense, MicroStrategy.
Knowledge engineers
Nuestros ingenieros del conocimiento construyen inteligencia en los sistemas: crean algoritmos que pueden imitar las decisiones humanas. Más allá de la estadística, los nuestros ingenieros del conocimiento trabajan para proporcionar semántica: cómo se relaciona la información con el resto del mundo.
Llevan todo el cuestionamiento del lenguaje natural que tienen los negocios a otro nivel. Consumen los resultados de la analítica avanzada en sus gráficos de conocimiento y ontologías y llegan a respuestas reales a las preguntas comerciales.
Nuestros ingenieros cuentan con el siguiente conocimiento;
Desarrollo de contenido
Creación de sistemas expertos
Herramientas disponibles dependiendo del requerimiento de la célula: Python, SQL, RDF, SPARQL, OWL-Business Intelligence, Big Data-Bases de datos.
Scrum Master
Los scrum masters de BDS actúan como couchs, guiando al equipo a niveles cada vez más altos de cohesión, autoorganización y rendimiento. El maestro scrum ayuda al equipo a aprender y aAPTicar scrum relacionadas a la mejor ventaja del equipo.
Nuestros maestros scrum tienen los siguientes conocimientos y habilidades:
Certificados scrum master
Herramientas: Jira y confluence
Comunicación
Gestión de equipos
Motivación
Negociación y mediación
Full stack developer
El valor de la AA y el ML se manifiesta hasta que la cadena de valor de los datos llega hasta la operación por lo cual las células scrum de BDS también proveen de desarrolla rores “full-stack”. Éstos son programadores con un perfil técnico muy comAPTeto que conoce bien tanto lo referente a back-end como lo referente a front-end, se manejan en sistemas y los entienden.
Nuestros desarrolladores full-stack tienen los siguientes conocimientos:
Conocimiento en metodologías Ágiles
Conocimiento en mejores prácticas de desarrollo
Conocimiento en seguridad y privacidad de la información
Herramientas disponibles dependiendo del requerimiento de la célula: Node.JS-Java (JAX-WS/JAX-RS; JEE; EJB; JPA; Spring; Hibernate; SQL)-JavaScript, HTML-Servicios REST-MongoDB y Sockets-GIT
Subject Matter Expert
Los equipos scrum para AA-ML de BDS son mucho más que un equipo de staff habilitado con herramientas para la gestión ágil de proyectos y aprendizaje, creación y difusión de conocimiento. Las células scrum de BDS vienen acompañadas de un experto, SME, en AA-ML aAPTicado a bienes de consumo y retail que asesora y se asegura que el conocimiento de industria y de negocio fluya correctamente a través de todo APT.
Nuestros SMEs tiene más de 10 años de experiencia en la ejecución de proyectos exitosos de AA y ML aAPTicado a la industria de productos de consumo empaquetados y retail.