¿Cuáles son los pasos para el análisis visual de big data?
El análisis de requisitos es el requisito previo para los proyectos de visualización de big data. Es necesario describir los antecedentes y el propósito del proyecto, los objetivos comerciales, el alcance comercial, las necesidades comerciales y los requisitos funcionales, y aclarar las expectativas y necesidades de la unidad de implementación para la visualización. Incluyendo los temas a analizar, las posibles perspectivas de cada tema, las reglas que deben ventilarse en todos los aspectos de la empresa, las necesidades de los usuarios, etc.
2. Establecer un modelo de almacén de datos/mercado de datos.
Basado en el análisis de la demanda, se estableció un modelo de data warehouse/data mart. El modelado de almacenes de datos/mercados de datos incluye no sólo el modelado ER y el modelado relacional de la base de datos, sino también la tecnología de modelado dimensional específicamente para almacenes de datos.
3. Extracción, limpieza, transformación y carga de datos (ETL)
La extracción de datos se refiere a la extracción de los datos necesarios para los almacenes/mercados de datos de varios sistemas comerciales. Debido a que la calidad de los datos de cada sistema empresarial es diferente, se debe establecer un proceso de extracción diferente para cada fuente de datos. Cada proceso de extracción de datos requiere el uso de interfaces para pasar los metadatos a las etapas de limpieza y transformación.
El propósito de la limpieza de datos es garantizar que la calidad de los datos sin procesar extraídos cumpla con los requisitos del almacén/mercado de datos y mantener la coherencia de los datos. La conversión de datos es la parte central de todo el proceso ETL, principalmente calcula y amplifica los datos originales. La carga de datos consiste en cargar datos en tablas de destino en función de las relaciones entre entidades en el modelo de almacén/mercado de datos.
4. Crea una escena visual.
El establecimiento de escenarios visuales es el resultado del análisis y procesamiento de datos en el data warehouse/mart. Los usuarios pueden ver el estado comercial de las empresas/unidades desde múltiples ángulos y extraer los datos centrales del contenido comercial de las empresas/unidades de acuerdo con diferentes temas y métodos, para hacer predicciones y juicios más precisos.