¿Cuál es la base del big data?
Javas, EE (SSM)
Los marcos de big data de los 90 están todos escritos en Java.
Por ejemplo, MongoDB, la base de datos multiplataforma orientada a documentos más popular.
Hadoop: un marco de software de código abierto escrito en Java para almacenamiento distribuido y procesamiento distribuido de conjuntos de datos muy grandes.
Spark es el proyecto más activo de Apache Software Foundation y es un marco informático de clúster de código abierto.
h base: una base de datos distribuida, no relacional y de código abierto modelada por BigTable de Google, escrita en Java y ejecutándose en HDFS.
MySQL (debe dominar)
SQLon Hadoop se divide en:
Batch SQL (Hive): generalmente se utiliza para procesamiento ETL complejo, minería de datos y análisis avanzado. .
SQL Interactivo: Consulta SQL interactiva, generalmente ejecutando repetidamente diferentes consultas en la misma tabla.
Operación SQL: generalmente una sola consulta, el requisito de retraso es inferior a 1 segundo. Este tipo de sistema es principalmente HBase.
Sistema operativo Linux
El marco de big data está instalado en el sistema operativo Linux.