Este módulo cubre los conceptos, técnicas y tecnologías relacionados con la ingeniería que se utilizan para el procesamiento y almacenamiento de conjuntos de datos de Big Data. Resalta los retos únicos que se enfrentan al procesar y almacenar conjuntos de datos grandes, volátiles y dispares. Incluye NoSQL, y se explica a detalle el motor de procesamiento de datos MapReduce como marco de trabajo base para el procesamiento de datos por lote de alto volumen.
Se cubren los siguientes temas principales:
Este módulo explora temas de ingeniería avanzada relacionados principalmente con el almacenamiento y procesamiento de conjuntos de datos de Big Data. Específicamente, se cubren mecanismos de ingeniería de Big Data, almacenamiento de datos en memoria y procesamiento de datos en tiempo real. El módulo presenta además consideraciones para construir algoritmos de MapReduce y también introduce el motor de procesamiento Bulk Synchronous Parallel (BSP), junto con una discusión del procesamiento de datos de grafos. También se exploran los mecanismos de Big Data requeridos para desarrollar pipelines de Big Data, sus etapas y el proceso de diseño involucrado en construir soluciones de procesamiento de Big Data.
Se cubren los siguientes temas principales:
Este laboratorio práctico presenta a los participantes una serie de ejercicios y problemas diseñados para poner a prueba su capacidad para aplicar sus conocimientos sobre los temas tratados en los módulos anteriores. Completar este laboratorio ayudará a resaltar las áreas que requieren mayor atención y ayudará a demostrar el dominio en los conceptos tratados, tecnologías y prácticas, ya que se aplican y se combinan para resolver problemas del mundo real.
Se cubren los siguientes ejercicios: