HDInsight: nuevos entrenamientos y labs sobre Hadoop, Hive, HBase, Spark y Storm

Repost de https://blogs.msdn.microsoft.com/ashish/2016/08/28/hdinsight-new-self-paced-trainings-and-labs/

Existen tres cursos online creados por Microsoft Learning Experiences y disponibles de forma gratuita en edX (a menos que se quiera tener un certificado, para lo cual se abona USD 49). Los cursos son en inglés.

Procesando Big Data con Azure HDInsight

Iniciar el curso

Más y más organizaciones están tomando el desafío de analizar big data. Este curso nos enseña cómo usar las tecnologías de Hadoop en Microsoft Azure HDInsight para construir soluciones de procesamiento en bloque que limpian y reforman los datos para el análisis. El curso dura cinco semanas y toca tecnologías como Hive, Pig, Oozie y Sqoop con Hadoop en HDInsight, y como trabajar con clusters HDInsight desde Windows, Linux y Mac OSX.

Contenido

Módulo 1: Comenzando con HDInsight
El curso comienza con una introducción a conceptos de big data y Hadoop, antes de examinar Microsoft Azure HDInsight y la distribución de Hadoop que provee. Aprenderás como provisionar un cluster HDInsight, cómo subir datos al cluster, y cómo generar jobs de Map/Reduce que procesen los datos.

Módulo 2: Procesando Big Data con Hive
La segunda semana del curso trata sobre Hive. Aprenderás cómo crear tablas Hive y a usar HiveQL para consultarlas, para luego explorar técnicas más avanzadas de Hive como el particionado e indexado.

Módulo 3: Yendo más allá de Hive
En la tercera semana del curso aprenderás cómo usar Pig para procesar big data, y cómo extender las capacidades de Pig y Hive con el uso de funciones definidas por el usuario implementadas en Python.

Módulo 4: Construyendo un flujo de trabajo de Big Data
La semana cuatro construye sobre las técnicas de procesamiento cubiertas en las semanas anteriores y nos enseña cómo construir flujos de trabajo de big data de punta a punta usando Oozie y Sqoop.

Examen Final
La quinta semana del curso trata sobre el examen final. Se debe obtener una puntuación del 50% o superior para aprobar el curso y obtener el certificado.

Implementando análisis en tiempo real con Hadoop en Azure HDInsight

Iniciar el curso

En este curso de cuatro semanas, aprenderás cómo implementar soluciones de Big Data de baja latencia y streaming usando tecnologías Hadoop como HBase, Storem y Spark sobre Microsoft Azure HDInsight.

Contenido

Usar HBase para implementar almacenes de datos NoSQL de baja latencia.
Usar Storm para implementar soluciones de analíticas en tiempo real.
Usar Spark para hacer análisis de datos interactivo de alta performance.

Implementando soluciones predictivas con Spark en Azure HDInsight

Iniciar el curso

En este curso aprenderemos cómo implementar soluciones de análisis predictivo para big data usando Apache Spark en Microsoft Azure HDInsight. Aprenderemos cómo trabajar con Scala o Python para limpiar y transformar los datos, construir modelos de machine learning con Spark MLlib (la librería de machine learning de Spark), y crear soluciones de machine learning en tiempo real usando Spark Streaming. Además, veremos cómo usar R Server en Spark para trabajar con datos a escala usando el lenguaje R.

Contenido

Usando Spark para trabajar con datos.
Procesando datos para machine learning en Spark.
Construyendo modelos de machine learning en Spark.
Usando R a escala con R Server en Spark.

Crédito: Graeme Malcolm

Anuncio publicitario

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.