Apache Hive: Análisis COVID con HQL

(8 valoraciones de clientes)

El precio original era: $ 180.000.El precio actual es: $ 110.000.

Lleva tus habilidades de Big Data al siguiente nivel aprendiendo a utilizar Apache Hive, la herramienta estándar para facilitar la lectura, escritura y gestión de grandes conjuntos de datos residentes en almacenamiento distribuido. En este curso transformaremos la complejidad del procesamiento de datos en consultas sencillas y potentes, permitiéndote interactuar con el ecosistema Hadoop sin necesidad de escribir código complejo en Java. Acceso ilimitado + actualizaciones incluidas. Obtén el curso y recibe todas las mejoras y nuevos contenidos que se publiquen en el futuro. Incluye certificado de aprobación del curso.

SKU: EBD-HIVE-01 Categorías: , Etiqueta: Instructor:

Apache Hive: De los Fundamentos a la Ejecución de Consultas HQL

Este curso te introduce al uso de Apache Hive como herramienta para el procesamiento y análisis de grandes volúmenes de datos dentro del ecosistema Hadoop. A lo largo del contenido, aprenderás desde los conceptos básicos hasta la ejecución práctica de consultas utilizando HiveQL.

Durante todo el curso trabajarás sobre un caso práctico integral basado en datos reales de COVID-19 en Colombia, utilizando un conjunto de datos robusto de más de 1.4 GB y con más de 6 millones de registros, lo que te permitirá aplicar técnicas reales de análisis de datos con Hive en escenarios similares a los del mundo profesional.

Explorarás su arquitectura, funcionamiento e integración, así como la implementación en entornos reales mediante Docker, permitiéndote trabajar con datos de forma estructurada y eficiente.


¿Qué aprenderás en este curso?

  • Comprender qué es Apache Hive y su rol dentro del ecosistema Hadoop.
  • Identificar las principales características y ventajas de Hive.
  • Entender la arquitectura de Apache Hive.
  • Utilizar HiveQL (HQL) para realizar consultas sobre datos.
  • Diferenciar los tipos de tablas en Hive.
  • Instalar y configurar Apache Hive utilizando Docker.
  • Ejecutar operaciones básicas como creación de tablas, inserción y análisis de datos.
  • Aplicar análisis de datos reales utilizando un dataset masivo de COVID-19 en Colombia.

Contenido del curso

Unidad 1 — Introducción a Apache Hive

Duración: 30 minutos

  • ¿Qué es Apache Hive?
  • Características de Apache Hive
  • Ventajas de utilizar Hive
  • Integración de Hive con el ecosistema Hadoop

Unidad 2 — Arquitectura y HQL

Duración: 25 minutos

  • Arquitectura de Apache Hive
  • HiveQL y consultas básicas
  • Tipos de tablas en Apache Hive

Unidad 3 — Práctica: Instalación de Apache Hive

Duración: 56 minutos

  • Instalación de Apache Hive en Docker
  • Imágenes de Apache Hive
  • Descargar la imagen de Apache Hive en Docker
  • Crear contenedor de Apache Hive en Docker
  • Verificar conexión al servidor de Apache Hive

Unidad 4 — Práctica: Ejecución de sentencias HQL

Duración: 56 minutos

  • Acceder a la base de datos de Hive
  • Ver tablas
  • Crear una tabla
  • Crear particiones en la tabla
  • Insertar datos
  • Contar registros
  • Sumar datos

Unidad 5 — Práctica: Caso real con datos de COVID-19 en Colombia

Duración: 80 minutos

  • Acceder a la base de datos de Hive usando DBeaver
  • Descargar Dataset de pruebas de Datos Abiertos
  • Copiar el Dataset al servidor de Hive
  • Crear una nueva base de datos
  • Crear tabla externa
  • Consultas rápidas
  • Crear Parquet

¿Para quién es este curso?

  • Personas que desean iniciarse en el uso de Apache Hive.
  • Analistas de datos interesados en Big Data y procesamiento distribuido.
  • Desarrolladores que trabajan con el ecosistema Hadoop.
  • Profesionales que buscan ejecutar consultas sobre grandes volúmenes de datos.

Duración total del curso

3.9 horas de contenido enfocadas en el uso práctico de Apache Hive y consultas HQL, incluyendo un caso aplicado con datos reales.

Aprende a gestionar y analizar grandes volúmenes de datos reales utilizando Apache Hive.

Acceso ILIMITADO al curso con enfoque práctico, aplicado y basado en un caso real de análisis de datos.

Certificado al finalizar

8 valoraciones en Apache Hive: Análisis COVID con HQL

  1. ANGIA MILENA GARCIA PEÑUELA (verificado)

    El curso de Apache Hive es muy útil y bien estructurado. Permite comprender de manera práctica y fácil cómo gestionar y consultar grandes volúmenes de datos dentro del ecosistema Hadoop, facilita el aprendizaje de SQL aplicadas a Big Data. Además, las actividades prácticas ayudaron a fortalecer las habilidades en análisis de datos y optimización de consultas.

  2. Carlos Eduardo Rodriguez Lopez (verificado)

    El curso de Hive me permitió fortalecer los conocimientos previos que tenía sobre Hadoop, ya que ambas plataformas se complementan y se integran de manera muy efectiva. Aunque ya tenía experiencia con SQL, con Hive pude ampliar mi dominio gracias al uso de Beeline y HiveQL. Es un curso muy práctico que facilita la transición entre el mundo relacional y el procesamiento distribuido, aportando herramientas clave para trabajar con grandes volúmenes de datos.

  3. Edgar Daniel Torres Quevedo (verificado)

    Considero que el curso Apache Hive me aportó un valor importante a nivel profesional, especialmente para áreas relacionadas con analítica de datos, inteligencia de negocios y administración de información, ya que combina la potencia de Hadoop con la facilidad de realizar consultas estructuradas. También entendí la importancia de las tablas, particiones y consultas optimizadas para mejorar el rendimiento cuando se manejan millones de registros. Cabe decir que, uno de los aspectos que más me gustó fue aprender que Hive utiliza un lenguaje muy similar a SQL, lo que facilita bastante el trabajo para quienes ya tienen conocimientos en bases de datos. Gracias!

  4. Marcela Arcila Chiquiza (verificado)

    Apache Hive me pareció una herramienta avanzada y dinámica para el manejo de grandes volúmenes de datos. Lo que más me llamó la atención es que, a pesar de trabajar sobre Hadoop y procesar información masiva, su lenguaje HiveQL es muy parecido a SQL, lo que facilita mucho la curva de aprendizaje.

  5. Luz Myriam Cantor Pineda (verificado)

    Muchas gracias! Aprendí nuevos conceptos y herramientas útiles para mi formación académica y profesional. Recomendado!

  6. Liseth Johana Bonilla ujueta (verificado)

    Recomendado. Un curso muy práctico que permitió comprender mejor los conceptos relacionados con Hive y HQL.

  7. Ana Maria Quintero Garcia (verificado)

    El curso es una experiencia muy enriquecedora, ya que, permitió comprender cómo gestionar y consultar grandes volúmenes de datos de manera eficiente dentro del ecosistema Hadoop, las prácticas realizadas facilitaron el aprendizaje del lenguaje y el análisis de información de forma estructurada.

  8. Maria Paula Torres Jimenez (verificado)

    El curso de Apache Hive me pareció muy práctico y útil para comprender cómo gestionar y consultar grandes volúmenes de datos dentro del ecosistema Hadoop. Las actividades facilitaron el aprendizaje de HiveQL y el análisis de información de manera estructurada.

    En general, es un curso dinámico y recomendado para fortalecer conocimientos en Big Data y analítica de datos.

Solo los usuarios registrados que hayan comprado este producto pueden hacer una valoración.