Apache Spark: Análisis de Subsidios de Vivienda con Scala

(5 valoraciones de clientes)

El precio original era: $ 180.000.El precio actual es: $ 110.000.

Lleva tus capacidades de análisis al límite con Apache Spark, el motor de procesamiento unificado más rápido y flexible del ecosistema Big Data. En este curso aprenderás cómo Spark revoluciona el manejo de datos a gran escala mediante su capacidad de procesamiento en memoria, superando las limitaciones del modelo tradicional MapReduce. Explorarás desde sus fundamentos hasta su arquitectura distribuida, comprendiendo por qué es una de las herramientas más utilizadas para Machine Learning y análisis de datos en tiempo real. Acceso ilimitado + actualizaciones incluidas. Obtén el curso y recibe todas las mejoras y nuevos contenidos que se publiquen en el futuro. Incluye certificado de aprobación del curso.

SKU: EBD-SPARK-01 Categorías: , Etiqueta: Instructor:

Apache Spark: De los Fundamentos al Procesamiento de Datos en Scala

Este curso te introduce al uso de Apache Spark como una de las herramientas más potentes para el procesamiento distribuido de grandes volúmenes de datos. A lo largo del contenido aprenderás desde los conceptos fundamentales hasta la ejecución práctica de análisis de datos utilizando Scala y Apache Spark.

Durante todo el curso trabajarás sobre un caso práctico integral basado en datos reales de subsidios de vivienda en Colombia, aplicando técnicas modernas de procesamiento y análisis de datos sobre datasets estructurados, permitiéndote desarrollar habilidades utilizadas en entornos profesionales de Big Data y analítica de datos.

Explorarás la arquitectura de Apache Spark, sus componentes principales, el procesamiento distribuido, Spark SQL, Spark Streaming y Machine Learning con MLlib, además de implementar entornos reales utilizando Docker.


¿Qué aprenderás en este curso?

  • Comprender qué es Apache Spark y su funcionamiento.
  • Conocer la arquitectura de Apache Spark.
  • Entender los conceptos fundamentales de Spark.
  • Trabajar con transformaciones y acciones.
  • Utilizar Spark SQL para análisis de datos.
  • Comprender el procesamiento en tiempo real con Spark Streaming.
  • Conocer las capacidades de Machine Learning con Spark MLlib.
  • Instalar y configurar Apache Spark utilizando Docker.
  • Ejecutar sentencias en Scala para procesamiento de datos.
  • Analizar información real relacionada con subsidios de vivienda en Colombia.
  • Crear archivos Parquet optimizados para análisis de datos.

Contenido del curso

Unidad 1 — Introducción a Apache Spark

Duración: 36 minutos

  • ¿Qué es Apache Spark?
  • Arquitectura de Apache Spark
  • Conceptos Fundamentales
  • Transformaciones y Acciones
  • Spark SQL
  • Spark Streaming
  • Machine Learning con Spark MLlib

Unidad 2 — Práctica: Instalar Apache Spark

Duración: 41 minutos

  • Instalación de Apache Spark en Docker
  • Imágenes de Apache Spark
  • Descargar la imagen de Apache Spark en Docker
  • Crear contenedor de Apache Spark en Docker
  • Conectarse a Spark

Unidad 3 — Práctica: Ejecutar sentencias en Scala

Duración: 32 minutos

  • Descargar Dataset de subsidios de vivienda
  • Copiar el Dataset al contenedor de Spark
  • Leer el archivo CSV desde Scala
  • Ver el esquema inferido
  • Mostrar primeros registros
  • Contar registros

Unidad 4 — Práctica: Crear un Parquet

Duración: 54 minutos

  • Limpieza de datos
  • Agrupación por Departamentos
  • Procesamiento de datos de subsidios de vivienda
  • Parquet de Departamentos

¿Para quién es este curso?

  • Personas que desean iniciarse en el uso de Apache Spark.
  • Analistas de datos interesados en Big Data y procesamiento distribuido.
  • Desarrolladores que trabajan con herramientas del ecosistema de datos.
  • Profesionales que buscan procesar y analizar grandes volúmenes de información.
  • Estudiantes y profesionales interesados en procesamiento de datos con Scala.

Duración total del curso

2.7 horas de contenido enfocadas en el uso práctico de Apache Spark, Scala y procesamiento distribuido de datos.

Aprende a procesar y analizar grandes volúmenes de datos utilizando Apache Spark.

Acceso ILIMITADO al curso con enfoque práctico, moderno y aplicado a escenarios reales de Big Data y análisis de datos de subsidios de vivienda en Colombia.

Certificado al finalizar

5 valoraciones en Apache Spark: Análisis de Subsidios de Vivienda con Scala

  1. Carlos Eduardo Rodriguez Lopez (verificado)

    Es un curso práctico el cual me ayudó bastante para ampliar mis conocimientos en Python y conocer de Scala, aprendí nuevos temas relacionados con PySpark es algo que me me ayuda a complementar otros temas ya vistos como machine learning y conocer el sobre el procesamiento en tiempo real para ser un mejor analista de datos.

  2. Edgar Daniel Torres Quevedo (verificado)

    Fue una experiencia bastante enriquecedora porque permitió entender cómo se trabajan grandes volúmenes de datos de una manera mucho más rápida, organizada y eficiente.

    Lo que más me llamó la atención del curso de Apache Spark fue conocer su capacidad de procesamiento distribuido, ya que permite analizar millones de registros en poco tiempo, optimizando tareas que normalmente serían lentas o complejas. Además, aprendí sobre componentes como Spark SQL, DataFrames y procesamiento en memoria, lo que me ayudó a comprender por qué esta herramienta es tan utilizada actualmente en proyectos de Big Data, inteligencia de negocios y analítica avanzada. No se trata solo de aprender comandos o herramientas, sino de entender cómo la tecnología puede mejorar la toma de decisiones, optimizar procesos y generar soluciones reales dentro de una organización. Gracias!

  3. Angia Milena García Peñuela (verificado)

    Muy buen curso, me gustó muh¿cho, da explicaciones claras, ejemplos prácticos y un enfoque a lo que realmente se usa en el mundo profesional de Big Data con Apache Spark, recomendado 😉

  4. Ana Maria Quintero Garcia (verificado)

    El curso fue muy útil, puesto que permitió conocer conceptos fundamentales relacionados con el análisis de datos, procesamiento distribuido y manejo de información en tiempo real, además, las actividades prácticas ayudaron a fortalecer habilidades técnicas aplicables, haciendo del curso una experiencia bastante completa y enriquecedora.

  5. Maria Paula Torres Jimenez (verificado)

    Este curso de Apache Spark fue una muy buena experiencia de aprendizaje, ya que permitió conocer herramientas y procesos utilizados en el análisis de grandes volúmenes de datos. Me gustó el enfoque práctico y la forma en que se explicaron los temas, haciendo más fácil entender conceptos relacionados con Spark y procesamiento distribuido.

    Sin duda, es un curso que aporta conocimientos útiles para fortalecer el perfil en áreas de Big Data y analítica.

Solo los usuarios registrados que hayan comprado este producto pueden hacer una valoración.