-39% 🔍

Apache Spark: Análisis de Subsidios de Vivienda con Scala

Name: Apache Spark: Análisis de Subsidios de Vivienda con Scala
Brand: John Jairo Caicedo Bolaños
SKU: EBD-SPARK-01
Availability: InStock
Rating: 5.00 (5 reviews)

Valorado con 5.00 de 5 en base a 5 valoraciones de clientes

(5 valoraciones de clientes)

El precio original era: $ 180.000.El precio actual es: $ 110.000.

Lleva tus capacidades de análisis al límite con Apache Spark, el motor de procesamiento unificado más rápido y flexible del ecosistema Big Data. En este curso aprenderás cómo Spark revoluciona el manejo de datos a gran escala mediante su capacidad de procesamiento en memoria, superando las limitaciones del modelo tradicional MapReduce. Explorarás desde sus fundamentos hasta su arquitectura distribuida, comprendiendo por qué es una de las herramientas más utilizadas para Machine Learning y análisis de datos en tiempo real. Acceso ilimitado + actualizaciones incluidas. Obtén el curso y recibe todas las mejoras y nuevos contenidos que se publiquen en el futuro. Incluye certificado de aprobación del curso.

SKU: EBD-SPARK-01 Categorías: Big Data, Cursos Etiqueta: OFERTA Instructor: John Jairo Caicedo Bolaños

Apache Spark: De los Fundamentos al Procesamiento de Datos en Scala

Este curso te introduce al uso de Apache Spark como una de las herramientas más potentes para el procesamiento distribuido de grandes volúmenes de datos. A lo largo del contenido aprenderás desde los conceptos fundamentales hasta la ejecución práctica de análisis de datos utilizando Scala y Apache Spark.

Durante todo el curso trabajarás sobre un caso práctico integral basado en datos reales de subsidios de vivienda en Colombia, aplicando técnicas modernas de procesamiento y análisis de datos sobre datasets estructurados, permitiéndote desarrollar habilidades utilizadas en entornos profesionales de Big Data y analítica de datos.

Explorarás la arquitectura de Apache Spark, sus componentes principales, el procesamiento distribuido, Spark SQL, Spark Streaming y Machine Learning con MLlib, además de implementar entornos reales utilizando Docker.

¿Qué aprenderás en este curso?

Comprender qué es Apache Spark y su funcionamiento.
Conocer la arquitectura de Apache Spark.
Entender los conceptos fundamentales de Spark.
Trabajar con transformaciones y acciones.
Utilizar Spark SQL para análisis de datos.
Comprender el procesamiento en tiempo real con Spark Streaming.
Conocer las capacidades de Machine Learning con Spark MLlib.
Instalar y configurar Apache Spark utilizando Docker.
Ejecutar sentencias en Scala para procesamiento de datos.
Analizar información real relacionada con subsidios de vivienda en Colombia.
Crear archivos Parquet optimizados para análisis de datos.

Contenido del curso

Unidad 1 — Introducción a Apache Spark

Duración: 36 minutos

¿Qué es Apache Spark?
Arquitectura de Apache Spark
Conceptos Fundamentales
Transformaciones y Acciones
Spark SQL
Spark Streaming
Machine Learning con Spark MLlib

Unidad 2 — Práctica: Instalar Apache Spark

Duración: 41 minutos

Instalación de Apache Spark en Docker
Imágenes de Apache Spark
Descargar la imagen de Apache Spark en Docker
Crear contenedor de Apache Spark en Docker
Conectarse a Spark

Unidad 3 — Práctica: Ejecutar sentencias en Scala

Duración: 32 minutos

Descargar Dataset de subsidios de vivienda
Copiar el Dataset al contenedor de Spark
Leer el archivo CSV desde Scala
Ver el esquema inferido
Mostrar primeros registros
Contar registros

Unidad 4 — Práctica: Crear un Parquet

Duración: 54 minutos

Limpieza de datos
Agrupación por Departamentos
Procesamiento de datos de subsidios de vivienda
Parquet de Departamentos

¿Para quién es este curso?

Personas que desean iniciarse en el uso de Apache Spark.
Analistas de datos interesados en Big Data y procesamiento distribuido.
Desarrolladores que trabajan con herramientas del ecosistema de datos.
Profesionales que buscan procesar y analizar grandes volúmenes de información.
Estudiantes y profesionales interesados en procesamiento de datos con Scala.

Duración total del curso

2.7 horas de contenido enfocadas en el uso práctico de Apache Spark, Scala y procesamiento distribuido de datos.

Aprende a procesar y analizar grandes volúmenes de datos utilizando Apache Spark.

Acceso ILIMITADO al curso con enfoque práctico, moderno y aplicado a escenarios reales de Big Data y análisis de datos de subsidios de vivienda en Colombia.

Certificado al finalizar	Sí

5 valoraciones en Apache Spark: Análisis de Subsidios de Vivienda con Scala

Valorado con 5 de 5

Carlos Eduardo Rodriguez Lopez (verificado) – 21 de mayo de 2026

Es un curso práctico el cual me ayudó bastante para ampliar mis conocimientos en Python y conocer de Scala, aprendí nuevos temas relacionados con PySpark es algo que me me ayuda a complementar otros temas ya vistos como machine learning y conocer el sobre el procesamiento en tiempo real para ser un mejor analista de datos.
Valorado con 5 de 5

Edgar Daniel Torres Quevedo (verificado) – 23 de mayo de 2026

Fue una experiencia bastante enriquecedora porque permitió entender cómo se trabajan grandes volúmenes de datos de una manera mucho más rápida, organizada y eficiente.

Lo que más me llamó la atención del curso de Apache Spark fue conocer su capacidad de procesamiento distribuido, ya que permite analizar millones de registros en poco tiempo, optimizando tareas que normalmente serían lentas o complejas. Además, aprendí sobre componentes como Spark SQL, DataFrames y procesamiento en memoria, lo que me ayudó a comprender por qué esta herramienta es tan utilizada actualmente en proyectos de Big Data, inteligencia de negocios y analítica avanzada. No se trata solo de aprender comandos o herramientas, sino de entender cómo la tecnología puede mejorar la toma de decisiones, optimizar procesos y generar soluciones reales dentro de una organización. Gracias!
Valorado con 5 de 5

Angia Milena García Peñuela (verificado) – 23 de mayo de 2026

Muy buen curso, me gustó muh¿cho, da explicaciones claras, ejemplos prácticos y un enfoque a lo que realmente se usa en el mundo profesional de Big Data con Apache Spark, recomendado 😉
Valorado con 5 de 5

Ana Maria Quintero Garcia (verificado) – 24 de mayo de 2026

El curso fue muy útil, puesto que permitió conocer conceptos fundamentales relacionados con el análisis de datos, procesamiento distribuido y manejo de información en tiempo real, además, las actividades prácticas ayudaron a fortalecer habilidades técnicas aplicables, haciendo del curso una experiencia bastante completa y enriquecedora.
Valorado con 5 de 5

Maria Paula Torres Jimenez (verificado) – 24 de mayo de 2026

Este curso de Apache Spark fue una muy buena experiencia de aprendizaje, ya que permitió conocer herramientas y procesos utilizados en el análisis de grandes volúmenes de datos. Me gustó el enfoque práctico y la forma en que se explicaron los temas, haciendo más fácil entender conceptos relacionados con Spark y procesamiento distribuido.

Sin duda, es un curso que aporta conocimientos útiles para fortalecer el perfil en áreas de Big Data y analítica.