En este curso:
          Usarás Azure Databricks como plataforma central para el análisis de datos en la nube, desde la creación del entorno en Azure y la conexión con Azure Data Lake Storage (ADLS), hasta la transformación y el análisis con PySpark.
Ideal para quienes desean adquirir o consolidar habilidades de ingeniería y análisis de datos con un enfoque moderno, escalable y listo para producción.
En resumen aprenderás:
- A crear y administrar entornos en Azure y Azure Databricks.
- A conectarte a ADLS utilizando claves, SAS y entidades de servicio.
- Cómo leer transformar y escribir datos con PySpark (CSV, JSON, TXT, Parquet).
 
 
        
       
        
      Además, profundizarás en PySpark nivel práctico:
          - RDDs (transformaciones, acciones, persistencia).
- DataFrame API (optimizaciones, funciones avanzadas).
- Spark SQL (catálogo, vistas, UDF/UDAF, rendimiento).
- pandas API on Spark (migración desde pandas, interoperabilidad).
- MLlib (pipeline de ML, evaluación y tuning a escala).
- Aplicarás la arquitectura Medallón (Bronze/Silver/Gold).
- Usarás Delta Lake para versionado, limpieza y optimización.
- Finalmente automatizarás flujos de trabajo y prepararás datasets para reportes y visualizaciones.
 
Estos son los cursos que forman parte de este paquete:
Beneficios que obtendrás con el curso:
          - Enfoque práctico y actualizado con casos reales y procesos modernos.
- Organización eficiente usando arquitectura Medallón.
- Integración completa con Azure: almacenamiento, seguridad y control de acceso.
- Análisis listos para negocio: de la ingestión a la visualización.
- Optimización de costos y buenas prácticas en la nube.
 
 
        
      Preguntas frecuentes (FAQ)
¿Cuáles son los requisitos para tomar este curso?
Se recomienda:
- Conocimientos básicos de SQL.
- Conocimientos intermedios en Python.
- Familiaridad con estructuras de datos (listas, diccionarios, dataframes, etc.).
- También necesitarás una cuenta de Azure. Microsoft ofrece un crédito gratuito de $200 USD para nuevos usuarios durante el primer mes. La ejecución completa del curso tiene un costo aproximado de $10 USD si implementas todos los ejercicios; también puedes seguir las clases teóricas y evaluaciones sin ejecutar en la nube.
¿Necesito conocimientos previos en Azure?
No es obligatorio. Se explican paso a paso las configuraciones necesarias para avanzar incluso sin experiencia previa.
¿Tiene algún costo usar Azure Databricks?
Sí. Se cobra según el tiempo de uso del clúster y recursos. Aprenderás a minimizar costos (apagar recursos, dimensionamiento, prácticas eficientes). Con buena planificación, el costo para prácticas puede ser muy bajo (≈ $10 USD).
¿Cuándo inicia y finaliza el curso?
A tu ritmo, 100% en línea. Puedes comenzar en cualquier momento.
¿Durante cuánto tiempo tendré acceso?
Acceso de por vida, sin restricciones, desde cualquier dispositivo.
¿Qué pasa si no estoy satisfecho?
Si es un curso pago, puedes solicitar reembolso completo dentro de los primeros 14 días.
¿Y si uso un equipo administrado por mi empresa?
Verifica acceso al portal de Azure y permisos para registrar recursos. Si tienes dudas, consulta con tu área de IT.
 
   
      
     
            
             
      
    