Auto-reproducción
Autocompletar
Clase Previa
Completar y continuar
Análisis de Big Data con Python
Introducción a Big Data con PySpark
1.1 Conceptos de Big Data (8:28)
1.2 Conceptos de Ingeniería de Datos (11:04)
1.3 Conceptos PySpark (12:25)
1.4 Configuración (19:43)
1.5 Validación de Instalación (11:39)
1.6 Creando una Sesion en PySpark (7:07)
Resilient Distributed Datasets (RDDs)
2.1 Introducción a RDDs (9:44)
2.2 Conectando Datos Externos (4:53)
2.3 Función Lambda (4:32)
2.4 Transformación Map en RDD (7:26)
2.5 Transformación FlatMap en RDD (6:25)
2.6 Transformación Union & Filter en RDD (9:01)
2.7 Acciones en RDD (9:47)
2.8 RDDs Pair (reducebyKey,countbykey, sortbykey) (5:54)
2.9 RDD Pair (CombinebyKey, aggregatebyKey) (10:38)
2.10 RDD Pair (Join) (5:45)
2.11 Acciones para Guardar RDD (1:58)
SPARK SQL - CACHÉ - WEB UI
Material de trabajo
3.1 Configuración de la Sesión (3:13)
3.2 Esquemas de Datos y Tablas Temporales (11:35)
3.3 Ejecución de Querys (3:36)
3.4 Create & Drop Database (4:41)
3.5 Create & Drop Table (9:42)
3.6 Insertar Datos a una Tabla (4:59)
3.7 Insertar Valores Manualmente en SQL (2:41)
3.8 Crear Tabla en SQL Spark a partir de un Archivo Local (3:00)
3.9 Alter Table & Declaraciones Auxiliares (4:58)
3.10 Funciones De Fecha - Conversion & Operaciones Aritméticas Básicas (7:37)
3.11 Cláusula Where & Join (8:33)
3.12 Cluster By - Distribute By - Group By (10:45)
3.13 Create View (2:15)
3.14 Optimización Pyspark (4:21)
3.15 Almacenamiento Caché (6:45)
3.16 Niveles De Almacenamiento (3:58)
3.17 Spark SQL Cache (5:47)
3.18 Introducción a Spark Web UI (3:38)
3.19 Spark UI Jobs -Stages (12:13)
3.20 Spark UI Storage - Environment (4:25)
3.21 Spark UI Executors - SQL (4:23)
Práctica del curso
3.15 Almacenamiento Caché
Contenidos de Clase bloqueados
Si ya está inscrito,
necesitarás loguearte
.
Suscribirse en el Curso para Desbloquear