Analizando Big Data con Microsoft R
Analiza y obtén información valiosa de inmensas cantidades de datos con Microsoft R y aprende a aplicar algoritmos de Machine Learning
En este curso utilizarás conocimientos previos de R Básico-Intermedio, pero esta vez los llevarás a entornos de Big Data, en donde no solo influye el tamaño de los datos sino también la velocidad con la que se generan, la variedad de los datos y la veracidad de los mismos.
Aprenderás técnicas para visualizar este tipo de datos y para escribir código eficiente capaz de lidiar con el tamaño de los datos que muchas veces supera la RAM disponible.
En este curso además nos enfocaremos en el uso de algoritmos de Machine Learning de Clasificación, con los cuales podremos utilizar nuestros datos históricos para clasificar diferentes categorías. Algunos usos de Machine Learning Modelos de Clasificación nos permiten responder a preguntas de gran utilidad en los negocios como por ejemplo:
- ¿Es una transacción fraudulenta o no?
- ¿Un vuelo llegará a tiempo o no?
- ¿El cliente pagará su crédito o no?
- ¿El tipo de tumor es benigno o maligno?
- ¿Al cliente le gustará esta película o no?
- ¿Una máquina fallará o no?
- ¿Qué tipo de deporte realiza un usuario de un dispositivo? (Caminar, nadar, correr, etc)
- ¿Qué tipo de campaña publicitaria dirigimos a cada cliente?
Esto lo lograremos a través del uso de algunos algoritmos que estudiaremos en este curso, entre ellos:
- Clusterización con kmeans
- Regresión Logarítmica
- Árboles de Decisión
- Clustering Jerárquico
¡Apresúrate a entrar a este valioso campo de conocimiento de la era moderna!
Tu Instructor
Soy Licenciado en Tecnologías de Información para la Gestión de Negocios con más de 11 años de experiencia trabajando con datos. Actualmente soy el líder del área de datos de una des las instituciones financieras más importantes de mi país. Cuento con estudios especializados en soluciones de Big Data y análisis de datos mediante modelos de Machine Learning y minería de datos. Además, soy facilitador de diferentes cursos en universidades públicas de Costa Rica relacionados al uso de datos.
Plan de Estudios
-
InicioBienvenido al curso Analizando Big Data (2:25)
-
InicioPreparación del Entorno de Desarrollo con R Studio (5:58)
-
InicioPreparación del Entorno de Desarrollo en Visual Studio (5:47)
-
Inicio¿Qué es RevoScaleR? (3:07)
-
InicioCargar librería RevoScaleR (2:21)
-
InicioObteniendo Datos para la Práctica (1:15)
-
InicioMuestreo del Tipo de Datos (2:39)
-
InicioLectura completa de grandes archivos (4:45)
-
InicioDiferencia entre XDF y CSV (4:40)
-
InicioObteniendo Información del XDF (5:36)
-
InicioTransformaciones Simples de Datos (9:23)
-
InicioTransformaciones más complejas de datos (4:03)
-
InicioAnalizando nuevas variables (5:39)
-
InicioExaminando Datos con rxCrossTabs (6:54)
-
InicioFiltrado de Filas (5:45)
-
InicioUtilizando Histogramas para analizar las variables (7:31)
-
InicioAnalizando Datos Atípicos (Outliers) (10:36)
-
InicioExcluyendo Variables del Conjunto de Datos (4:11)
-
InicioResumen de la Información con rxCrossTabs y rxCube (6:58)