Aparche Spark streaming con Python y PySpark

Created by Mirror Class, Tao W. | Video: 1280×720 | Audio: AAC 48KHz 2ch | Duration: 03:23 H/M | Lec: 53 | 7.94 GB | Language: Spanish | Sub: Spanish

Agrega Spark Streaming a tu proyectos de Machine Learning y Data Science

What you’ll learn
Resumen general de la arquitectura de Apache Spark.
Se capaz de trabajar con la abstracciГіn principal de Apache Spark, RDDs o conjuntos de datos distribuidos y resilientes, para procesar y analizar grandes conjuntos de datos.
Desarrollar aplicaciones Apache Spark 2.0, utilizando transformaciones y acciones en RDD y Spark SQL.
Escalar aplicaciones Spark a un clГєster Hadoop YARN a travГ©s del servicio Elastic MapReduce de Amazon.
Analizar datos estructurados y semiestructurados utilizando conjuntos de datos (Datasets) y Dataframes, y entender a detalle el funcionamiento de Spark SQL.
Compartir informaciГіn a travГ©s de diferentes nodos en un clГєster de Apache Spark, mediante variables de difusiГіn y acumuladores.
TГ©cnicas avanzadas para optimizar y mejorar, trabajos de Apache Spark mediante el particionado, almacenamiento en cachГ© y la persistencia de RDDs.
Buenas prГЎcticas de trabajo con Apache Spark

Requirements
Una computadora con sistema operativo Windows, OSX o Linux
Tener conocimientos previos de programaciГіn con Python

Description
De quГ© trata este curso:

Este curso cubre todos los aspectos fundamentales de Apache Spark streaming con Python, y te enseГ±a todo lo que necesitas saber sobre el desarrollo de aplicaciones Apache Spark.

Al final de este curso, obtendrГЎs un conocimiento profundo sobre Apache Spark streaming, asГ­ como habilidades generales de manejo y anГЎlisis de big data para ayudar a tu empresa o proyecto a adaptar Apache Spark para la construcciГіn de un pipeline de procesamiento de big data y aplicaciones de anГЎlisis de datos.

Este curso sera absolutamente critico para cualquiera que quiera dominar Data Science hoy en dГ­a.

ВїQuГ© aprenderГЎs en estas clases?

En particular, aprenderГЎs:

Sobre la arquitectura de Apache Spark.

Como desarrollar aplicaciones Apache Spark streaming con PySpark usando transformaciones RDD, acciones y Spark SQL.

SerГЎs capaz de trabajar con la abstracciГіn principal de Apache Spark, RDDs o conjuntos de datos distribuidos y resilientes (RDD) para procesar y analizar grandes conjuntos de datos.

TГ©cnicas avanzadas para optimizar y mejorar los trabajos Apache Spark al usar particiones, almacenamiento en cache y persistencia de RDDs.

Escalar aplicaciones Spark Streaming para banda ancha y velocidad de procesamiento.

Analizar datos estructurados y semiestructurados utilizando conjuntos de datos (Datasets) y Dataframes, y entender a detalle el funcionamiento de Spark SQL.

Como integrar Spark Streaming con herramientas de computo de clusters tales como Apache Kafka.

Conectar tu Spark Stream con una fuente de datos tal como Amazon Web Services (AWS).

TГ©cnicas avanzadas para optimizar y mejorar, trabajos de Apache Spark mediante el particionado, almacenamiento en cachГ© y la persistencia de RDDs.

Sobre buenas prГЎcticas de trabajo con Apache Spark.

Repaso del ecosistema Big Data

Who this course is for?
Cualquier persona que quiera entender completamente cГіmo funciona Apache Spark, y cГіmo se usa Apache Spark en la industria.
Ingenieros de software que deseen desarrollar aplicaciones con Apache Spark 2.0 utilizando Spark Core y Spark SQL.
CientГ­ficos de datos o ingenieros de datos que quieran avanzar en su carrera mejorando sus habilidades de procesamiento de Big Data.
Homepage

https://www.udemy.com/course/aparche-spark-con-python-y-pyspark/


DOWNLOAD
(Buy premium account for maximum speed and resuming ability)