Descripción del curso:
Se trata de un curso eminentemente práctico aunque sin dejar de lado el trasfondo conceptual y que os permitirá introduciros en todos los módulos de Apache Spark al mismo tiempo que aprenderéis la base del lenguaje Scala, nativo de esta plataforma.
¿QUÉ ES SCALA?
Scala es un lenguaje de programación multi-paradigma diseñado para expresar patrones comunes de programación en forma concisa, elegante y con tipos seguros. Integra sutilmente características de lenguajes funcionales y orientados a objetos.
¿QUÉ ES SPARK?
Apache Spark es un motor de procesos que trabaja sobre un ‘cluster’. Aporta APIs para Java, Scala, Python y R. Sobre su ‘core’ se le pueden añadir módulos como Spark SQL para proceso de volúmenes de datos estructurados, MLib para ‘machine learning’, GraphX para procesado de información en grafos y Spark Streaming para procesos que ocurran en tiempo real. Spark está escrito en Scala.
¿POR QUÉ DEBES REALIZAR EN ESTE CURSO?
Este curso te permitirá entrar por la puerta grande del apasionante mundo del Big Data dejando claros de entrada algunos conceptos importantes. Además te aportará comodidad y familiaridad en el uso de Scala como lenguaje (bandera) de estos entornos.
¿QUÉ SABRÁS HACER AL TERMINAR ESTE CURSO?:
Te sentirás capaz de entender los principales algoritmos utilizados en procesos de grandes volúmenes de datos, identificar los aspectos importantes e introducirte con buen pie en entornos de trabajo ‘big data’.
¿QUÉ PROYECTO O PRACTICA SE REALIZARÁ EN ESTE CURSO:
En este curso haremos varias prácticas, haciendo especial hincapié en un algoritmo de conteo de palabras en un texto (libros) en diferentes formas según el módulo de Spark que estemos trabajando.
OPORTUNIDADES LABORALES
Scala es un lenguaje de programación muy potente que te permitirá introducirte en entornos de trabajo ‘big data’. Además su conocimiento es una ventaja competitiva ya que al no ser tan fácil de aprender como Python (por ejemplo) no mucha gente lo conoce y es más fácil posicionarse ante una oportunidad laboral en este sector.
¿QUÉ NECESITO PARA REALIZAR ESTE CURSO?:
Para realizar este curso necesitarás una máquina con 6/8GB de RAM, capacidad de disco (preferible disco SSD), una ‘aceptable’ conexión a internet y muchas ganas de aprender.