Medrano 951 - 2do. Piso - Of. 206 CABA - Lunes a viernes de 9 a 21 hs
(5411) 4867 7500 (Int. 7745/7749) info@sceu.frba.utn.edu.ar
Big Data – Programación distribuida, text mining y data science aplicada

Big Data – Programación distribuida, text mining y data science aplicada

Este curso forma parte de la
Diplomatura en Arquitecturas de Big Data Aplicadas

 

PRESENTACIÓN

En los últimos 25 años el mundo de la informática ha experimentado cambios profundos. Han surgido nuevas arquitecturas de aplicaciones, nuevos paradigmas de programación y nuevas herramientas de desarrollo de software.
El concepto de programación distribuida existe desde comienzo de Internet, en ámbitos académicos, sin embargo, nunca fue posible y necesario el uso, la administración y la explotación de datos como en tiempos modernos. La baja en precios por unidad de almacenamiento, el crecimiento exponencial de la capacidad de procesamiento,  la receptividad del mercado a la explotación de datos, la gran cantidad y variedad de datos (en el orden de los PB de información) favorecieron el surgimiento de herramientas como Spark y Hadoop que cambiaron el paradigma de programación, permitiendo no estar limitado a la potencia de un solo servidor, sino usar varios de ellos como uno solo. Este nuevo surgimiento, trajo nuevos desafíos y problemáticas, para ello, es muy importante entender cómo desarrollar sistemas que estén a la altura de requerimientos y fuentes de datos dinámicas, así como comprender el rol del profesional de datos orientado a resolver problemas de big data dentro de las organizaciones.

 

OBJETIVOS

Se espera que al finalizar el programa, los participantes puedan:

  • Entender los conceptos relacionados a la programación distribuida y su aplicación en data science.
  • Conocer las tecnologías y la arquitectura para la programación distribuida.
  • Aprender conceptos de Machine Learning de manera teórica y práctica.
  • Entender las funciones del rol de los data scientists y data engineer dentro de una organización.
  • Aprender la Herramienta Mahout de la Plataforma Hadoop.
  • Programar algoritmos de data mining con Java sobre Motor de Procesamiento MapReduce.
  • Programar algoritmos de data mining con Python sobre Motor de Procesamiento Spark.
  • Programar algoritmos de data mining con Scala sobre Motor de Procesamiento Spark.
  • Programar algoritmos en Scala ó Python sobre Spark en HDFS.
  • Programar algoritmos en Scala ó Python sobre Spark en MongoDB.
  • Entender el concepto de arquitectura Lambda.
  • Implementar arquitectura Lambda con los lenguajes y herramientas estudiados

 

DESTINATARIOS

  • El curso está dirigido a personas con conocimientos de programación en lenguajes tales como C++, Java, C#, Ruby, Scala, Python, R, entre otros, que quieran hacer una inmersión en el mundo de Big Data.
  • El curso está también dirigido a personas con conocimientos en el área de Big Data, bases de datos NoSQL y Plataforma de Almacenamiento y Procesamiento distribuido como Hadoop que quieren aprender programación distribuida y data science aplicada.

 

REQUISITOS

  • Recomendable contar estudios al menos iniciales en carreras relacionadas con Sistemas y conocimientos de programación y bases de datos.
  • Los alumnos deberán asistir al curso con un equipo personal (notebook/netbook) con posibilidad de conexión a una red wifi

 

DURACIÓN

  • El programa tiene una duración de 36 horas, a desarrollarse en 12 clases.
  • Carga horaria semanal: 3 horas.

 

TEMARIO

Para ver el temario haga clic AQUÍ

 

DOCENTES 

  • Ing. Juan Zaffaroni
  • Ing. Maximiliano Mendez
  • Ing. Martín Mihura
  • Ing. Patricio Boffino

 

METODOLOGÍA A UTILIZAR EN EL DESARROLLO DEL CURSO

  • Las clases serán dictadas por un equipo docente (2 docentes por clase) con conocimiento teórico y práctico, para asistir a los alumnos en todas las prácticas.
  • Dada la temática del programa y los objetivos que persigue, permanentemente se vincularán los conceptos teóricos con casos prácticos y de negocio.
  • Durante el curso los participantes trabajaran en el desarrollo de varios casos prácticos en los cuales puedan aplicar los conceptos adquiridos.

 

PROCEDIMIENTOS DE EVALUACIÓN Y ACREDITACIÓN – CERTIFICACIÓN

  • Para obtener el certificado de aprobación, los participantes serán evaluados a través de un examen escrito y de la calificación de los trabajos prácticos.
  • Además la asistencia a un mínimo del 80% de las clases otorga un certificado de asistencia.

Cronograma de evaluación

  • Durante el transcurso del programa, los participantes desarrollarán trabajos prácticos (en forma individual o grupal).
  • En la anteúltima clase los alumnos serán evaluados a través de un examen escrito.