Medrano 951 - 2do. Piso - Of. 206 CABA - Lunes a viernes de 10 a 16 hs
(54 11) 5984 2238 info@sceu.frba.utn.edu.ar
Big Data – Programación Distribuida, Text Mining y Data Science Aplicada

Big Data – Programación Distribuida, Text Mining y Data Science Aplicada

 

Por consultas, escribir a utncursos@gmail.com

PRESENTACIÓN

En los últimos 25 años el mundo de la informática ha experimentado cambios profundos. Han surgido nuevas arquitecturas de aplicaciones, nuevos paradigmas de programación y nuevas herramientas de desarrollo de software.
El concepto de programación distribuida existe desde comienzo de Internet, en ámbitos académicos, sin embargo, nunca fue posible y necesario el uso, la administración y la explotación de datos como en tiempos modernos. La baja en precios por unidad de almacenamiento, el crecimiento exponencial de la capacidad de procesamiento,  la receptividad del mercado a la explotación de datos, la gran cantidad y variedad de datos (en el orden de los PB de información) favorecieron el surgimiento de herramientas como Spark y Hadoop que cambiaron el paradigma de programación, permitiendo no estar limitado a la potencia de un solo servidor, sino usar varios de ellos como uno solo. Este nuevo surgimiento, trajo nuevos desafíos y problemáticas, para ello, es muy importante entender cómo desarrollar sistemas que estén a la altura de requerimientos y fuentes de datos dinámicas, así como comprender el rol del profesional de datos orientado a resolver problemas de big data dentro de las organizaciones.

 

OBJETIVOS

Se espera que al finalizar el programa, los participantes puedan:

  • Entender los conceptos relacionados a la programación distribuida y su aplicación en data science.
  • Conocer las tecnologías y la arquitectura para la programación distribuida.
  • Aprender conceptos de Machine Learning de manera teórica y práctica.
  • Entender las funciones del rol de los data scientists y data engineer dentro de una organización.
  • Aprender la Herramienta Mahout de la Plataforma Hadoop.
  • Programar algoritmos de data mining con Java sobre Motor de Procesamiento MapReduce.
  • Programar algoritmos de data mining con Python sobre Motor de Procesamiento Spark.
  • Programar algoritmos de data mining con Scala sobre Motor de Procesamiento Spark.
  • Programar algoritmos en Scala ó Python sobre Spark en HDFS.
  • Programar algoritmos en Scala ó Python sobre Spark en MongoDB.
  • Entender el concepto de arquitectura Lambda.
  • Implementar arquitectura Lambda con los lenguajes y herramientas estudiados

 

DESTINATARIOS

El curso está dirigido a personas con conocimientos de programación en lenguajes tales como C++, Java, C#, Ruby, Scala, Python, R, entre otros, que quieran hacer una inmersión en el mundo de Big Data.

El curso está también dirigido a personas con conocimientos en el área de Big Data, bases de datos NoSQL y Plataforma de Almacenamiento y Procesamiento distribuido como Hadoop que quieren aprender programación distribuida y data science aplicada.

 

REQUISITOS

Recomendable contar estudios al menos iniciales en carreras relacionadas con Sistemas y conocimientos de programación y bases de datos.

Los alumnos deberán asistir al curso con un equipo personal (notebook/netbook) con posibilidad de conexión a una red wifi

 

DURACIÓN

El programa tiene una duración de 36 horas, a desarrollarse en 12 clases.

Carga horaria semanal: 3 horas.

 

TEMARIO

Para ver el temario haga clic AQUÍ

 

DOCENTES 

Ing. Juan Zaffaroni

Ing. Maximiliano Mendez

Ing. Martín Mihura

Ing. Patricio Boffino

 

METODOLOGÍA A UTILIZAR EN EL DESARROLLO DEL CURSO

Las clases serán dictadas por un equipo docente (2 docentes por clase) con conocimiento teórico y práctico, para asistir a los alumnos en todas las prácticas.

Dada la temática del programa y los objetivos que persigue, permanentemente se vincularán los conceptos teóricos con casos prácticos y de negocio.

Durante el curso los participantes trabajaran en el desarrollo de varios casos prácticos en los cuales puedan aplicar los conceptos adquiridos.

 

PROCEDIMIENTOS DE EVALUACIÓN Y ACREDITACIÓN – CERTIFICACIÓN

  • Para obtener el certificado de aprobación, los participantes serán evaluados a través de un examen escrito y de la calificación de los trabajos prácticos.
  • Además la asistencia a un mínimo del 80% de las clases otorga un certificado de asistencia.

Cronograma de evaluación

  • Durante el transcurso del programa, los participantes desarrollarán trabajos prácticos (en forma individual o grupal).
  • En la anteúltima clase los alumnos serán evaluados a través de un examen escrito.

 

INICIOS Y CURSADAS

El curso iniciará el 15 de Octubre y se dictará los días viernes de 19 a 22 hs. – INSCRIPCIÓN