Start Date IconInicio de cursada
 06/06/2024

Duration IconDuración
 34 Semanas

Presentación

Clases en vivo: Lunes y Jueves de 19 a 22 hs.

La Diplomatura en Arquitecturas de Big Data Aplicadas comprende los siguientes cursos/módulos

Apache Hadoop

  • Describir herramientas y componentes de las plataformas y bases de datos NoSQL tratadas.
  • Describir la arquitectura.
  • Describir como se accede a los datos, se insertan modifican y borran en base de datos.
  • Usar herramientas y comandos para importar y exportar archivos desde/hacia las Plataformas y Bases de Datos tratadas.
  • Describir como es generan y modelar estructuras.
  • Explicar y utilizar diferentes formatos de datos.
  • Utilización de motores de procesamiento Distribuido.
  • Desarrollar en diferentes lenguajes sobre plataformas de procesamiento y almacenamiento distribuido y bases de datos NoSQL.
  • Desarrollar ETLs hacia y desde Bases de Datos NoSQL y Hadoop.
  • Configurar y hacer troubleshooting de Jobs MapReduce.
  • Monitorear y administrar las Plataformas y Bases de Datos NoSQL tratadas.

NoSQL MongoDB

  • Entender el contexto y agentes del mercado en el cual surgen las bases de datos NoSQL.
  • Entender el concepto de persistencia políglota y su uso en las aplicaciones, con sus ventajas asociadas.
  • Entender cómo utilizar MongoDB para insertar datos, actualizarlos, borrarlos y consultarlos.
  • Entender los diferentes tipos de índices que utiliza MongoDB y cuando aplicarlos.
  • Utilizar el framework de agregación y map reduce embebido.
  • Modelar datos para aplicaciones eficientes.
  • Poder diseñar e implementar mecanismos de replicación y particionamiento de datos.
  • Conocer las herramientas y comandos de administración y monitoreo de MongoDB.
  • Poder configurar seguridad en MongoDB.

NoSQL Cassandra y Neo4J

  • Modelar datos para diseñar aplicaciones utilizando bases de datos basadas en familias de columnas y en grafos.
  • Entender los diferentes tipos de column families que utiliza Cassandra y cuando aplicarlas.
  • Entender cómo utilizar Cassandra y Neo4J para insertar datos, actualizarlos, borrarlos y consultarlos.
  • Conocer el lenguaje CQL para desarrollar consultas y procesos sobre Cassandra.
  • Conocer el lenguaje Cypher para desarrollar consultas y procesos sobre Neo4J.
  • Poder diseñar e implementar mecanismos de replicación de datos en Cassandra y Neo4J.
  • Comprender la arquitectura interna y sus componentes principales de Cassandra y Neo4J.
  • Conocer herramientas de administración de Cassandra y Neo4J.

NoSQL Key-Value Redis

  • Entender el contexto y agentes del mercado en el cual surgen las bases de datos NoSQL.
  • Entender el concepto de persistencia políglota y su uso en las aplicaciones, con sus ventajas asociadas.
  • Modelar datos para diseñar aplicaciones utilizando bases de datos Key Values.
  • Entender cómo utilizar Redis para insertar datos, actualizarlos, borrarlos y consultarlos.
  • Entender las estructuras de datos: Keys & Expiration / Strings / Hashes / Lists / Sets / Sorted Sets / Hyperloglogs.
  • Operaciones Set.
  • Basic Transactions y Optimistic concurrency control.
  • Object Storage: Simple Objects / Nesting, Relationships & Folding.
  • Poder diseñar e implementar mecanismos de replicación de datos en Redis.
  • Comprender la arquitectura interna y sus componentes principales de Redis.
  • Conocer herramientas de administración de Redis.

Elastic Stack

  • Entender el funcionamiento general del Elastic Stack como así en qué casos es conveniente su utilización.
  • Manejar los Beats disponibles en Elastic Stack oficialmente, además conocer los creados por la comunidad.
  • Entender la ingesta y transformación de los datos por medio del uso de codecs y filtros utilizando logstash con aplicación práctica.
  • Comprender el funcionamiento interno de ElasticSearch a la hora de indexar la información.
  • Configurar el motor de búsqueda ElasticSearch de la manera que nos resulte más eficiente a la hora de aplicarlo, dependiendo el caso en particular.
  • Crear, Eliminar, Modificar y Configurar adecuadamente índices para su posterior utilización.
  • Realizar consultas sobre nuestros índices tanto Full Text Search como Term Queries.
  • Explotar la información alojada en ElasticSearch utilizando Kibana.
  • Visualizar información por medio de Dashboards adecuados a las métricas y valores alojados en nuestro índice.
  • Entender toda la variedad de visualizaciones de las que dispone kibana y saber aplicarlas con los datos correctos.
  • Entender toda la variedad de visualizaciones de las que dispone kibana y saber aplicarlas con los datos correctos.
  • Comprender todos los métodos de aplicación que nos ofrece kibana.

Pentaho Data Integration- Apache NiFi

  • Entender el contexto y agentes del mercado en el cual surgen la inteligencia de negocios.
  • Entender el concepto de Inteligencia de Negocio (BI) y su uso en las aplicaciones, con sus ventajas asociadas.
  • Entender los conceptos de DataWarehouse, DataMart y DataLake.
  • Realizar modelados dimensionales utilizando PDI y NiFi como herramienta ETL.
  • Entender cómo utilizar PDI y NiFi para extraer datos, actualizarlos, borrarlos y limpiarlos para luego volcarlos convenientemente.
  • Diseñar e implementar mecanismos de ETL en PDI y NiFi.
  • Comprender la arquitectura interna y sus componentes principales de PDI y NiFi.
  • Conocer herramientas de administración de PDI y NiFi.

Programación Distribuida, Text Mining y Data Science aplicada

  • Entender los conceptos relacionados a la programación distribuida y su aplicación en data science.
  • Conocer las tecnologías y la arquitectura para la programación distribuida.
  • Aprender conceptos de Machine Learning de manera teórica y práctica.
  • Entender las funciones del rol de los data scientists y data engineer dentro de una organización.
  • Aprender la Herramienta Mahout de la Plataforma Hadoop.
  • Programar algoritmos de data mining con Java sobre Motor de Procesamiento MapReduce.
  • Programar algoritmos de data mining con Python sobre Motor de Procesamiento Spark.
  • Programar algoritmos de data mining con Scala sobre Motor de Procesamiento Spark.
  • Programar algoritmos en Scala ó Python sobre Spark en HDFS.
  • Programar algoritmos en Scala ó Python sobre Spark en MongoDB.
  • Entender el concepto de arquitectura Lambda.
  • Implementar arquitectura Lambda con los lenguajes y herramientas estudiados.

Modalidad: Sincronico

group_add
Encuentros en vivo
assignment_turned_in
Asistencia obligatoria
computer
Intercambio en campus virtual

Temario

7 Modulos • 57 Unidades • Carga Horaria 188 horas
expand_more

Modulo 1: Big Data – Base de Datos NoSQL MongoDB

fiber_manual_record
Unidad 1: Surgimiento y Conceptualización de Bases de Datos
fiber_manual_record
Unidad 2: Creando, actualizando, borrando y consultando documentos MongoDB
fiber_manual_record
Unidad 3: Índices
fiber_manual_record
Unidad 4: Agregación
fiber_manual_record
Unidad 5: Modelado y Consistencia de Datos
fiber_manual_record
Unidad 6: Replicación
fiber_manual_record
Unidad 7: Particionamiento
fiber_manual_record
Unidad 8: Administración
fiber_manual_record
Unidad 9: Seguridad en MongoDB
fiber_manual_record
Unidad 10: Profiling/Auditoria en MongoDB / gridFS
fiber_manual_record
Unidad 11: Programación de Funciones en Java Scripts
expand_more

Modulo 2: Curso Big Data – Apache Hadoop.

fiber_manual_record
Unidad 1: Surgimiento y Conceptualización de la Plataforma
fiber_manual_record
Unidad 2: HDFS – Hadoop Distributed File System
fiber_manual_record
Unidad 3: HIVE - HQL
fiber_manual_record
Unidad 4: SQOOP
fiber_manual_record
Unidad 5: YARN
fiber_manual_record
Unidad 6: Motores de Procesamiento Distribuido
fiber_manual_record
Unidad 7: Lenguajes para procesamiento distribuido
fiber_manual_record
Unidad 8: Procesamiento de Streaming
fiber_manual_record
Unidad 9: Seguridad / Auditoria / Data Governance
expand_more

Modulo 3: Curso Big Data – Bases de Datos NoSQL Cassandra y Neo4J

fiber_manual_record
Unidad 1: Surgimiento y Conceptualización de Bases de Datos
fiber_manual_record
Unidad 2: Conceptos básicos, Instalación y Configuración de Cassandra
fiber_manual_record
Unidad 3: Insertando, borrando y consultando datos en Cassandra
fiber_manual_record
Unidad 4: Arquitectura de Cassandra
fiber_manual_record
Unidad 5: Configuración de Replicación y Particionamiento
fiber_manual_record
Unidad 6: Indices y Seguridad en Casssandra
fiber_manual_record
Unidad 7: Monitoreo y Mantenimiento de Casssandra
fiber_manual_record
Unidad 8: Introducción a grafos y bases de datos basadas en grafos
fiber_manual_record
Unidad 9: Operaciones sobre grafos en Neo4j
fiber_manual_record
Unidad 10: Diseño de aplicaciones con Neo4j
fiber_manual_record
Unidad 11: Alta disponibilidad en Neo4j
fiber_manual_record
Unidad 12: Algoritmos de recorridos de grafos
expand_more

Modulo 4: Curso Big Data – Base de Datos NoSQL Redis.

fiber_manual_record
Unidad 1: Surgimiento y Conceptualización de Bases de Datos
fiber_manual_record
Unidad 2: Estructuras de datos Básicas en Redis
fiber_manual_record
Unidad 3: Estructuras avanzadas & Arquitectura
fiber_manual_record
Unidad 4: Streams
fiber_manual_record
Unidad 5: Extendiendo Redis
expand_more

Modulo 5: Curso Big Data – Elastic Stack

fiber_manual_record
Unidad 1: Introducción a Elastic Stack
fiber_manual_record
Unidad 2: Recolectando Datos por medio de beats
fiber_manual_record
Unidad 3: Logstash ingesta y transformación de datos
fiber_manual_record
Unidad 4: Introducción a ElasticSearch
fiber_manual_record
Unidad 5: Queries en ElasticSearch
fiber_manual_record
Unidad 6: Introducción a Kibana
fiber_manual_record
Unidad 7: Visualización de Datos en Kibana
expand_more

Modulo 6: Curso Big Data – Pentaho Data Integration- Apache NiFi

fiber_manual_record
Unidad 1: Business Intelligence
fiber_manual_record
Unidad 2: BI Analítica, Funciones Analíticas. Data Warehouse y modelado
fiber_manual_record
Unidad 3: Pentaho Data Integrator
fiber_manual_record
Unidad 4: Aplicaciones de transformaciones y jobs en PDI
fiber_manual_record
Unidad 5: Introducción a Apache NiFi
fiber_manual_record
Unidad 6: Conceptos Básicos
fiber_manual_record
Unidad 7: Automatización y administración de flujos de datos
fiber_manual_record
Unidad 8: Procesadores de NiFi
expand_more

Modulo 7: Curso Big Data – Programación Distribuida, Text Mining y Data Science Aplicada.

fiber_manual_record
Unidad 1: Conceptos generales de big data
fiber_manual_record
Unidad 2: Arquitectura distribuida
fiber_manual_record
Unidad 3: Machine learning y algoritmos de data mining
fiber_manual_record
Unidad 4: Lenguajes y Motores de procesamiento
fiber_manual_record
Unidad 5: Validación de resultados y testing

Destinatarios

  • Profesionales de Sistemas. Administradores de Bases de datos. Analistas de BI. Desarrolladores. Científicos de Datos. Arquitectos de Datos. Administradores de Sistemas. DevOps.

Equipo docente

Juan Zaffaroni

Profesor

Ing. Juan Zaffaroni Es egresado de la carrera de Ingeniería en Sistemas de Información de la Universidad Tecnológica Nacional Tiene más de 35 años de experiencia en el área de Gestión de Datos. Es CEO de DBlandIT, empresa que se dedica a Analítica de Datos y Big Data. Profesor desde el año 1991 en la Universidad Tecnológica Nacional... Ver más
Juan , Zaffaroni

Lucas Garcia

Coordinador

Mi nombre es Lucas García, soy Ingeniero industrial de UTN BA (2001). Una vez recibido trabajé en Toyota Argentina en Control de la Producción del Abastecimiento de Autopartes Locales. Durante 2005/7 realicé el Posgrado de Dirección Logística integrada en la USAL y a partir de allí, me desempeñé profesionalmente en Shell CAPSA, Siemens, e... Ver más
Lucas, Garcia

Modalidad de evaluación y acreditación:

Estos cursos están diseñados para brindarte una experiencia de aprendizaje con clases en vivo por videoconferencia.


Cada unidad tiene una duración de una semana y se enfoca en contenidos específicos. Accederás a un campus virtual que ofrece material didáctico complementario, clases en vivo semanales y trabajos prácticos.


Es importante que asistas al menos al 75% de las clases en vivo. La evaluación final te permitirá consolidar tus conocimientos. Para aprobar, se requiere cumplir con la asistencia y la aprobación de todas las instancias evaluatorias obligatorias.

Preguntas Frecuentes

Es muy fácil:

  1. Hacé clic en el botón "Inscripción" en la página web de tu curso de interés. Si es la primera vez que estudiás con nosotros, creá tu usuario. Si ya tenés uno, iniciá sesión.
  2. La página te redireccionará al proceso de pago. Si tenés un cupón de descuento, ¡este es el momento de usarlo! Cargá su código en el botón “Tengo un cupón de descuento”.
  3. Luego de operación, el pago puede demorar entre 48 y 72hs en impactar en el sistema. ¡No te preocupes! Cuando se acredite te avisaremos vía correo electrónico. 

En caso que el curso seleccionado cuente con un proceso de admisión, deberás enviar la documentación requerida para ser admitido y luego efectuar la inscripción.

La inscripción de nuestros cursos se mantiene abierta hasta 7 días después de la fecha de inicio.
Seguí los pasos de inscripción y envianos el comprobante de pago a administracion@centrodeelearning.com para que te demos el acceso al aula y puedas comenzar a cursar.

Podés abonar a través de Mercado Pago con tarjeta de débito, crédito o en efectivo.
Si pagás con tarjetas de crédito podrás financiar el pago en 3 o 6 cuotas sin interés, dependiendo del curso. También hay cursos con financiación específica,de tenerla se informa debajo de la presentación

El día de inicio de la cursada te enviaremos un correo electrónico para avisarte que el material ya está disponible en el Campus Virtual. ¡No te desesperes! El correo puede llegar entre las 10 y las 16hs.

A partir de ese momento vas a poder visualizar los contenidos de la primera unidad, el programa de estudio y el cronograma de clases.

Para asegurar la calidad de las clases, algunos cursos pueden tener cupos limitados. Dependiendo del curso, es posible que las vacantes se completen rápido.

¡No te preocupes! Nuestros cursos cuentan con varias fechas de inicio a lo largo del año para que nadie se quede con las ganas de estudiar y certificarse en el Centro de e-Learning UTN BA.