Curso de Big Data – Pentaho Data Integration- Apache NiFi

Start Date Icon Inicio de cursada
  05/08/2024
 

Presentación

Clases en vivo: Lunes 19 a 22 hs.

En los últimos 30 años el mundo de la informática ha experimentado cambios profundos. Han surgido nuevas arquitecturas de aplicaciones, nuevos paradigmas de programación y nuevas herramientas de desarrollo de software. Pero salvo excepciones, algo ha permanecido constante: el uso de Bases de Datos Relacionales (RDBMS) como el soporte básico para el almacenamiento y procesamiento de los datos.

En los últimos 15 años se ha verificado una nueva revolución, que si bien no ha desafiado la preponderancia de las bases de datos relacionales, ha demostrado la necesidad de la utilización de nuevos paradigmas para el almacenamiento de datos.

La necesidad de procesar grandes volúmenes de información a partir del uso cotidiano de las redes sociales y dispositivos móviles, es decir, el manejo de volúmenes de datos que salen de lo habitual, tendencia que actualmente denominamos como Big Data, requirió nuevas soluciones tecnológicas. Estas soluciones se encuadran dentro de lo que podemos denominar bajo la categoría de Bases de Datos NoSQL, nombre genérico en el cual podemos incluir las bases de datos key-value, las documentales, las basadas en familias de columnas y las basadas en grafos.

La adopción de estas tecnologías por las empresas está creciendo, en la medida en que también crece el volumen de datos no estructurados que estas empresas almacenan y gestionan. Consecuencia de esto se está generando un mercado laboral para especialistas en estas áreas, que incluyen desde Administradores de Bases de Datos NoSQL , Data Scientists, Data Engineers y Data Architects.

A su vez, los datos procesados y almacenados por estas bases de datos tanto SQL como NoSQL, son difíciles de unificar sin una herramienta adecuada que esté orientada a la integración de los mismos. Los tiempos de hoy necesitan de la toma de decisiones en base a una visión global de los datos, la cual permita concluir en mejores estrategias de mercado.

Es por esto, que dentro de las herramientas de integración de datos, se encuentra Pentaho Data Integration y Apache NiFi. La primera se basa en técnicas ETL (extracción, transformación y carga) que facilitan el proceso de captura, limpieza y almacenamiento de datos utilizando un formato uniforme y consistente para los usuarios finales. La herramienta fue lanzada en sus primeras versiones en el año 2004, y hoy en día es propiedad del grupo Hitachi.

Por su parte Apache NiFi es una plataforma integrada de procesamiento y logística de datos en tiempo real, la cual nos permite automatizar el flujo de datos entre diferentes sistemas de forma rápida, fácil y segura. Apache NiFi fue desarrollado y liberado por la NSA que lo utiliza desde el 2010.

La fundamentación de la inclusión de este curso se basa en la otorgar a aquellos que lo deseen, la posibilidad de profundizar en conceptos de BI + ETL y tener mayores herramientas para insertarse laboralmente en un mercado que consideramos va a ser demandante de profesionales en los próximos años

Modalidad: Sincronico

group_addEncuentros en vivo
assignment_turned_inAsistencia obligatoria
computerIntercambio en campus virtual

Qué vas a aprender

Objetivo general

Se espera que al finalizar el programa, los participantes puedan:

  • Entender el contexto y agentes del mercado en el cual surgen la inteligencia de negocios.
  • Entender el concepto de Inteligencia de Negocio (BI) y su uso en las aplicaciones, con sus ventajas asociadas.
  • Entender los conceptos de DataWarehouse, DataMart y DataLake.
  • Realizar modelados dimensionales utilizando PDI y NiFi como herramienta ETL.
  • Entender cómo utilizar PDI y NiFi para extraer datos, actualizarlos, borrarlos y limpiarlos para luego volcarlos convenientemente.
  • Diseñar e implementar mecanismos de ETL en PDI y NiFi.
  • Comprender la arquitectura interna y sus componentes principales de PDI y NiFi.
  • Conocer herramientas de administración de PDI y NiFi.

Destinatarios

  • El curso está dirigido a personas con conocimientos en el área de sistemas de información que quieran hacer una inmersión en el mundo de Big Data y Bases de datos NoSQL y aplicar sus conceptos en PDI y NiFi.
  • El curso está también dirigido a personas con conocimientos en el área de Big Data y bases de datos NoSQL que quieran aprender de PDI y NiFi.

Requisitos

  • Es recomendable contar con estudios al menos iniciales en carreras relacionadas con Sistemas y conocimientos de bases de datos.

Equipo docente

Juan Zaffaroni

Profesor

Ing. Juan Zaffaroni Es egresado de la carrera de Ingeniería en Sistemas de Información de la Universidad Tecnológica Nacional Tiene más de 35 años de experiencia en el área de Gestión de Datos. Es CEO de DBlandIT, empresa que se dedica a Analítica de Datos y Big Data. Profesor desde el año 1991 en la Universidad Tecnológica Nacional – Facultad Regional Buenos Aires, y dicta las materias Gestión de Datos y Bases de Datos NoSQL, pertenecientes a la carrera de grado de Ingeniería en Sistemas de Información. Es Director Académico de la Diplomatura en Arquitecturas de Big Data Aplicadas en Extensión Universitaria de la UTN FRBA.

Juan , Zaffaroni

Modalidad de Evaluación y Acreditación:

Estos cursos están diseñados para brindarte una experiencia de aprendizaje con clases en vivo por videoconferencia.


Cada unidad tiene una duración de una semana y se enfoca en contenidos específicos. Accederás a un campus virtual que ofrece material didáctico complementario, clases en vivo semanales y trabajos prácticos.


Es importante que asistas al menos al 75% de las clases en vivo. La evaluación final te permitirá consolidar tus conocimientos. Para aprobar, se requiere cumplir con la asistencia y la aprobación de todas las instancias evaluatorias obligatorias.

Preguntas Frecuentes

Es muy fácil:

  1. Hacé clic en el botón "Inscripción" en la página web de tu curso de interés. Si es la primera vez que estudiás con nosotros, creá tu usuario. Si ya tenés uno, iniciá sesión.
  2. La página te redireccionará al proceso de pago. Si tenés un cupón de descuento, ¡este es el momento de usarlo! Cargá su código en el botón “Tengo un cupón de descuento”.
  3. Luego de operación, el pago puede demorar entre 48 y 72hs en impactar en el sistema. ¡No te preocupes! Cuando se acredite te avisaremos vía correo electrónico. 

En caso que el curso seleccionado cuente con un proceso de admisión, deberás enviar la documentación requerida para ser admitido y luego efectuar la inscripción.

La inscripción de nuestros cursos se mantiene abierta hasta 7 días después de la fecha de inicio.
Seguí los pasos de inscripción y envianos el comprobante de pago a administracion@centrodeelearning.com para que te demos el acceso al aula y puedas comenzar a cursar.

Podés abonar a través de Mercado Pago con tarjeta de débito, crédito o en efectivo.
Si pagás con tarjetas de crédito podrás financiar el pago en 3 o 6 cuotas sin interés, dependiendo del curso. También hay cursos con financiación específica,de tenerla se informa debajo de la presentación

El día de inicio de la cursada te enviaremos un correo electrónico para avisarte que el material ya está disponible en el Campus Virtual. ¡No te desesperes! El correo puede llegar entre las 10 y las 16hs.

A partir de ese momento vas a poder visualizar los contenidos de la primera unidad, el programa de estudio y el cronograma de clases.

Para asegurar la calidad de las clases, algunos cursos pueden tener cupos limitados. Dependiendo del curso, es posible que las vacantes se completen rápido.

¡No te preocupes! Nuestros cursos cuentan con varias fechas de inicio a lo largo del año para que nadie se quede con las ganas de estudiar y certificarse en el Centro de e-Learning UTN BA.