Medrano 951 - 2do. Piso - Of. 206 CABA - Lunes a viernes de 10 a 16 hs
(54 11) 5984 2238 info@sceu.frba.utn.edu.ar
Big Data – Elastic Stack

Big Data – Elastic Stack

Debido a la situación de público conocimiento generada a partir de la circulación del COVID- 19, las cursadas se realizarán de forma virtual sincrónica (clases en vivo en un aula virtual) hasta tanto las condiciones sanitarias de distanciamiento social, preventivo y obligatorio permitan el regreso presencial a las aulas, reservado únicamente para aquellos casos en los que sea de vital importancia uno o más encuentros presenciales para lograr un aprendizaje significativo. Existirán cursos con instancias presenciales obligatorias y otros con instancias presenciales optativas. La vuelta a las aulas será evaluada a partir de Abril 2021 según evolucione el escenario sanitario del país y las medidas de prevención de la UTN.BA.

 

PRESENTACIÓN

En los últimos 30 años el mundo de la informática ha experimentado cambios profundos. Han surgido nuevas arquitecturas de aplicaciones, nuevos paradigmas de programación y nuevas herramientas de desarrollo de software. Pero salvo excepciones, algo ha permanecido constante: el uso de Bases de Datos Relacionales (RDBMS) como el soporte básico para el almacenamiento y procesamiento de los datos. 

En los últimos 15 años se ha verificado una nueva revolución, que si bien no ha desafiado la preponderancia de las bases de datos relacionales, ha demostrado la necesidad de la utilización de nuevos paradigmas para el almacenamiento de datos. 

La necesidad de procesar grandes volúmenes de información a partir del uso cotidiano de las redes sociales y dispositivos móviles, es decir, el manejo de volúmenes de datos que salen de lo habitual, tendencia que actualmente denominamos como Big Data, requirió nuevas soluciones tecnológicas. Estas soluciones se encuadran dentro de lo que podemos denominar bajo la categoría de Bases de Datos NoSQL, nombre genérico en el cual podemos incluir las bases de datos key-value, las documentales, las basadas en familias de columnas  y las basadas en grafos. 

La adopción de estas tecnologías por las empresas está creciendo, en la medida en que también crece el volumen de datos no estructurados que estas empresas almacenan y gestionan.  Consecuencia de esto se está generando un mercado laboral para especialistas en estas áreas, que incluyen desde Administradores de Bases de Datos NoSQL , Data Scientists, Data Engineers y Data Architects. 

La inclusión de Motores de búsqueda como Elastic Search y en particular su Stack de Elastic Stack, es debido a que son tecnologías permiten acceder a cualquier tipo de dato y visualizar su evolución en tiempo real, con un muy buen tiempo de respuesta.

Siendo Elastic Search es un sistema distribuido que nos permite trabajar con datos de cualquier tipo, accediendo desde una api/rest de búsqueda y combinando datos estructurados, semi estructurados y no estructurados.

Al ser un sistema distribuido, Elastic Search es capaz de correr en un cluster comupuesto de cientos de servers manejando grandes cantidades enormes de información, incluso almacenando sus índices en HDFS.

 

OBJETIVOS

Se espera que al finalizar el programa, los participantes puedan:

  • Entender el funcionamiento general del Elastic Stack como así en qué casos es conveniente su utilización.
  • Manejar los Beats disponibles en Elastic Stack oficialmente, además conocer los creados por la comunidad
  • Entender la ingesta y transformación de los datos por medio del uso de codecs y filtros utilizando logstash con aplicación práctica.
  • Comprender el funcionamiento interno de ElasticSearch a la hora de indexar la información.
  • Configurar el motor de búsqueda ElasticSearch de la manera que nos resulte más eficiente a la hora de aplicarlo, dependiendo el caso en particular.
  • Crear, Eliminar, Modificar y Configurar adecuadamente índices para su posterior utilización.
  • Realizar consultas sobre nuestros índices tanto Full Text Search como Term Queries.
  • Explotar la información alojada en ElasticSearch utilizando Kibana. 
  • Visualizar información por medio de Dashboards adecuados a las métricas y valores alojados en nuestro índice
  • Entender toda la variedad de visualizaciones de las que dispone kibana y saber aplicarlas con los datos correctos
  • Entender toda la variedad de visualizaciones de las que dispone kibana y saber aplicarlas con los datos correctos
  • Comprender todos los métodos de aplicación que nos ofrece kibana

 

DESTINATARIOS 

  • El curso está dirigido a personas con conocimientos en el área de sistemas de información que quieran hacer una inmersión en el mundo Motores de búsqueda y en particular con Elastic Stack.
  • El curso está también dirigido a personas con conocimientos en el área de Big Data que quieran aprender Elastic Stack.

 

REQUISITOS

Es recomendable contar con estudios al menos iniciales en carreras relacionadas con Sistemas y conocimientos de bases de datos.

 

DURACIÓN

12 horas, 4 clases

 

TEMARIO

Unidad 1: Introducción a Elastic Stack 

  1. Casos de aplicación de negocio 
  2. Funcionalidades de las herramientas del stack
  3. Instalación del Stack Completo
  4. Configuración recomendada
  5. Cuando usar y cuándo no Elastic Stack

Unidad 2: Recolectando Datos por medio de beats

  1. Filebeat
  2. Packetbeat
  3. Metricbeat
  4. Heartbeat
  5. Auditbeat
  6. Winlogbeat
  7. Configuración recomendada para Filebeat

Unidad 3: Logstash ingesta y transformación de datos

  1. Introducción a la ingesta de datos
  2. Arquitectura de Logstash
  3. Inputs y Outputs
  4. Utilización de Codecs
  5. Filtros: Transformación a Datos Explotables 
  6. Monitorización

Unidad 4: Introducción a ElasticSearch

  1. Arquitectura de un Cluster y Tipos de Nodos
  2. Proceso de Indexación e Index Templates
  3. Configuración del Motor de Búsqueda
  4. Index Mapping

Unidad 5: Queries en ElasticSearch

  1. Tipos de Queries
  2. Match Queries y Term-Level Queries
  3. Specialized Queries
  4. Aggregation 
  5. Delete API
  6. Update API
  7. Bulk API

Unidad 6: Introducción a Kibana 

  1. Métodos de explotación de datos
  2. Administración de Kibana
  3. Administración de Índices
  4. Discover

Unidad 7: Visualización de Datos en Kibana

  1. Visualize
  2. Tipos y Creación de visualizaciones
  3. Dashboards
  4. Canvas
  5. Maps
  6. Dev Tools 
  7. Monitoring

 

DOCENTE

Ing. Juan Zaffaroni

Ing. Patricio Boffino

Ing. Martín Mihura

 

METODOLOGÍA A UTILIZAR EN EL DESARROLLO DEL CURSO

Dada la temática del programa y los objetivos que persigue, permanentemente se vincularán los conceptos teóricos con casos prácticos en Redis.

Durante el curso los participantes trabajaran en el desarrollo de casos prácticos en los cuales puedan aplicar los conceptos adquiridos.

 

PROCEDIMIENTOS DE EVALUACIÓN Y ACREDITACIÓN – CERTIFICACIÓN

  • Para obtener el certificado de aprobación, los participantes serán evaluados a través de un examen escrito y de la calificación de los trabajos prácticos.
  • Además la asistencia a un mínimo del 80% de las clases otorga un certificado de asistencia.-

Cronograma de evaluación

  • Durante el transcurso del programa, los participantes desarrollarán trabajos prácticos (en forma individual o grupal). A medida que se avance en los conceptos teóricos se debatirá respecto a dichos trabajos.
  • En la anteúltima clase los alumnos serán evaluados a través de un examen escrito.

 

INICIOS Y CURSADAS

El curso comenzará el 28 de Junio y se dictará los días lunes de 18.30 a 21.30 hs. – INSCRIPCIÓN

 

Debido a la situación de público conocimiento generada a partir de la circulación del COVID- 19, las cursadas se realizarán de forma virtual sincrónica (clases en vivo en un aula virtual) hasta tanto las condiciones sanitarias de distanciamiento social, preventivo y obligatorio permitan el regreso presencial a las aulas, reservado únicamente para aquellos casos en los que sea de vital importancia uno o más encuentros presenciales para lograr un aprendizaje significativo. Existirán cursos con instancias presenciales obligatorias y otros con instancias presenciales optativas. La vuelta a las aulas será evaluada a partir de Abril 2021 según evolucione el escenario sanitario del país y las medidas de prevención de la UTN.BA.