Este curso forma parte de la
Diplomatura en Arquitecturas de Big Data Aplicadas
PRESENTACIÓN
En los últimos 30 años el mundo de la informática ha experimentado cambios profundos. Han surgido nuevas arquitecturas de aplicaciones, nuevos paradigmas de programación y nuevas herramientas de desarrollo de software. Pero salvo excepciones, algo ha permanecido constante: el uso de Bases de Datos Relacionales (RDBMS) como el soporte básico para el almacenamiento y procesamiento de los datos.
En los últimos 15 años se ha verificado una nueva revolución, que si bien no ha desafiado la preponderancia de las bases de datos relacionales, ha demostrado la necesidad de la utilización de nuevos paradigmas para el almacenamiento de datos.
La necesidad de procesar grandes volúmenes de información a partir del uso cotidiano de las redes sociales y dispositivos móviles, es decir, el manejo de volúmenes de datos que salen de lo habitual, tendencia que actualmente denominamos como Big Data, requirió nuevas soluciones tecnológicas. Estas soluciones se encuadran dentro de lo que podemos denominar bajo la categoría de Bases de Datos NoSQL, nombre genérico en el cual podemos incluir las bases de datos key-value, las documentales, las basadas en familias de columnas y las basadas en grafos.
La adopción de estas tecnologías por las empresas está creciendo, en la medida en que también crece el volumen de datos no estructurados que estas empresas almacenan y gestionan. Consecuencia de esto se está generando un mercado laboral para especialistas en estas áreas, que incluyen desde Administradores de Bases de Datos NoSQL , Data Scientists, Data Engineers y Data Architects.
La inclusión de Motores de búsqueda como Elastic Search y en particular su Stack de Elastic Stack, es debido a que son tecnologías permiten acceder a cualquier tipo de dato y visualizar su evolución en tiempo real, con un muy buen tiempo de respuesta.
Siendo Elastic Search es un sistema distribuido que nos permite trabajar con datos de cualquier tipo, accediendo desde una api/rest de búsqueda y combinando datos estructurados, semi estructurados y no estructurados.
Al ser un sistema distribuido, Elastic Search es capaz de correr en un cluster comupuesto de cientos de servers manejando grandes cantidades enormes de información, incluso almacenando sus índices en HDFS.
OBJETIVOS
Se espera que al finalizar el programa, los participantes puedan:
– Entender el funcionamiento general del Elastic Stack como así en qué casos es conveniente su utilización.
– Manejar los Beats disponibles en Elastic Stack oficialmente, además conocer los creados por la comunidad
– Entender la ingesta y transformación de los datos por medio del uso de codecs y filtros utilizando logstash con aplicación práctica.
– Comprender el funcionamiento interno de ElasticSearch a la hora de indexar la información.
– Configurar el motor de búsqueda ElasticSearch de la manera que nos resulte más eficiente a la hora de aplicarlo, dependiendo el caso en particular.
– Crear, Eliminar, Modificar y Configurar adecuadamente índices para su posterior utilización.
– Realizar consultas sobre nuestros índices tanto Full Text Search como Term Queries.
– Explotar la información alojada en ElasticSearch utilizando Kibana.
– Visualizar información por medio de Dashboards adecuados a las métricas y valores alojados en nuestro índice
– Entender toda la variedad de visualizaciones de las que dispone kibana y saber aplicarlas con los datos correctos
– Entender toda la variedad de visualizaciones de las que dispone kibana y saber aplicarlas con los datos correctos
– Comprender todos los métodos de aplicación que nos ofrece kibana
DESTINATARIOS
El curso está dirigido a personas con conocimientos en el área de sistemas de información que quieran hacer una inmersión en el mundo Motores de búsqueda y en particular con Elastic Stack.
El curso está también dirigido a personas con conocimientos en el área de Big Data que quieran aprender Elastic Stack.
REQUISITOS
Es recomendable contar con estudios al menos iniciales en carreras relacionadas con Sistemas y conocimientos de bases de datos.
DURACIÓN
12 horas, 4 clases
TEMARIO
Unidad 1: Introducción a Elastic Stack
Unidad 2: Recolectando Datos por medio de beats
Unidad 3: Logstash ingesta y transformación de datos
Unidad 4: Introducción a ElasticSearch
Unidad 5: Queries en ElasticSearch
Unidad 6: Introducción a Kibana
Unidad 7: Visualización de Datos en Kibana
DOCENTE
Ing. Juan Zaffaroni
Ing. Patricio Boffino
Ing. Martín Mihura
METODOLOGÍA A UTILIZAR EN EL DESARROLLO DEL CURSO
Dada la temática del programa y los objetivos que persigue, permanentemente se vincularán los conceptos teóricos con casos prácticos en Redis.
Durante el curso los participantes trabajaran en el desarrollo de casos prácticos en los cuales puedan aplicar los conceptos adquiridos.
PROCEDIMIENTOS DE EVALUACIÓN Y CERTIFICACIÓN
Para obtener el certificado de aprobación, los participantes serán evaluados a través de un examen escrito y de la calificación de los trabajos prácticos.
Además la asistencia a un mínimo del 80% de las clases otorga un certificado de asistencia.-
Cronograma de evaluación
Durante el transcurso del programa, los participantes desarrollarán trabajos prácticos (en forma individual o grupal). A medida que se avance en los conceptos teóricos se debatirá respecto a dichos trabajos. En la anteúltima clase los alumnos serán evaluados a través de un examen escrito.