Especialista en Big Data con Apache Hadoop

3 y 6 cuotas sin interés
Conoce las funciones del marco de trabajo Apache Haddop en JAVA para aplicar las técnicas y herramientas del Big Data cuando lo requieras

Presentación

Big Data es el término que se utiliza para describir los grandes volúmenes de datos que componen Internet y la posibilidad de obtener información sobre ellos. La información en Internet está formada por datos estructurados, y por desestructurados, que en cantidad superan tres veces a los primeros y que provienen mayormente de las herramientas de redes sociales. Actualmente en menos de un minuto: se generan cerca de 100.000 tweets, se descargan 25.000 aplicaciones, 300.000 personas se loguean a Facebook y se ven 1,5 millones de videos en YouTube. Se estima que en 2014 cada día fueron creados cerca de 3 trillones de bytes de datos y se espera que para el año 2020 haya 35 zettabytes de información. La disciplina dedicada a los datos masivos y que se ocupa de todas las actividades relacionadas con los sistemas que manipulan grandes conjuntos de datos es Big Data. Las dificultades más habituales vinculadas a la gestión de estas cantidades de datos se centran en la captura, el almacenamiento, búsqueda, distribución (compartir), análisis y visualización de los datos. Dentro de las herramientas para trabajar con Big Data Apache Software Foundation creó Hadoop. Haddop es un marco de trabajo de software basado en Java y que soporta aplicaciones distribuidas bajo una licencia de software libre – freeware. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. La formación de Especialista en Big Data tiene como objetivo familiarizar a los participantes con el uso de las técnicas y herramientas más difundidas de Hadoop. Se espera que los participantes incorporen criterios para saber cuándo emplear y cuando no emplear las técnicas y herramientas de Big Data.

Modalidad: A distancia

wifi
100% a distancia
get_app
Material descargable
record_voice_over
Acompañamiento de tutores
play_circle_filled
En vivo o acceso a las grabaciones

Qué vas a aprender

Objetivo general

Formar a los asistentes en Big Data, para lo que se requiere que los participantes: Entiendan las ventajas y desventajas de las técnicas de Big Data Sepan distinguir los problemas que son susceptibles de emplear las técnicas de Big Data Comprendan los contextos en los cuales Big Data no tiene sentido desde el punto de vista de almacenamiento y explotación de la información Conozcan las herramientas disponibles identificando sus fortalezas y debilidades Sepan utilizar las funciones más difundidas de Apache Hadoop Puedan diseñar un flujo de trabajo con MapReduce, el modelo de programación utilizado por Google para dar soporte a la computación paralela

Objetivos específicos

  • Que los participantes Conozcan proyectos relacionados de Apache con Hadoop
  • Que los participantes Entiendan las diferencias entre Hive y Pig
  • Que los participantes manejen la escritura de código para la fase map y para la fase reduce.
  • Que los participantes descubran como paralelizar los problemas para sacar ventaja cabal del procesamiento distribuido.
  • Que los participantes entiendan la arquitectura de HDFS y desde esa comprensión valoren el impacto de los comandos de manipulación de archivos.
  • Que los participantes comprendan las diferentes herramientas que conforman el ecosistema de Apache Hadoop y el lugar que ocupan en el mismo.
  • Que los participantes utilicen las herramientas de HDFS para manipulación de archivos.
  • Que los participantes conozcan las razones que llevan al desarrollo de las técnicas de Big Data y puedan distinguir con claridad Big Data.
  • Que los participantes puedan elegir apropiadamente la distribución de Apache Hadoop que mejor se adapta a su problemática. Que los participantes puedan configurar adecuadamente los recursos de Apache Hadoop que van a utilizar. Que los participantes conozcan el impacto de los principales parámetros de configuración en el comportamiento futuro de las herramientas Apache Hadoop
  • Que los participantes desarrollen un criterio propio para saber cuándo aplicar herramientas de Big Data y cuando no. Que los participantes tengan como referencia aplicaciones útiles ya establecidas de las herramientas de Big Data para guiar su accionar.
  • Que los participantes Conozcan las futuras tendencias sobre Hadoop

Temario

1 Modulos • 5 Unidades • Carga Horaria 38 horas
expand_more

Modulo 1: Especialista en Big Data con Apache Hadoop

expand_more

Unidad 1: ¿Qué es Apache Hadoop?

fiber_manual_record
Tema 1: Big Data y la necesidad de Apache Hadoop
fiber_manual_record
Tema 2: La explosión de los volúmenes de datos
fiber_manual_record
Tema 3: La variación de las estructuras de datos
fiber_manual_record
Tema 4: El Origen y Diseño de Apache Hadoop
fiber_manual_record
Tema 5: El procesamiento distribuido con MapReduce
fiber_manual_record
Tema 6: El ecosistema de Apache Hadoop
expand_less

Unidad 2: ¿Cuando usar Apache Hadoop?

fiber_manual_record
Tema 1: Big data vs small data: ¿Cuando usar cada aproximación?
fiber_manual_record
Tema 2: Casos de uso comunes para Big Data en Apache Hadoop (log clickstram, Detección de Fraude, Análisis de sentimientos, Clasificación de imágenes, etc)
expand_less

Unidad 3: ¿Como configuramos un entorno Apache Hadoop?

fiber_manual_record
Tema 1: La elección de una distribución de Apache Hadoop
fiber_manual_record
Tema 2: La elección de una arquitectura de cluster Apache Hadoop (Modo Pseudo-distribuida vs Modalidad completamente distribuida (un clúster de nodos))
fiber_manual_record
Tema 3: Instructivo para la configuración
expand_less

Unidad 4: HDFS y MAP REDUCE

fiber_manual_record
Tema 1: Almacenamiento de datos en un File System Tradicional vs Almacenamiento de datos en HDFS
fiber_manual_record
Tema 2: Arquitectura HDFS
fiber_manual_record
Tema 3: Gestión de archivos con los comandos del HDFS
fiber_manual_record
Tema 4: Pensando en paralelo
fiber_manual_record
Tema 5: Fase Map
fiber_manual_record
Tema 6: Fase Reduce
fiber_manual_record
Tema 7: Ejemplo ilustrativo
fiber_manual_record
Tema 8: Escribiendo un Map Reduce
expand_less

Unidad 5: Otros Lenguajes para Hadoop y Pasos Siguientes

fiber_manual_record
Tema 1: Hive
fiber_manual_record
Tema 2: Pig
fiber_manual_record
Tema 3: Relación entre ambos lenguajes
fiber_manual_record
Tema 4: Escribiendo un Map Reduce en Hive
fiber_manual_record
Tema 5: Escribiendo un Map Reduce en Pig
fiber_manual_record
Tema 6: Ejemplos comparativos entre MAP REDUCE, PIG y HIVE
fiber_manual_record
Tema 7: Otros Lenguajes

Destinatarios

Profesionales que quieran aplicar herramientas y técnicas de Big Data a problemas de negocios ya sea en forma general o dentro de las herramientas propuestas por Apache Hadoop.

Requisitos

Los alumnos se beneficiarán de conocimientos básicos de estadística, de nociones de manejo de bases de datos SQL y de programación estructurada. Carecer de toda esta información hará difícil aunque no imposible seguir ágilmente el curso.
Se incluirán materiales complementarios y se responderán las preguntas individuales necesarias para asegurar el éxito de todos los participantes.

Equipo docente

Jesus Ignacio Matias Urteaga

Profesor

Completó la Licenciatura en Física en la UBA y trabajó en ese campo como investigador por cuatro años. Paulatinamente se fue reorientando a sistemas con foco en desarrollo de aplicaciones e inteligencia artificial. Trabajó durante 8 años Emergencias SA en diferentes posiciones gerenciales participando de varios proyectos de desarrollo ... Ver más
Jesús Ignacio Matías, Urteaga

Guillermo Garofalo

Profesor

Estudié el profesorado de historia en Consudec. Trabajo como preceptor. Por curiosidad me fui interesando en el mundo de la ciencia de datos desde la perspectiva de un educador. Participé en la publicación de un estudio sobre la predicción de la deserción en cursos virtuales y me invitaron a colaborar en el dictado de algunos cursos pa... Ver más
Guillermo, Garófalo

Ulises Martins

Coordinador

Ulises Martins es Ingeniero en Sistemas de Información de la Universidad Tecnológica Nacional (UTN). Posee un Postgrado en Ingeniería en Calidad (UTN), un Postgrado en Gestión Tecnológica (Universidad Austral) y las certificaciones Product Manager,Project Management Professional, Agile Certified Practitioner, Certified ScrumMaster, OKR Ce... Ver más
Ulises , Martins

Bibliografía del curso expand_more

Cannataro M & Comito C. A Data Mining Ontology for Grid Programming. In Proceedings of the 1st International Workshop on Semantics Peer to Peer and Grid Computing. Budapest, 20-24 May 2003.
Zhou Z. Three perspectives of Data Mining. Artificial Intelligence. Elsevier Science B.V. (2003).
Anand Rajaraman, Jure Leskovec y Jeffrey D. Ullman,
Trevor Hastie, Robert Tibshirani y Jerome Friedman. Springer,
Anand Rajaraman, Jure Leskovec y Jeffrey D. Ullman,
Pyle D. Business Modeling and Data Mining. The Morgan Kaufmann Series in Data Management Systems. Morgan Kaufmann Publisher. (2003). Schneider R.D Hadoop for Dummies (Wiley 2012).
Christopher D. Manning, Prabhakar Raghavan y Hinrich Schütze,
Schneider R.D Hadoop for Dummies (Wiley 2012).

Metodología de enseñanza-aprendizaje:

Toda la comunicación con los tutores la tendrás por medio de nuestro Campus Virtual, el cual está disponible las 24hs y donde encontrarás:

  • Foros de debate.
  • Consultas al tutor por medio de foros, salas de chat, mensajería interna.
  • Material de lectura obligatoria.
  • Contenidos complementarios.
  • Actividades y trabajos integradores individuales y/o grupales.
  • Clase en tiempo real, mínimo 1 encuentro cada 15 días, a través de Zoom.

Modalidad de evaluación y acreditación:

Estudiar de forma online te permitirá organizar tus horarios y actividades cotidianas en relación con la cursada, brindándote autonomía en el aprendizaje y permitiendo que puedas estudiar cuando y donde quieras.
La modalidad es 100% a distancia, cada uno de nuestros cursos cuenta con un Campus Virtual que incluye todo el material de estudio necesario y donde se llevan a cabo las actividades necesarias para comprender e incorporar los conocimientos esperados de los temas desarrollados.
Entre las actividades que se llevan a cabo en el Aula Virtual están:


  • Foros de discusión: Los docentes moderarán foros en los que se podrán presentar dudas y consultas y que también funcionarán como medio de debate para desarrollar conceptos del cursado.De igual forma los foros serán el principal espacio para la generación de retroalimentación entre los tutores y los alumnos, permitiendo así construir el conocimiento de manera grupal y aprender de las experiencias o visiones de los compañeros de cursado.
  • Consultas al docente:El Campus Virtual cuenta con un servicio de mensajería privada que permitirá al alumno comunicarse con el docente de manera personal.
  • Actividades: Se desarrollarán actividades individuales y/o grupales de aplicación práctica de los conocimientos adquiridos. Algunas de las actividades serán obligatorias y evaluativas mientras otras serán de presentación opcional, pero que servirán para mejorar el conocimiento adquirido. Todas las actividades se realizan de forma online
  • Clases virtuales en tiempo real: En forma periódica se realizarán clases en formato videoconferencia. Estas clases, guiadas por el tutor, servirán para ahondar y complementar los temas tratados en los módulos y foros de discusión.

Así enseñamos:

Material de estudio online

Material de estudio online

Te brindamos los apuntes, material de estudio y textos complementarios necesarios para tu aprendizaje. Todo el contenido es descargable para que puedas visualizarlo cuando y donde quieras.

Clases en tiempo real

Clases en tiempo real

Tendrás clases en tiempo real periódicamente para desarrollar y profundizar las unidades temáticas. Su participación no es obligatoria y quedan grabadas para que accedas a ellas en todo momento.

Foros de discusión con docentes y pares

Foros de discusión con docentes y pares

Desde el Centro de eLearning creemos que la retroalimentación entre compañeros y profesores es la mejor forma de aprender.

Seguimiento docente activo

Seguimiento docente activo

Para poder desarrollar correctamente tu aprendizaje contás con profesores a tu disposición para poder despejar cualquier duda o inquietud que tengas sobre el material de estudio y la cursada. Asimismo, tendrás disponible un servicio de mensajería directa con ellos, además de los foros de intercambio.

Campus virtual disponible 24hs del día

Campus virtual disponible 24hs del día

Nuestra plataforma te permite estudiar en el horario que te sea conveniente, disponible en todo momento.

Profesores especializados en elearning

Profesores especializados en elearning

Nuestros docentes están capacitados en educación a distancia y comparten la vocación de enseñar y mantenerse en constante actualización para brindar lecciones íntegras y de gran nivel académico.

Certificación Universitaria UTN B

Certificación Universitaria UTN BA

Nuestros certificados son extendidos en formato digital por el Centro de e-Learning de la Secretaría de Cultura y Extensión Universitaria de UTN FRBA. Contamos con un Sistema de Verificación de Certificados (SVC) a través del cual se pueden verificar los diplomas emitidos, tanto por parte de un alumno o un tercero que requiera validar el historial académico.

¡Somos UCAP!

¡Somos UCAP!

Estamos registrados como Unidad Capacitadora, es decir que los cursos que dictamos pueden canalizarse a través del Régimen de Crédito Fiscal para capacitación

¿Por qué elegirnos?

Especialistas en e-Learning

Especialistas en e-Learning

Aprendé con docentes experimentados en educación a distancia que se actualizan constantemente para dar clases con nivel académico de excelencia. Contamos con 17 años de trayectoria en educación online.

Seguimiento docente activo

Seguimiento docente activo

El equipo docente está a tu disposición para despejar dudas e inquietudes. ¿Preferís la comunicación one-to-one? Contás con un servicio de mensajería directa con los docentes, además de los foros de intercambio.

Campus Virtual 24/7

Campus Virtual 24/7

Nuestra plataforma no tiene restricciones y te permite estudiar en el horario más conveniente para vos. Además, te damos todo el material que necesitás para aprender en formato descargable.

Foros de intercambio

Foros de intercambio

Espacios de interacción con docentes y pares, especiales para potenciar el aprendizaje colaborativo a través de la comunicación, discusión y feedback proactivo.

Somos UCAP

Somos UCAP

Estamos registrados como Unidad Capacitadora. Todos los cursos que dictamos pueden canalizarse a través del Régimen de Crédito Fiscal para capacitación, que permite a las PyMES acceder a crédito fiscal para la capacitación de su personal.

Certificación

Diploma digital verificable a través del sistema de verificación de autenticidad.

UTN-BA

Certificados extendidos por la Secretaría de Cultura y Extensión Universitaria de Universidad Tecnológica Nacional Regional Buenos Aires.

Compartilo en

redes sociales
Certificado-UTN

Preguntas Frecuentes

Es muy fácil:

  1. Hacé clic en el botón "Inscripción" en la página web de tu curso de interés. Si es la primera vez que estudiás con nosotros, creá tu usuario. Si ya tenés uno, iniciá sesión.
  2. La página te redireccionará al proceso de pago. Si tenés un cupón de descuento, ¡este es el momento de usarlo! Cargá su código en el botón “Tengo un cupón de descuento”.
  3. Luego de operación, el pago puede demorar entre 48 y 72hs en impactar en el sistema. ¡No te preocupes! Cuando se acredite te avisaremos vía correo electrónico. 

En caso que el curso seleccionado cuente con un proceso de admisión, deberás enviar la documentación requerida para ser admitido y luego efectuar la inscripción.

La inscripción de nuestros cursos se mantiene abierta hasta 7 días después de la fecha de inicio.
Seguí los pasos de inscripción y envianos el comprobante de pago a administracion@centrodeelearning.com para que te demos el acceso al aula y puedas comenzar a cursar.

Podés abonar a través de Mercado Pago con tarjeta de débito, crédito o en efectivo.
Si pagás con tarjetas de crédito podrás financiar el pago en 3 o 6 cuotas sin interés, dependiendo del curso.

El día de inicio de la cursada te enviaremos un correo electrónico para avisarte que el material ya está disponible en el Campus Virtual. ¡No te desesperes! El correo puede llegar entre las 10 y las 16hs.

A partir de ese momento vas a poder visualizar los contenidos de la primera unidad, el programa de estudio y el cronograma de clases.

Para asegurar la calidad de las clases, algunos cursos pueden tener cupos limitados. Dependiendo del curso, es posible que las vacantes se completen rápido.

¡No te preocupes! Nuestros cursos cuentan con varias fechas de inicio a lo largo del año para que nadie se quede con las ganas de estudiar y certificarse en el Centro de e-Learning UTN BA.