Especialista en Big Data con Apache Hadoop
Presentación
Big Data es el término que se utiliza para describir los grandes volúmenes de datos que componen Internet y la posibilidad de obtener información sobre ellos. La información en Internet está formada por datos estructurados, y por desestructurados, que en cantidad superan tres veces a los primeros y que provienen mayormente de las herramientas de redes sociales. Actualmente en menos de un minuto: se generan cerca de 100.000 tweets, se descargan 25.000 aplicaciones, 300.000 personas se loguean a Facebook y se ven 1,5 millones de videos en YouTube. Se estima que en 2014 cada día fueron creados cerca de 3 trillones de bytes de datos y se espera que para el año 2020 haya 35 zettabytes de información. La disciplina dedicada a los datos masivos y que se ocupa de todas las actividades relacionadas con los sistemas que manipulan grandes conjuntos de datos es Big Data. Las dificultades más habituales vinculadas a la gestión de estas cantidades de datos se centran en la captura, el almacenamiento, búsqueda, distribución (compartir), análisis y visualización de los datos. Dentro de las herramientas para trabajar con Big Data Apache Software Foundation creó Hadoop. Haddop es un marco de trabajo de software basado en Java y que soporta aplicaciones distribuidas bajo una licencia de software libre – freeware. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. La formación de Especialista en Big Data tiene como objetivo familiarizar a los participantes con el uso de las técnicas y herramientas más difundidas de Hadoop. Se espera que los participantes incorporen criterios para saber cuándo emplear y cuando no emplear las técnicas y herramientas de Big Data.
Modalidad: A distancia
Objetivo general
Formar a los asistentes en Big Data, para lo que se requiere que los participantes: Entiendan las ventajas y desventajas de las técnicas de Big Data Sepan distinguir los problemas que son susceptibles de emplear las técnicas de Big Data Comprendan los contextos en los cuales Big Data no tiene sentido desde el punto de vista de almacenamiento y explotación de la información Conozcan las herramientas disponibles identificando sus fortalezas y debilidades Sepan utilizar las funciones más difundidas de Apache Hadoop Puedan diseñar un flujo de trabajo con MapReduce, el modelo de programación utilizado por Google para dar soporte a la computación paralela
Objetivos específicos
- Que los participantes Conozcan las futuras tendencias sobre Hadoop
- Que los participantes Conozcan proyectos relacionados de Apache con Hadoop
- Que los participantes Entiendan las diferencias entre Hive y Pig
- Que los participantes manejen la escritura de código para la fase map y para la fase reduce.
- Que los participantes descubran como paralelizar los problemas para sacar ventaja cabal del procesamiento distribuido.
- Que los participantes entiendan la arquitectura de HDFS y desde esa comprensión valoren el impacto de los comandos de manipulación de archivos.
- Que los participantes utilicen las herramientas de HDFS para manipulación de archivos.
- Que los participantes puedan elegir apropiadamente la distribución de Apache Hadoop que mejor se adapta a su problemática. Que los participantes puedan configurar adecuadamente los recursos de Apache Hadoop que van a utilizar. Que los participantes conozcan el impacto de los principales parámetros de configuración en el comportamiento futuro de las herramientas Apache Hadoop
- Que los participantes desarrollen un criterio propio para saber cuándo aplicar herramientas de Big Data y cuando no. Que los participantes tengan como referencia aplicaciones útiles ya establecidas de las herramientas de Big Data para guiar su accionar.
- Que los participantes comprendan las diferentes herramientas que conforman el ecosistema de Apache Hadoop y el lugar que ocupan en el mismo.
- Que los participantes conozcan las razones que llevan al desarrollo de las técnicas de Big Data y puedan distinguir con claridad Big Data.
Destinatarios
- Profesionales que quieran aplicar herramientas y técnicas de Big Data a problemas de negocios ya sea en forma general o dentro de las herramientas propuestas por Apache Hadoop.
Requisitos
- Los alumnos se beneficiarán de conocimientos básicos de estadística, de nociones de manejo de bases de datos SQL y de programación estructurada. Carecer de toda esta información hará difícil aunque no imposible seguir ágilmente el curso.
- Se incluirán materiales complementarios y se responderán las preguntas individuales necesarias para asegurar el éxito de todos los participantes.
Equipo docente
Jesus Ignacio Matias Urteaga
Profesor
Completó la Licenciatura en Física en la UBA y trabajó en ese campo como investigador por cuatro años. Paulatinamente se fue reorientando a sistemas con foco en desarrollo de aplicaciones e inteligencia artificial. Trabajó durante 8 años Emergencias SA en diferentes posiciones gerenciales participando de varios proyectos de desarrollo de software y de consultoría. Desarrollo un proceso de auto - aprendizaje supervisado para el sistema experto de clasificación telefónica de Emergencias Médicas. Este logro obtuvo un premio en EUNITE 2001 y fue objeto de un proceso de transferencia de ""Know How"" hacia SEMSA SA (gestor del sistema de emergencias de la Comunidad Autónoma de Catalunya) Tras cumplir dos años como Gerente de Proyectos en una consultora especializada en la gestión de la tecnología en el ámbito público se independizó como consultor cubriendo temáticas de gestión de proyectos, gestión de la tecnología, emergencias públicas y análisis y gestión de proyectos. En la actualidad se desempeña como Director de Business Intelligence en Sprayette SA, es profesor adjunto en el MBA en Dirección de Sistemas de Información de la Universidad del Salvador y en el Postgrado en Gestión de Proyectos de la UTN.
Alejo Martin Lazzati
Profesor
Quiero enfrentar nuevos desafíos, encontrar un lugar donde poder desarrollarme y crecer, proyectándome a largo plazo. Actualmente me encuentro en el fin de mi carrera universitaria, por lo tanto considero este un momento de encarar un nuevo proyecto.
Laura Cristina Siri
Profesor
comunicóloga graduada de la Universidad de Buenos Aires, actualmente cursando el doctorado en Ciencias Sociales. Ha integrado equipos de investigación UBACYT en la misma casa de estudios desde 1994 hasta la actualidad, en el marco de los cuales ha publicado artículos, libros y capítulos de libros. Es jefe de trabajos prácticos en la carre ra de Ciencias de la Comunicación de dicha universidad, en el área de políticas tecnológicas, y posee estudios de posgrado en estudios sociales de la ciencia y la tecnología. Durante casi quince años fue periodista y editora especializada en informática en distintas revistas, diarios y medios digitales de Argentina y América Latina y, posteriormente, se desempeñó cuatro años como responsable regional de medios sociales online para sistemas empresariales de una compañía global de hardware, software y servicios
Guillermo Garofalo
Profesor
Estudié el profesorado de historia en Consudec. Trabajo como preceptor. Por curiosidad me fui interesando en el mundo de la ciencia de datos desde la perspectiva de un educador. Participé en la publicación de un estudio sobre la predicción de la deserción en cursos virtuales y me invitaron a colaborar en el dictado de algunos cursos pa ra que pueda aportar desde mi experiencia y formación pedagógica al tiempo que me iba interiorizando en el apasionante mundo de la ciencia de datos
Julio Paredes
Profesor
Mentor en Ciencias de Datos y AI, Instructor de Tesis y Desarrollo Organizacional: Imparto cursos en reconocidas instituciones como Digital House, el Instituto de Data Science (UTN FRRQ), y la Universidad de Palermo, con un enfoque internacional en proyectos de inteligencia artificial y ciencia de datos. Mi experiencia abarca la analític a de datos utilizando herramientas como Power BI y SQL, así como la enseñanza de lenguajes clave para el aprendizaje automático, como R y Python. Además, brindo asesoramiento para tesis de grado y posgrado y poseo más de 12 años de experiencia en la industria como planificador de operaciones. https://www.linkedin.com/in/julio-paredes-rojas-b0143752/
Ulises Martins
Coordinador
Ulises Martins es Ingeniero en Sistemas de Información de la Universidad Tecnológica Nacional (UTN). Posee un Postgrado en Ingeniería en Calidad (UTN), un Postgrado en Gestión Tecnológica (Universidad Austral) y las certificaciones Product Manager,Project Management Professional, Agile Certified Practitioner, Certified ScrumMaster, OKR Ce rtified Professional e ITIL4. Habiendo comenzado su carrera en 1996, trabajó en diversas posiciones (soporte, desarrollo, testing, integración, arquitectura y gestión de proyectos) en distintas organizaciones multinacionales. Su experiencia laboral comprende más de 25 años trabajando en proyectos de IT en compañías como Accenture, Telefónica de Argentina, Banco Santander, IBM, Capgemini, Banco Galicia, Banco de Córdoba Kimberly-Clark y SAP. De los distintos desafíos en los que trabajó se destacan el liderazgo de un equipo de más de 70 personas (SW Factory), Proyectos complejos distribuidos en Latinoamérica, Servicios de infraestructura para todas las sucursales y casas centrales de Banco Santander en Argentina, Proyectos de outsourcing para España y la Migración de Datos del sistema CORE Banking de Banco Galicia a SAP Banking Services (2M de Cuentas y 102M de movimientos). A nivel académico dirige el Posgrado de Gestión de Proyectos en la Universidad Tecnológica Nacional y es el creador y coordinador de diversos cursos a distancia en el área de Tecnología y Producto. Actualmente se desempeña como Product Manager en una importante multinacional de la industria financiera
- Zhou Z. Three perspectives of Data Mining. Artificial Intelligence. Elsevier Science B.V. (2003).
- Schneider R.D Hadoop for Dummies (Wiley 2012).
- Trevor Hastie, Robert Tibshirani y Jerome Friedman. Springer,
- Pyle D. Business Modeling and Data Mining. The Morgan Kaufmann Series in Data Management Systems. Morgan Kaufmann Publisher. (2003). Schneider R.D Hadoop for Dummies (Wiley 2012).
- Christopher D. Manning, Prabhakar Raghavan y Hinrich Schütze,
- Cannataro M & Comito C. A Data Mining Ontology for Grid Programming. In Proceedings of the 1st International Workshop on Semantics Peer to Peer and Grid Computing. Budapest, 20-24 May 2003.
- Anand Rajaraman, Jure Leskovec y Jeffrey D. Ullman,
- Anand Rajaraman, Jure Leskovec y Jeffrey D. Ullman,
Metodología De Enseñanza-Aprendizaje:
Toda la comunicación con los tutores la tendrás por medio de nuestro Campus Virtual, el cual está disponible las 24hs y donde encontrarás:
- Consultas al tutor por medio de foros y mensajería interna.
- Material de lectura obligatoria.
- Contenidos complementarios.
- Clase en tiempo real, mínimo 1 encuentro cada 15 días, a través de Zoom.
Modalidad de Evaluación y Acreditación:
Para la acreditación de un trayecto formativo se tiene en cuenta:
- La lectura y visualización de todos los contenidos.
- La entrega y aprobación de todas las actividades y ejercicios que se consignen como obligatorios.
- El alumno deberá finalizar la cursada dentro de la duración del trayecto sin excepción. Terminado el mismo, no podrá entregar ninguna actividad obligatoria adeudada.
- La aprobación de la Evaluación Integradora Final, la cual puede ser un Trabajo Práctico o un Cuestionario Multiple Choice.
Al culminar el trayecto formativo, de haber cumplido con lo anteriormente nombrado se te otorgará un Certificado de Aprobación. En caso de haberlo hecho parcialmente, se te entregará un Certificado de Participación. Para conocer más acerca de nuestros certificados, consulte este artículo.
Así enseñamos:
Material de estudio online
Te brindamos los apuntes, material de estudio y textos complementarios necesarios para tu aprendizaje. Todo el contenido es descargable para que puedas visualizarlo cuando y donde quieras.
Clases en tiempo real
Tendrás clases en tiempo real periódicamente para desarrollar y profundizar las unidades temáticas. Su participación no es obligatoria y quedan grabadas para que accedas a ellas en todo momento.
Foros de discusión con docentes y pares
Desde el Centro de eLearning creemos que la retroalimentación entre compañeros y profesores es la mejor forma de aprender.
Seguimiento docente activo
Para poder desarrollar correctamente tu aprendizaje contás con profesores a tu disposición para poder despejar cualquier duda o inquietud que tengas sobre el material de estudio y la cursada. Asimismo, tendrás disponible un servicio de mensajería directa con ellos, además de los foros de intercambio.
Campus virtual disponible 24hs del día
Nuestra plataforma te permite estudiar en el horario que te sea conveniente, disponible en todo momento.
Profesores especializados en elearning
Nuestros docentes están capacitados en educación a distancia y comparten la vocación de enseñar y mantenerse en constante actualización para brindar lecciones íntegras y de gran nivel académico.
Certificación Universitaria UTN BA
Nuestros certificados son extendidos en formato digital por el Centro de e-Learning de la Secretaría de Cultura y Extensión Universitaria de UTN FRBA. Contamos con un Sistema de Verificación de Certificados (SVC) a través del cual se pueden verificar los diplomas emitidos, tanto por parte de un alumno o un tercero que requiera validar el historial académico.
¡Somos UCAP!
Estamos registrados como Unidad Capacitadora, es decir que los cursos que dictamos pueden canalizarse a través del Régimen de Crédito Fiscal para capacitación
¿Por qué elegirnos?
Especialistas en e-Learning
Aprendé con docentes experimentados en educación a distancia que se actualizan constantemente para dar clases con nivel académico de excelencia. Contamos con 17 años de trayectoria en educación online.
Seguimiento docente activo
El equipo docente está a tu disposición para despejar dudas e inquietudes. ¿Preferís la comunicación one-to-one? Contás con un servicio de mensajería directa con los docentes, además de los foros de intercambio.
Campus Virtual 24/7
Nuestra plataforma no tiene restricciones y te permite estudiar en el horario más conveniente para vos. Además, te damos todo el material que necesitás para aprender en formato descargable.
Foros de intercambio
Espacios de interacción con docentes y pares, especiales para potenciar el aprendizaje colaborativo a través de la comunicación, discusión y feedback proactivo.
Somos UCAP
Estamos registrados como Unidad Capacitadora. Todos los cursos que dictamos pueden canalizarse a través del Régimen de Crédito Fiscal para capacitación, que permite a las PyMES acceder a crédito fiscal para la capacitación de su personal.
Certificación
Diploma digital verificable a través del sistema de verificación de autenticidad.
Certificados extendidos por la Secretaría de Cultura y Extensión Universitaria de Universidad Tecnológica Nacional Regional Buenos Aires.
Compartilo en