Data Engineering
Presentación
En un mundo cada vez más digitalizado, los datos se han convertido en un recurso estratégico para las organizaciones. La capacidad de recolectar, unificar y gestionar eficientemente los datos es fundamental para impulsar la ciencia de datos, la inteligencia artificial y la analítica avanzada, y así obtener información valiosa que impulse la toma de decisiones informadas.
En este curso vas a adquirir los conocimientos y habilidades necesarias para ser capaz de aprovechar el potencial de los datos en su máximo esplendor. Vas a aprender las técnicas y herramientas fundamentales para recolectar, limpiar, transformar y almacenar datos de manera efectiva, permitiendo su posterior análisis y aplicación en diversos contextos empresariales. Nos centraremos principalmente en el uso de tecnologías clave, tales como Python y sus librerías, sqlalchemy, requests y pandas, así como en la implementación de PostgreSQL y Apache Kafka.
La importancia de la ingeniería de datos radica en su capacidad para unificar y organizar información de múltiples fuentes, creando un ecosistema de datos confiable y coherente. Esto facilita la implementación de modelos de inteligencia artificial, la generación de insights predictivos y la optimización de procesos empresariales. Al dominar los fundamentos de la ingeniería de datos, vas a estar en condiciones de desempeñar un papel crucial en el crecimiento y éxito de las organizaciones en la era de los datos.
Modalidad: A distancia ágil
Objetivo general
Dominar los conceptos y técnicas de la ingeniería de datos mediante la resolución de desafíos prácticos y el desarrollo progresivo de un trabajo integrador, siendo capaz de realizar la ingesta, almacenamiento y procesamiento de datos por cuenta propia.
Objetivos específicos
- Conocer las tecnologías y herramientas de la ingeniería de datos.
- Comprender que es la ingeniería y cuales son sus funciones y responsabiliades.
- Conocer el uso y la importancia de los datos en las organizaciones mediante el estudio y análisis de casos.
- Conocer los conceptos y técnicas para el procesamiento de datos en tiempo real mediante el desarrollo de programas en Python y el uso de Apache Kafka.
- Dominar técnicas de procesamiento de datos mediante el desarrollo de programas en Python.
- Implementar diferentes modelos de almacenamiento de datos para permitir un análisis eficiente, usando el motor de bases de datos Postgres y formatos de archivos especiales como Parquet.
- Dominar las técnicas para extraer datos de diferentes tipos de sistemas y estructuras mediante el desarrollo de programas en Python.
Destinatarios
- El curso va dirigido a estudiantes, profesionales e interesados de áreas de Sistemas, Informática o similares que deseen introducirse y/o especializarse en la ingeniería de datos.
Requisitos
- Conocimientos básicos de programación: Es importante tener un entendimiento básico de la programación, incluyendo conceptos como variables, estructuras de control (condicionales y bucles) y funciones. Es deseable tener conocimientos en el lenguaje Python, pero no es obligatorio.
- Conocimientos de SQL. Se necesita ser capaz de realizar consultas SQL para manipular los datos. Esto implica realizar consultas SELECT con condiciones, utilizar funciones de agregación (SUM, COUNT, AVG, etc.), y realizar operaciones de unión (JOIN) entre tablas.
- Conocimientos sobre bases de datos relacionales. Se necesita comprender conceptos como tablas y relaciones entre tablas.
Equipo docente
Guido Franco
Profesor
Mi nombre es Guido, soy Data Engineer Senior con amplia experiencia en la industria de Oil & Gas. Actualmente, como Owner Architect lidero equipos de ingeniería de datos y me ocupo de la definición, despliegue y evolución de soluciones de Big Data en diferentes proyectos. Además, cuento con dos certificaciones de Microsoft en Cloud Compu ting y Data & Analytics. También, he tomado diversos cursos a nivel internacional en Arquitectura, Ingeniería y Ciencia de Datos.
- Gorelik, A. (2019). The Enterprise Big Data Lake. O’Reilly Media, Inc. https://learning.oreilly.com/library/view/the-enterprise-big/9781491931547/
- Reis, J., & Housley, M. (2022). Fundamentals of Data Engineering. O’Reilly Media, Inc. https://learning.oreilly.com/library/view/fundamentals-of-data/9781098108298/
- Crickard, P. (2020). Data Engineering with Python. Packt Publishing. https://learning.oreilly.com/library/view/data-engineering-with/9781839214189/
Metodología De Enseñanza-Aprendizaje:
Nuestro modelo de formación te ofrece flexibilidad sin perder la interacción, combina autoaprendizaje con el apoyo de expertos y compañeros para una experiencia dinámica y efectiva.
Características de la formación
- E-learning colaborativo: estudia a tu ritmo con material curado y actividades prácticas.
- Acompañamiento experto: consulta dudas en foros y mensajes directos con tutores.
- Clases en vivo: dos encuentros por módulo para reforzar conceptos y resolver consultas en tiempo real.
A quiénes está dirigido
- Profesionales y estudiantes que buscan una formación flexible y de calidad.
Modalidad de Evaluación y Acreditación:
Estos son los requisitos que deberás cumplir para obtener la acreditación del trayecto formativo:
- Aprobar las evaluaciones integradoras por módulo.
- Realizar y aprobar la Evaluación Integradora Final Obligatoria (EFIO), que puede consistir en la entrega de una tarea basada en una consigna específica o en la realización de un cuestionario.
- Descargar y leer todos los materiales de la unidad temática.
- Entregar y aprobar todas las actividades y ejercicios obligatorios.
- Cumplir con la dedicación horaria recomendada para lograr el máximo rendimiento.
- Finalizar la cursada dentro del período estipulado, sin excepciones. Una vez finalizado el curso, no será posible entregar o descargar actividades pendientes. Quienes deseen completarlo deberán inscribirse en una nueva edición.
La evaluación final cuenta con una instancia de recuperatorio para quienes no aprueben en el primer intento o no la realicen dentro de las fechas establecidas en el cronograma.
Certificación
- La certificación se otorgará en función de la calificación obtenida en la EFIO.
- Las calificaciones posibles serán: bueno, muy bueno, excelente, sobresaliente, participó o no participó.
- Quienes obtengan una de las cuatro primeras calificaciones recibirán un certificado de aprobación.
- Aquellos que no alcancen estas calificaciones o no realicen la EFIO podrán obtener un certificado de participación, previa evaluación del tutor.
Los certificados emitidos por Centro de e-Learning UTN BA cuentan con un sistema de validación basado en tecnología blockchain, que garantiza autenticidad, trazabilidad y transparencia en todo momento.
¿Quieres capacitar a tu equipo con esta formación?
Accede al Portal de Empresas: compra múltiples licencias en pocos pasos, recibe facturación a nombre de tu compañía y gestiona el aprendizaje de todo tu equipo desde un solo lugar.
Comprar licencias para mi equipo