Data Scientist con R

Gestiona información masiva de Big Data. Conoce la estructura, sintaxis y algoritmos de R para el diseño y uso de repositorios de datos
25% descuento club del graduado
Inscripción

Video

Presentación

R es un lenguaje y entorno de programación de software libre para análisis estadístico, cálculo numérico y representaciones gráficas (modelos lineales y no lineales, tests estadísticos, análisis de series temporales, algoritmos de clasificación y otros). Por su parte Big Data es el término que se utiliza para describir los grandes volúmenes de datos que componen Internet y la posibilidad de obtener información sobre ellos. Actualmente compañías como Google, Amazon, Facebook, Netflix, Walmart, GAP, IBM y General Electric, entre otras, están liderando procesos de gestión masiva de información y reclutando “Data Scientists” en la nueva era que deviene de Big Data. El trabajo de un buen Científico de Datos es hacer descubrimientos “buceando” en un océano de datos cada vez más masivos y complejos. Identifican potenciales fuentes ricas en datos valiosos y acercan la brecha entre los datos, la información y finalmente las decisiones de negocio. Este entrenamiento tiene como objetivo familiarizar a los participantes con R y sus principales algoritmos más difundidos. Se espera que los participantes incorporen criterios para diseñar y utilizar repositorios de datos.

Requisitos

Es conveniente que los participantes tengan un manejo general de las herramientas informáticas (ofimática, carpetas, archivos, etc.) así como los conceptos básicos de estadística descriptiva y probabilidad.
Los participantes se beneficiarán de su experiencia previa en uno o más de los siguientes campos:
Manejo de base de datos
Programación
Matemáticas
Marketing
Inteligencia de Negocios
Aunque ninguno de los conocimientos resulta excluyente, dado que se trata de un curso específico, resultará muy conveniente que los participantes cuenten con formación previa de carácter general, idealmente tener formación en Inteligencia de Negocios (como por ejemplo la tener aprobada la Diplomatura en BI de esta institución).

Objetivo general

Formar profesionales Científicos de Datos para los que se requiere que los participantes: Ubiquen a la ciencia de datos en el contexto de disciplinas al servicio de los negocios Entiendan la estructura de R Conozcan las convenciones utilizadas de sintaxis de R Sepan usar los algoritmos más difundidos Puedan diseñar un repositorio de datos Incorporen la necesidad de limpiar los datos antes de usarlos Usen sin dificultad las herramientas de inferencia estadística Complementen su formación y entrenamiento como Data Scientists

Objetivos específicos

Puedan comparar las ventajas y desventajas de los distintos algoritmos que se ofrecen para las diferentes técnicas descriptivas cubiertas.
Identifiquen los principales algoritmos aplicados a la estadística descriptiva que vienen dentro de R Entiendan el significado de cada parámetro de la invocación de los algoritmos descriptivos desde R
Comparen adecuadamente las herramientas que existen en el mercado para soportar repositorios de datos
Manejen la terminología relacionada con los repositorios de datos
Palpen las consecuencias nefastas de no realizar adecuadamente la limpieza de los datos
Adquieran criterio propio para diseñar repositorios de datos
Incorporen el lugar que R va tomando como estándar de facto dentro de la ciencia de datos.
Ubiquen los principales repositorios de los que bajar algoritmos
Manejen la sintaxis de comandos de R
Puedan comparar las ventajas y desventajas de los distintos algoritmos avanzados que se ofrecen para las diferentes técnicas predictivas cubiertas. Conozcan las futuras tendencias de la disciplina de la ciencia de datos.
Entiendan la estructura general de R
Identifiquen los principales algoritmos avanzados aplicados a la inferencia estadística que vienen dentro de R Entiendan el significado de cada parámetro de la invocación de los algoritmos predictivos avanzados desde R
Dominen el concepto de ciencia de datos
Puedan comparar las ventajas y desventajas de los distintos algoritmos que se ofrecen para las diferentes técnicas predictivas cubiertas.
Identifiquen los algoritmos más simples aplicados a la inferencia estadística que vienen dentro de R Entiendan el significado de cada parámetro de la invocación de los algoritmos predictivos más simples desde R
Manejen la sintaxis de R para generar los gráficos.
Comprendan como distintas visualizaciones sirven o no para transmitir diferentes conceptos.
Identifiquen las principales herramientas gráficas que vienen dentro de R

Destinatarios

Todos aquellos profesionales que quieran profundizar en el uso de R aplicado a la

Metodología de enseñanza-aprendizaje:

La modalidad de e - Learning Colaborativo es totalmente mediada por tecnologías a través del Campus Virtual FRBA. Se trata de una modalidad básicamente asincrónica que aprovecha pedagógicamente los recursos de la Web 2.0, con un complemento sincrónico, por medio de la realización de clases en tiempo real, logrando superar de esta forma, la instancia de autoestudio.


El trayecto formativo consta de Módulos; cada uno de ellos está conformado por unidades, las cuales a su vez, integran los contenidos temáticos.


Así, en cada unidad, Usted contará con:

  • Foros Proactivos de interacción y comunicación propuestos por el docente para la presentación de dudas, consultas y opiniones, la discusión y la retroalimentación (feedback) entre profesores/tutores - alumnos; y alumnos entre sí.
  • Otras vías de consulta al docente, foro de dudas, salas de chat, mensajería interna del campus.
  • Material de lectura obligatoria y complementaria.
  • Actividades y trabajos integradores de aplicación de los conocimientos adquiridos, individuales y/o grupales.
  • Clase en tiempo real, 2 encuentros por módulo, en el Aula Virtual Sincrónica.

Modalidad de evaluación y acreditación:

Estudiar de forma online te permitirá organizar tus horarios y actividades cotidianas en relación con la cursada, brindándote autonomía en el aprendizaje y permitiendo que puedas estudiar cuando y donde quieras.
La modalidad es 100% a distancia, cada uno de nuestros cursos cuenta con un Campus Virtual que incluye todo el material de estudio necesario y donde se llevan a cabo las actividades necesarias para comprender e incorporar los conocimientos esperados de los temas desarrollados.
Entre las actividades que se llevan a cabo en el Aula Virtual están:


  • Foros de discusión: Los docentes moderarán foros en los que se podrán presentar dudas y consultas y que también funcionarán como medio de debate para desarrollar conceptos del cursado.De igual forma los foros serán el principal espacio para la generación de retroalimentación entre los tutores y los alumnos, permitiendo así construir el conocimiento de manera grupal y aprender de las experiencias o visiones de los compañeros de cursado.
  • Consultas al docente:El Campus Virtual cuenta con un servicio de mensajería privada que permitirá al alumno comunicarse con el docente de manera personal.
  • Actividades: Se desarrollarán actividades individuales y/o grupales de aplicación práctica de los conocimientos adquiridos. Algunas de las actividades serán obligatorias y evaluativas mientras otras serán de presentación opcional, pero que servirán para mejorar el conocimiento adquirido. Todas las actividades se realizan de forma online
  • Clases virtuales en tiempo real: En forma periódica se realizarán clases en formato videoconferencia. Estas clases, guiadas por el tutor, servirán para ahondar y complementar los temas tratados en los módulos y foros de discusión.

Temario

1 Modulos • 6 Unidades • Carga Horaria 45 horas
Modulo 1: Data Scientist con R
Unidad 1: Introducción a BI, R y la Ciencia de los Datos
Tema 1: ¿Qué es un Datawarehouse?
Tema 2: ¿Qué es R?
Tema 3: Qué es la Ciencia de los Datos?
Tema 4: El Rol del Científico de Datos
Tema 5: Elementos de sintaxis de R
Tema 6: Repositorios de Algoritmos
Tema 7: Comunicación multinivel
Tema 8: BI: La ciénaga conceptual:
Tema 9: ¿Qué es BI?
Tema 10: ¿Qué es Big Data?
Unidad 2: Diseño y construcción de repositorios de datos
Tema 1: Criterios de arquitectura de datos
Tema 2: Estrategias de limpieza de datos
Tema 3: Técnicas para carga de datos
Unidad 3: Algoritmos Descriptivos en R
Tema 1: Medidas estadísticas
Tema 2: Análisis de Fourier
Tema 3: Algoritmos de Agrupamiento
Unidad 4: Herramientas de Graficación en R
Tema 1: Gráficos de densidad
Tema 2: ) Gráficos de puntos
Tema 3: Gráficos de barras
Tema 4: Gráficos de líneas
Tema 5: Gráficos circulares
Tema 6: Gráficos de cajas
Tema 7: Gráficos de dispersión
Unidad 5: Algoritmos Predictivos básicos en R
Tema 1: Árboles de Decisión y Random Forest
Tema 2: Redes Neuronales
Tema 3: Reglas de asociación
Unidad 6: Algoritmos Predictivos avanzados en R
Tema 1: Métodos Bayesianos
Tema 2: Discriminante Lineal y Cuadrático
Tema 3: Máquinas vectoriales de soporte
Tema 4: Perspectivas futuras de BI y de la Ciencia de Datos

Así enseñamos:

Material de estudio online

Material de estudio online

Te brindamos los apuntes, material de estudio y textos complementarios necesarios para tu aprendizaje. Todo el contenido es descargable para que puedas visualizarlo cuando y donde quieras.

Clases en tiempo real

Clases en tiempo real

Tendrás clases en tiempo real periódicamente para desarrollar y profundizar las unidades temáticas. Su participación no es obligatoria y quedan grabadas para que accedas a ellas en todo momento.

Foros de discusión con docentes y pares

Foros de discusión con docentes y pares

Desde el Centro de eLearning creemos que la retroalimentación entre compañeros y profesores es la mejor forma de aprender.

Seguimiento docente activo

Seguimiento docente activo

Para poder desarrollar correctamente tu aprendizaje contás con profesores a tu disposición para poder despejar cualquier duda o inquietud que tengas sobre el material de estudio y la cursada. Asimismo, tendrás disponible un servicio de mensajería directa con ellos, además de los foros de intercambio.

Campus virtual disponible 24hs del día

Campus virtual disponible 24hs del día

Nuestra plataforma te permite estudiar en el horario que te sea conveniente, disponible en todo momento.

Profesores especializados en elearning

Profesores especializados en elearning

Nuestros docentes están capacitados en educación a distancia y comparten la vocación de enseñar y mantenerse en constante actualización para brindar lecciones íntegras y de gran nivel académico.

Certificación Universitaria UTN B

Certificación Universitaria UTN BA

Nuestros certificados son extendidos en formato digital por el Centro de e-Learning de la Secretaría de Cultura y Extensión Universitaria de UTN FRBA. Contamos con un Sistema de Verificación de Certificados (SVC) a través del cual se pueden verificar los diplomas emitidos, tanto por parte de un alumno o un tercero que requiera validar el historial académico.

¡Somos UCAP!

¡Somos UCAP!

Estamos registrados como Unidad Capacitadora, es decir que los cursos que dictamos pueden canalizarse a través del Régimen de Crédito Fiscal para capacitación

Bibliografía

Franco Jean Michel El Data Warehouse, El Data Mining. EDS Institut Prométhéus. Ed. F. Devolt (1998).
Fayyad, U., Piatetsky-Shiapiro, G., Smyth, P., & Uthurusamy, RAdvances in knowledge discovery and data mining. Menlo Park, CA: AAAI Press. . (1996).
Christopher D. Manning, Prabhakar Raghavan y Hinrich Schütze,
Cannataro M & Comito C. A Data Mining Ontology for Grid Programming. In Proceedings of the 1st International Workshop on Semantics Peer to Peer and Grid Computing. Budapest, 20-24 May 2003.
Bernstein A., Provost F. and Hill S.
Anand Rajaraman, Jure Leskovec y Jeffrey D. Ullman,
Trevor Hastie, Robert Tibshirani y Jerome Friedman. Springer,
Pyle D. Business Modeling and Data Mining. The Morgan Kaufmann Series in Data Management Systems. Morgan Kaufmann Publisher. (2003)
Hernández Orallo et al. Introducción a la Minería de Datos. Pearson Educación. (2004).
Han, J., & Kamber, M. Data mining: Concepts and techniques. Morgan Kaufmann. (2001).

Preguntas Frecuentes

Es muy fácil:

  1. Hacé clic en el botón 'Inscripción' en la página web de tu curso de interés. Si es la primera vez que estudiás con nosotros, creá tu usuario. Si ya tenés uno, iniciá sesión.
  2. La página te redireccionará al proceso de pago. Si tenés un cupón de descuento, ¡este es el momento de usarlo! Cargá su código en el botón “Tengo un cupón de descuento”.
  3. Luego de operación, el pago puede demorar entre 48 y 72hs en impactar en el sistema. ¡No te preocupes! Cuando se acredite te avisaremos vía correo electrónico. 

En caso que el curso seleccionado cuente con un proceso de admisión, deberás enviar la documentación requerida para ser admitido y luego efectuar la inscripción.

La inscripción de nuestros cursos se mantiene abierta hasta 7 días después de la fecha de inicio.
Seguí los pasos de inscripción y envianos el comprobante de pago a administracion@centrodeelearning.com para que te demos el acceso al aula y puedas comenzar a cursar.

Podés abonar a través de Mercado Pago con tarjeta de débito, crédito o en efectivo.
Si pagás con tarjetas de crédito podrás financiar el pago en 3 o 6 cuotas sin interés, dependiendo del curso.

El día de inicio de la cursada te enviaremos un correo electrónico para avisarte que el material ya está disponible en el Campus Virtual. ¡No te desesperes! El correo puede llegar entre las 10 y las 16hs.

A partir de ese momento vas a poder visualizar los contenidos de la primera unidad, el programa de estudio y el cronograma de clases.

Para asegurar la calidad de las clases, algunos cursos pueden tener cupos limitados. Dependiendo del curso, es posible que las vacantes se completen rápido.

¡No te preocupes! Nuestros cursos cuentan con varias fechas de inicio a lo largo del año para que nadie se quede con las ganas de estudiar y certificarse en el Centro de e-Learning UTN BA.