Objetivos:
- Que el participante pueda identificar necesidades y oportunidades en los negocios en los que la ciencia de datos forme parte de la solución y desarrolle las capacidades para enfrentar dichas situaciones de aplicación con el abordaje y las herramientas adecuadas del análisis multivariado utilizando el software R.
- Mejorar la productividad en el uso del software R utilizado para el procesamiento y análisis de grandes volúmenes de datos.
- Introducir herramientas de aprendizaje supervisado y no supervisado dentro del análisis multivariado que le permitan al participante generar valor agregado a su tarea y mejorar la toma de decisiones.
- Generar visualizaciones efectivas que cumplan con las mejores prácticas.
- Introducir al participante en los conceptos básicos necesarios para la ciencia de datos aplicada a los negocios y las ciencias sociales.
- Desarrollar las habilidades de análisis del participante para que ante situaciones particulares pueda elegir la herramienta adecuada para su abordaje.
Modalidad:
Dictado virtual.
Contenidos mínimos:
Módulo I
- Introducción al uso de R para el análisis estadístico de datos: Importación de datos. Análisis exploratorio. Comandos básicos. Gráficos. Pruebas estadísticas.
Módulo II
- Clasificación de las técnicas multivariantes.
- Análisis previo de los datos.
- Métodos de Clasificación: Análisis de Conglomerados: Medidas de similaridad. Análisis jerárquico y no jerárquico de conglomerados.
- Escalamiento multidimensional.
- Regresión lineal múltiple.
Módulo III
- Análisis discriminante.
- Regresión logística binomial y multinomial.
- Análisis de Correspondencias.
- Análisis de Componentes Principales.
Metodología de Dictado:
Si bien este curso contiene una base teórica, el dictado del mismo está focalizado en aplicaciones prácticas para profesionales. Se tiene previsto realizar 6 encuentros de 2,5 horas cada uno (15 horas en total), el seguimiento con actividades semanales de autogestión durante cada una de las 3 semanas de duración con 2,5 horas cada una (7,5 horas en total) y una carga horaria destinada a las tres trabajos prácticos evaluativos (en su elaboración, consultas y correcciones) de 7,5 horas. Totalizando este curso una carga horaria de 30 horas.
Horario de las clases: viernes de 18:00 a 20:30 hs. y los sábados de 9:00 a 11:30 hs.
Cronograma:
Fecha |
Duración |
Módulo |
Tema |
Actividad |
Viernes 27/10 |
2,5 horas |
Módulo I |
Introducción al Uso de R. Entorno de R Studio. Importación de datos. Comandos básicos. |
Sincrónica |
Sábado 27/10 |
2,5 horas |
Análisis exploratorio. Gráficos. Aplicaciones Prácticas. |
Sincrónica |
|
Miércoles 01/11 |
2,5 horas |
Consulta y Resolución de Trabajo Práctico N° 1 |
Asincrónica |
|
Viernes 03/11 |
2,5 horas |
Módulo II |
Clasificación de las técnicas multivariantes. Análisis previo de los datos. Métodos de Clasificación: Análisis de Conglomerados: Medidas de similaridad. Análisis jerárquico y no jerárquico de conglomerados. |
Sincrónica |
Sábado 04/11 |
2,5 horas |
Escalamiento multidimensional. Regresión lineal múltiple. |
Sincrónica |
|
Miércoles 09/11 |
2,5 horas |
Consulta y Resolución de Trabajo Práctico N° 2 |
Asincrónica |
|
Viernes 11/11 |
2,5 horas |
Módulo III |
Análisis discriminante. Regresión logística. |
Sincrónica |
Sábado 12/11 |
2,5 horas |
Análisis de Correspondencias. Análisis de Componentes Principales. |
Sincrónica |
|
Miércoles 16/11 |
2,5 horas |
Consulta y Resolución de Trabajo Práctico N° 3 |
Asincrónica |
Sistema de Evaluación:
Son requisitos para aprobar el curso obtener el 60 % o más en cada uno de los tres trabajos prácticos propuestos.
Conocimientos previos necesarios:
Título de grado en carrera de Ciencias Económicas o títulos afines con conocimiento intermedio de planilla de cálculos.
Equipo docente a cargo del dictado con los correspondientes Curriculum Vitae:
- Mg. Batista, Einer
- Mg. Quintana, Miguel
- Esp. Silisque, Celso
Destinatarios: El curso estará dirigido a profesionales de las Ciencias Económicas en general y a otros interesados egresados de distintas disciplinas interesados en dar los primeros pasos en el análisis de datos y avanzar posteriormente con el aprendizaje especializado en ciencia de datos. Se aceptarán estudiantes universitarios avanzados solo en calidad de asistentes.
Presupuesto y aranceles
Se adjunta presupuesto y aranceles en archivo Excel.
Bibliografía:
- Deepayan Sarkar. Lattice. Multivariate Data Visualization with R.
- Peter Dalgaard. Introductory Statistics witch R. 2da. Edición.
- Badiella. Blasco. Boixadera. Espinal. Valero. Vazquez. Manual de Introducción a R Commander: una interfaz gráfica para usuarios de R. Servei d’Estadística. Universitat Autónoma de Barcelona.
- Jose Luis Cañadas Reche. Regresión Logística. Tratamiento computacional con R. 2013.
- Hadley Wickham. Ggplot2. Elegant Graphics for Data Analisys. Springer.
- Peter Bruce. Andrew Bruce y Peter Gedek. Estadística practica para ciencias de datos con R y Python. 2da. Edición. Marcombo. España. 2022.
- Matiias Liberty Vittert. 50 principios de las ciencias de datos. Blume. Barcelona. 2021.
- F. Tusell. Análisis Multivariante. 2012.
- Daniel Peña. Análisis de Datos Multivariantes. 2002.
- C. M. Cuadras. Nuevos Metodos Multivariantes. CMC Editions. Barcelona. 2019.
- Joaquin Aldas. Ezequiel Uriel. Analisis Multivariante aplicado con R. 2da. Edición. Ediciones Paraninfo. España. 2017.