Primera escuela CICADA: Ciencia de Datos en acción – «Eclosión de chicharras» (Edición 2022)

Se llevará a cabo entre el domingo 23 y el viernes 28 de octubre de 2022 en Hotel La Capilla, Maldonado. Las postulaciones están abiertas.

Las actividades están dirigidas especialmente a personas que hayan completado la formación básica en ciencia de datos ofrecida por el CICADA (Ciencia de Datos: un primer acercamiento) y Aprendizaje Automático Básico para Científicos), integrantes del CICADA (seniors) y a estudiantes e investigadores locales, regionales e internacionales (en español).

Durante los días en que transcurre la escuela, se desarrollarán cursos teórico-prácticos para los que se requiere llevar laptop, así como charlas y espacios de intercambio.

La escuela no tiene costo para las personas seleccionadas. La participación incluye alojamiento con pensión completa y traslado dentro de Uruguay.

Objetivo

Esta escuela busca contribuir al espacio académico diverso que es área del análisis de datos, tanto en sus fundamentos y métodos como en su aplicación a las diferentes disciplinas y las áreas interdisciplinares, potenciando la investigación, el intercambio y la formación ampliamente entendida. Es necesario entonces crear y sostener una red intelectualmente coherente que se apoye en las áreas básicas mencionadas para proporcionar abstracciones rigurosas a los dominios de aplicación y recibir a cambio problemas y desafíos estimulantes para abordar. Para esto es necesario fomentar fuertemente la comunicación entre las disciplinas en juego alentando discusiones e intercambios en un lenguaje común asequible por todos. La formación y consolidación de dicha red es sin dudas una tarea de largo aliento que debe ser especialmente promovida. Las personas que realicen la escuela trabajarán en un entorno colaborativo y sumamente rico, con posibilidades de realizar intercambios con compañeros e investigadores de diversas formaciones y niveles académicos. Aprenderán a trabajar con herramientas conceptuales y metodológicas del estado del arte en el análisis de datos.

Público

La escuela está dirigida especialmente a estudiantes avanzados de grado, posgrado o post doctorados recientes, con particular interés en ciencia de datos, aprendizaje automático y aplicaciones. Se espera que provengan de diversas formaciones, ciencias sociales, ingenierías, ciencias de la salud, ciencias básicas, economía, humanidades, etc.  Es necesario tener ciertas nociones básicas en matemáticas y programación (por ejemplo R y/o Python). Un ejemplo de formación sugerida es la que brindan los cursos básicos de Ciencia de Datos y Aprendizaje Automático como parte de la oferta académica de  CICADA).

Estructura

La escuela consistirá de 2 cursos que se desarrollarán por espacio de 4 días y dos conferencias de cierre. Asimismo se fomentaŕa el intercambio entre los diferentes actores de la escuela con tiempo dedicado a esos fines (sesiones de posters, presentaciones informales, grupos de trabajo semilla, etc.).

Cronograma tentativo*

Domingo 23Lunes 24Martes 25Miércoles 26Jueves 27Viernes 28
8:30- 12:30Curso 2Curso 2Curso 2Curso 2Conferencias
12:30-15:30AlmuerzoAlmuerzoAlmuerzoAlmuerzoAlmuerzo
15:30-19:30BienvenidaCurso 1Curso 1Curso 1Curso 1Despedida
19:30 – 21:00BrindisEspacio intercambioEspacio intercambioEspacio intercambioEspacio intercambio
21:00 CenaCena Cena Cena
*El cronograma puede tener cambios.

Cursos

Curso 1. Aprendizaje Automático para Predicción Genómica

Docente: Abelardo Montesinos, Centro Universitario de Ciencias Exactas e Ingenierías, Universidad de Guadalajara, México.

El curso busca brindar elementos para trabajar en el área de la selección genómica vinculada al aprendizaje estadístico. El curso se organiza en los siguientes temas: 

i. Elementos generales de selección genómica y aprendizaje estadístico. 

ii. Introducción a los modelos mixtos.

iii. Modelos clásicos y bayesianos para la predicción de datos categóricos y de conteo.

iv. Métodos de clasificación y regresión basados en Reproducing Kernel Hilbert Spaces.

v. Support Vector Machines y Support Vector Regression.

vi. Fundamentos de redes neuronales artificiales y aprendizaje profundo.

vii. Regresión funcional.

Bibliografía: Montesinos López, O. A., Montesinos López, A., & Crossa, J. (2022). Multivariate Statistical Machine Learning Methods for Genomic Prediction (p. 691). Springer Nature, clic aquí.

Curso 2. Modelización y análisis de sistemas naturales, sociales y socioecológicos

Docente: Rodrigo Ramos-Jiliberto, GEMA Center for Genomics, Ecology & Environment, Universidad Mayor, Chile.

Este curso-taller está orientado a promover las habilidades básicas de modelización cualitativa formal y análisis de sistemas naturales, sociales y socioecológicos mediante grafos dirigidos signados. La modalidad de trabajo del curso se basa en presentaciones de conceptos y teoría, conversación y ejercicio práctico realizado por los asistentes. Estructura del Curso-Taller:

i. Introducción al curso y conceptos de base: sistema, modelo, modelización, desafíos en diferentes áreas de trabajo, modelización cualitativa, grafos y redes.

ii. Influencias directas e indirectas en un sistema. (Co-)construcción de un modelo cualitativo usando grafos dirigidos signados.

iii. Análisis de modelos cualitativos: análisis topológico, análisis dinámico, análisis de escenarios de intervención.

iv: Presentación de ejercicios y discusión.

Bibliografía: Ramos-Jiliberto, R. (2020). Deja a la estructura hablar: Modelización y análisis de sistemas naturales, sociales y socioecológicos. Ediciones Universidad Mayor, Chile.

Docentes

Dr. Abelardo Montesinos

El Dr. Abelardo Montesinos es Profesor del Departamento de Matemáticas del Centro Universitario de Ciencias Exactas e Ingenierías,  Universidad de Guadalajara, México y Miembro del Sistema Nacional de Investigadores de dicho país. Obtuvo su grado de licenciatura en Estadística, Universidad Autónoma Chapingo (UACH) en 2008. Luego realizó una  Maestría (2009-2011)y posteriormente el Doctorado (2012-2016) en Probabilidad y Estadística en el Centro de Investigación en Matemáticas (CIMAT), México. Es autor de más de 50 artículos publicados en revistas internacionales arbitradas, y ha escrito 8 capítulos de libro y 2 libros de referencia en la temática. Ha sido invitado a varias conferencias y congresos del área. Tiene líneas de trabajo activas en la formación de estudiantes de grado y posgrado.

Dr. Rodrigo Ramos-Jiliberto

Es Profesor Titular, Centro GEMA – Genómica, Ecología y Medio Ambiente y  Director del Doctorado en Ecología Integrativa de la Universidad Mayor, Chile. Obtuvo su título de Licenciado en Biología, (1992) y luego el de Magister en Ciencias Biológicas con mención en Ecología y Sistemática (1996) en la Facultad de Ciencias Básicas y Matemáticas, Universidad Católica de Valparaíso. Luego obtuvo su doctorado en Ciencias Naturales. Facultad de Biología, Ludwig-Maximilians Universität München, Alemania (1999) Para luego realizar dos posdoctorados: uno en Departamento de Ecología, Facultad de Ciencias Biológicas, Pontificia U. Católica de Chile (2000) y otro en el Instituto de Matemáticas, Universidad Católica de Valparaíso (2003). Ha pertenecido a diversos sistemas de evaluación académica, como Fondos de proyectos, Becas de posgrado, etc. de Chile. Cuenta con más de 80 artículos científicos y 1 libro en su haber. Su trabajo en la formación de recursos humanos es destacable con 18 tesis de pregrado y 14 de posgrado.

Charlas de cierre

Se realizarán charlas de investigadores destacados en temas varios que brinden una perspectiva amplia a los participantes del estado actual del arte en temas de Ciencia de Datos el viernes 28 de octubre. Una de ellas estará a cargo del Dr. Mauricio Velasco (Departamento de Matemáticas, Universidad de los Andes, Bogotá, Colombia) y la otra la guiará Diego Fernández Slézak (Laboratorio de Inteligencia Artificial Aplicada, Instituto de Ciencias de la Computación , UBA-CONICET).

Conferencia 1: Juegos de seguridad verde en grafos y la protección de ecosistemas de Mauricio Velasco

Un recurso esencial para la preservación de la biodiversidad terrestre es el cuidado efectivo de áreas protegidas. Las áreas protegidas en el mundo se encuentran bajo amenaza constante por caza ilegal, deforestación, minería ilegal y tráfico de especies entre otras y están protegidas por un número limitado de guardabosques con recursos contados. El propósito de esta charla es incluir algunas ideas matemáticas que pueden usarse para mejorar la asignación de estos recursos y en particular en el diseño de agendas de patrullaje óptimas (este tipo de modelos se conoce como «Juegos de seguridad verde», Green security games, en la literatura). En la charla introduciremos Juegos de seguridad verde en grafos. Nuestros métodos consisten en una combinación de ideas de aprendizaje por refuerzo (reinforcement learning) y de optimización combinatoria que se necesitan para modelar la realidad de los parques en el trópico (en los que el desplazamiento, tanto para guardaparques como para cazadores ilegales, solo puede realizarse a lo largo de un conjunto de caminos pre-existentes por la dificultad del terreno). Mostraré también una implementación práctica de estas ideas en un programa piloto en una reserva en el Ecuador. Los resultados de esta charla son trabajo conjunto con Nicolás Betancourt en la Universidad de los Andes.

Conferencia 2: ¿Qué tiene que ver el ajedrez con la psicología? Los datos nos responden de Diego Fernández Slézak

La toma de decisiones se ha estudiado con gran detalle basándose en elecciones binarias, modeladas como la acumulación ruidosa de una variable de decisión hasta un umbral. En esta charla vamos a ver cómo usar repositorios públicos de ajedrez para responder preguntas teóricas de psicología experimental. Veremos cómo pequeñas modificaciones a modelos clásicos de toma de decisiones binarias permiten ajustar el proceso de toma de decisiones en escenarios de múltiples opciones, como es el caso del ajedrez. También veremos cómo estudiando estas tomas de decisiones pueden ponerse a prueba teorías de toma de decisiones y sesgos cognitivos.

Mini bio
Doctor en Ciencias de la Computación por la Universidad de Buenos Aires. Durante su doctorado se enfocó en la estimación de parámetros en modelos biológicos complejos,  por el cual ganó el premio PhD Fellowship de IBM. Luego, decidió dedicarse a la investigación en la frontera entre la inteligencia artificial y la neurociencia. Recibió el prestigioso premio Microsoft Faculty Fellow 2014 y el Google Research Award LATAM por sus trabajos en este campo.  Actualmente se desempeña como investigador independiente del Instituto ICC (CONICET) y profesor en la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires. Además, Diego es co-fundador de Entelai, empresa dedicada a la aplicación de IA en el campo de la salud y especialista en procesamiento de lenguaje natural, con particular aplicación a la caracterización de estados mentales.

¡A ponerse en acción! ¡Les esperamos!

Equipo del CICADA

Para postularse a la Primera escuela CICADA completar el

Cierre de postulaciones: 15 de setiembre de 2022.

*La participación a la escuela será confirmada por correo electrónico por el equipo del CICADA. 

Por consultas: cicada@ei.udelar.edu.uy