Los objetivos generales del curso consisten en presentar los conceptos fundamentales de la predicción de características complejas a partir de datos genómicos, y conocer algunos de los métodos matemáticos clásicos y de aprendizaje profundo que se utilizan en esta tarea.
Más específicamente, se busca:
- Presentar los conceptos fundamentales de la predicción de características complejas a partir de datos genómicos, y conocer algunos de los métodos matemáticos clásicos y de aprendizaje profundo que se utilizan en esta tarea.
- Comprender las bases de la predicción genómica y poder aplicar diferentes modelos matemáticos para realizarla.
- Entender las fortalezas y debilidades de los modelos matemáticos presentados en el curso.
- Ante un nuevo dato, poder aplicar los modelos aprendidos y decidir cuál es el mejor para el conjunto de datos que se esté utilizando.
Metodología de enseñanza
Se trabajará en modalidad teórico-práctica. Se presentarán cada uno de los temas y luego se aplicarán los métodos en juegos de datos genómicos reales. Los datos se analizarán en R en la primera semana y en Python la segunda semana, por lo que se incluirá una clase de introducción a Python.
Aprobación y créditos
La aprobación del curso se obtiene mediante la realización de trabajos prácticos y con la realización de un trabajo final.
Temario
- Introducción a la predicción genómica
- Construcción de modelos estadísticos supervisados: regresión lineal múltiple, regresión lineal penalizada, modelos lineales mixtos, regresión lineal bayesiana en el caso genómico
- Aplicación de modelos de aprendizaje automático en genómica: uso de núcleos para clasificación y regresión (RKHS), máquinas de vectores de soporte (SVM y SVR),
- Introducción al uso de Python, nociones básicas de aprendizaje profundo
- Redes neuronales: el perceptrón, el perceptrón multicapa y las redes neuronales, el Algoritmo de Backpropagation.
- Redes Neuronales Convolucionales (CNN)
- Redes Neuronales sobre Grafos (GNN)
- Transformers
Personal docente
- Dr. Pablo González Barrios (Facultad de Agronomía, Udelar)
- Dra. María Inés Fariello (Facultad de Ingeniería, Udelar)
- Dr. Federico Lecumberry (Facultad de Ingeniería, Udelar)
- Graciana Castro (Facultad de Ingeniería, Udelar)
- Dr. José Crossa (CIMMYT, México)
- Dr. Osval Montessinos (Facultad de Telemática, Universidad de Colima, México)
- Colabora Dr. Daniel Gianola (Universidad de Wisconsin-Madison)
Fecha y duración del curso: inicia el lunes 26 de febrero de 2024 y se extiende por 2 semanas, hasta el viernes 8 de marzo de forma presencial.
Horario
- Lunes a viernes de 9 a 13 h.
Lugar
- Salón 101 de la Facultad de Ingeniería, Julio Herrera y Reissig 565 (Parque Rodó)
- Modalidad presencial y requiere que los estudiantes puedan llevarse su computadora
Inscripciones
Los interesados deben inscribirse en el siguiente formulario
Además, las inscripciones deben realizarse a través de Bedelía de Facultad de Agronomía dentro del marco de la Maestría de Ciencias Agrarias así como también como curso de Educación Permanente
Ante consultas dirigirse a fariello@fing.edu.uy
Bibliografía:
- Multivariate Statistical Machine Learning Methods for Genomic Prediction, 1era edición 2022. Montesinos, Montesinos, Crossa