En el campo del reconocimiento automático, las redes neuronales convolucionales profundas han producido una reciente revolución al permitir encontrar patrones significativos en enormes bases de datos sin la necesidad de definir manualmente las características discriminativas de interés. Una de las limitaciones de estos modelos es que requieren que la información de entrada presente una estructura regular (como el caso de imágenes 2D). Existen múltiples dominios donde las estructuras regulares simples no alcanzan a capturar la naturaleza de los datos, y por lo tanto, el uso de modelos más complejos resulta imprescindible. Este proyecto se enfoca en el desarrollo de nuevas metodologías basadas en redes convolucionales en grafos para dar solución a tres grandes desafíos que enfrenta hoy el aprendizaje automático sobre este tipo de formaciones: cómo darle interpretabilidad a los resultados y modelos aprendidos, cómo integrar información con estructura irregular y de origen multimodal, y cómo tratar adecuadamente con bases de datos multisitio. Dichos desarrollos serán aplicados a una serie de problemas en diversos campos del análisis de imágenes que incluyen: procesamiento de neuroimágenes, procesamiento de imágenes de raíces de plantas y el reconocimiento de emociones a partir de imágenes faciales.
In the field of automatic recognition, deep convolutional neural networks have produced a recent revolution enabling significant patterns to be found in large databases without the need to manually define the discriminative characteristics of interest. One of the limitations of these models is that they require that the input information present a regular structure (as in the case of 2D images). There are multiple domains where simple regular structures fail to capture the nature of the data, and therefore the use of more complex models is essential. This project focuses on the development of new methodologies based on graph convolutional networks to solve three great challenges that machine learning faces today in this type of architectures: how to interpret the results and models learned, how to integrate information with irregular and multimodal structure in origin, and how to properly deal with multisite databases. Such models will be applied to a number of problems in diverse fields of image analysis including neuroimaging, plant root image processing, and emotion recognition from facial images.