Jornada de investigación de Doctorandos Julio 2022

Fecha: 18 de julio de 2022

Organización de las Jornadas

  • La jornada estará organizada en dos sesiones, la primera a las 15:00 y la segunda a las 16:30
  • Cada ponente dispondrá de 10 minutos para realizar su presentación más 5 minutos para responder a preguntas.
  • La sesión se realizará de forma telemática por Google Meet en un enlace enviado por correo electrónico a ponentes e interesados potenciales.

Presentaciones

Sesión 1: 15:00 - 16:15

Ponente Ponencia Resumen
Raul Murillo Montero El Sistema Numérico Posit y sus Aplicaciones en Redes Neuronales
Profundas.
La representación posit para los números reales es una alternativa al omnipresente estándar de punto flotante IEEE 754. Este formato fue propuesto en el año 2017, y desde entonces numerosos trabajos han demostrado que este novedoso formato posee ciertos beneficios sobre el actual formato de punto flotante. Esto hace que la representación de números en formato posit sea de gran interés para tareas de dominio específico, como el análisis numérico o el aprendizaje profundo (deep learning). No obstante, debido a su corto tiempo de vida, aún no existe soporte comercial hardware ni de compilación que sea capaz de soportar el formato posit, y las escasas herramientas software existentes no son suficientes para determinar todas las ventajas de este formato sobre el estándar IEEE 754.  Este trabajo busca, por un lado, estudiar las características y propiedades del formato posit, y evaluar si es una alternativa al actual formato de punto flotante para aplicaciones del ámbito científico y, en especial, en el campo del deep learning, y por otro, proponer diseños de unidades en formato posit, manteniendo el foco en la eficiencia, dotando a este formato de cierto soporte hardware.
Youssef El Faqir El Rhazoui Evaluación de rendimiento y portabilidad de SYCL en computación heterogénea con aceleradores

Debido a la creciente demanda de procesamiento paralelo de datos, han aparecido diferentes aceleradores (GPUs o FPGAs) para suplir dicha tarea. Sin embargo, muchos son los paradigmas y lenguajes presentes en el mercado para programar estos componentes, muchas veces dependientes del fabricante (CUDA) u incompatibles con otro tipo de dispositivo. SYCL se presenta como una alternativa a mantener diferentes códigos para diferentes aceleradores. Su filosofía radica en programar una vez y ejecutar el código en los aceleradores que queramos. Esta presentación se centrará en presentar SYCL, y comparar sus prestaciones con otras alternativas como CUDA u OpenMP.

Clara Rodríguez Núñez Análisis de contratos inteligentes. Los reentrancy attacks representan una de las principales amenazas a las que se encuentran expuestos los smart contracts. Este tipo de ataques se popularizó a raíz del ataque DAO, que permitió robar cerca de 80 USD. Los reentrancy attacks explotan el uso de callbacks para generar comportamientos inesperados en el contrato, rompiendo la modularidad del mismo. Analizar contratos de manera estática con respecto a este tipo de ataques es complejo, ya que se deben tener en cuenta todas las posibles ejecuciones del contrato, pudiendo tener estas numerosos callbacks entrelazados. En esta parte de mi tesis propongo un método estático que permite demostrar la modularidad de un contrato en un entorno que permite callbacks. Este análisis se basa en el uso de operaciones de conmutación y proyección de segmentos de código, con el objetivo de generar para cada posible ejecución del contrato una ejecución equivalente que no contiene callbacks. El estudio de la conmutación y proyección de segmentos de código se realiza de manera estática a través de SMT solvers. También propongo una generalización de este enfoque menos restrictiva, que permite que los callbacks rompan la modularidad del contrato siempre y cuando los nuevos comportamientos que introduzcan sean inofensivos.
Tommaso Marinelli Pattern analysis and data mapping in hybrid cache-SPM architectures. Every modern processor includes a hierarchy of integrated memories, to create local copies of the content of the main memory and reduce the data access cost. In particular, multiple levels of cache are present, which are transparent to the user and exploit temporal and spatial locality principles to keep their hit ratio high. Despite being effective in many cases, not all applications make a fair use of the caches, and some improvement could be achieved with a modified memory hierarchy. Specifically, adding one or more scratchpad memories (SPMs), which have a simpler design since they are software-controlled, can help reducing the overall energy consumption of the system where caches fail to shine.
In this presentation, a methodology to profile the memory accesses of applications will be introduced, which allows to detect patterns that can benefit from using an SPM instead of the cache. Different common access patterns will be analyzed, defining some metrics that can be used to establish a data placement policy in the hybrid memory subsystem. A proposal of modified architecture to exploit this methodology will also be presented, together with some preliminary simulation results focused on energy consumption.
Alejandro Hernández Cerezo An EVM superoptimizer to handle memory and storage In recent years, many projects have emerged based on the application of formal methods to Blockchain, more specifically, in the area of Smart Contracts. Indeed, smart contracts are very suitable for this approach:

(1) they are immutable, so they cannot be modified once they are deployed

(2) the associated code is relatively small, making it feasible to apply these methods effectively

(3) there are smart contracts that manage billions of dollars, so ensuring correctness is vital
to avoid major losses

My thesis work consists in the application of superoptimization techniques to smart contracts
on the Ethereum blockchain. These techniques are used to obtain
code equivalent to the starting code and optimized with respect to different criteria.
These systems have a monetary cost associated with the deployment of code on the blockchain and the execution of transactions, so the optimization of smart contract code has a relevant impact
for any user. These techniques are also crucial for compiler developers to further enhance the
optimization algorithms present in these tools.

In this presentation, I will introduce the general framework, with a special emphasis on the advances made during this year: the extension to memory instructions and storage instructions.

Sesión 2: 16:30 - 18:00

Ponente Ponencia Resumen
Alma Gloria Barrera Yañez Aplicación de juegos serios e innovadores en la escuela para promover la igualdad en educación.

Resumen de la presentación: Gracias a los avances tecnológicos actuales, los videojuegos serios han demostrado ser herramientas eficaces para complementar la educación formal o escolarizada, siempre que cuenten con bases sólidas y una investigación previa que justifique su creación y aplicación. Por otro lado, en muchos lugares del mundo, y especialmente en Latinoamérica las actitudes sexistas y los estereotipos de género provocan situaciones de violencia y desigualdad, especialmente contra las mujeres. Para abordar estos problemas desde sus etapas más tempranas, se está trabajando en un videojuego serio de toma de decisiones, orientado a niñas y niños en edad escolar (8 a 12 años). El juego “Kiddo” funcionará como una herramienta de apoyo dentro del aula de clases y permitirá abrir la discusión acerca de las problemáticas y estereotipos sexistas. Kiddo permite recopilar trazas (game analytics) de las interacciones de los usuarios con el juego, para posteriormente medir las actitudes sexistas que pudieran o no tener los jugadores antes y después de la aplicación de Kiddo.

 

La detección y clasificación de conductas sexistas se basa en la escala EVAMVE, adaptada para niños. Contamos además con cuestionarios de usabilidad, aceptación de personajes, aceptación de historia y cuestionarios pre y post aplicación. A este respecto, las pruebas piloto y la validación del juego se están llevando a cabo con psicólogos, humanistas, profesores y alumnos, para llegar a la versión final del juego, misma que será aplicada en centros educativos públicos y privados, principalmente en México.
Juan Manuel Carrera García Sistema Experto para Búsqueda de Plazas Libres en un Aparcamiento mediante Aprendizaje Automático y Visión Artificial

Encontrar una plaza de aparcamiento libre hoy en día es un problema recurrente en los aparcamientos públicos cada vez más concurridos. Con esta premisa, nuestro sistema busca ofrecer una solución basada en el análisis de imágenes cenitales que, mediante visión artificial y aprendizaje automático, sea capaz de analizar de forma automática tanto las plazas disponibles en un parking como su ocupación en tiempo real. 

 

Para ello, en una primera fase, el sistema detecta semiautomáticamente las plazas de aparcamiento mediante visión por computador para generar un mapa computacional del mismo. Una vez mapeado el tamaño y ubicación de las plazas de aparcamiento, el sistema es capaz de detectar no solo la presencia de un vehículo en una plaza de aparcamiento, sino también la superficie de la plaza de aparcamiento ocupada por el mismo utilizando Redes Neuronales Convolucionales basadas en Regiones (R-CNN). Gracias a ello, el sistema es capaz de determinar el espacio de estacionamiento apropiado para un nuevo vehículo que ingresa al estacionamiento en función de sus dimensiones específicas y la ocupación del espacio.

 

En esta presentación se mostrará el trabajo realizado junto a los resultados y conclusiones obtenidas.

Iván José Pérez Colado Integración de herramientas de desarrollo de videojuegos con plataformas de learning analytics para facilitar la docencia con juegos serios Los juegos serios son herramientas que pueden utilizarse para múltiples propósitos que van más allá del mero entretenimiento, y su uso se ha extendido en sectores como el militar, la educación o la publicidad. Como herramientas educativas, son especialmente interesantes dado que proporcionan una serie de beneficios con los que mejorar la calidad del aprendizaje. Sin embargo, a la hora de utilizarse en entornos reales los docentes suelen encontrarse con que, por un lado, estos juegos suelen carecer de validación formal o evidencias que sustenten su uso de cara a un currículum docente y que, por otro lado, la realización de actividades con juegos puede ser un proceso complejo debido a su mala integración con herramientas educativas. En la presente tesis tenemos como objetivo simplificar este proceso de validación, mejorando la extracción de evidencias y la integración de los juegos y plataformas para la realización de actividades. Estos objetivos han culminado en el desarrollo de SIMVA, una plataforma para realizar validación de juegos y actividades con usuarios que cumple con las regulaciones europeas de protección de datos y permite realizar data-science sobre analíticas de aprendizaje para mejorar las evidencias que proveen los juegos.
Alberto Gutiérrez Gallego Ensemble Random Miss Sampling: a new approach for imbalanced dataset classification

El sesgo de los datos es uno de los factores más críticos en los problemas de aprendizaje automático, ya que puede provocar confusión en los modelos e influir en su precisión. Una de las fuentes de sesgo en los conjuntos de datos del mundo real es la distribución desequilibrada de las clases, es decir, una clase mayoritaria con un gran porcentaje de muestras y una clase minoritaria, la que debe identificarse en el problema de clasificación, con un pequeño número de muestras. En esta presentación, desarrollamos un nuevo algoritmo de clasificación para conjuntos de datos desequilibrados cuyo objetivo es maximizar la precisión de la clase minoritaria sin penalizar la clasificación de la clase mayoritaria. Nuestro algoritmo comprende una nueva técnica de muestreo híbrido que combina técnicas de submuestreo y sobremuestreo para tratar datos desequilibrados y un conjunto de clasificadores entrenados con diferentes subconjuntos del conjunto de datos de entrenamiento. Comparamos el rendimiento de los modelos proporcionados por nuestra técnica frente al rendimiento de 100 combinaciones de diez técnicas diferentes de sobremuestreo y submuestreo con diez algoritmos diferentes de aprendizaje automático, utilizando un conjunto de datos reales de seguros de automóviles proporcionado por una compañía de seguros española. Cada combinación se ha evaluado con una validación cruzada de 40 veces. El análisis estadístico de los resultados muestra que nuestra propuesta tiene significativamente el mejor rendimiento de clasificación en términos de recall de ambas clases, independientemente del clasificador de aprendizaje automático utilizado en el modelo de conjunto.

Daniel Parra Rodríguez Obtención de ecuaciones en diferencias para la glucosa. Predicción por medio de la gramáticas evolutivas estructuradas e identificación dispersa En la actualidad, la diabetes es considerada una de las enfermedades más comunes y difíciles de tratar. Las personas que sufren esta condición deben mantener sus niveles de glucosa entre unos valores seguros para evitar complicaciones. Con el fin de regular sus niveles de glucosa, algunos pacientes deben inyectarse insulina, pero el cálculo de la dosis necesaria no es una tarea trivial. Con el fin de ayudar a estas personas, el objetivo de este trabajo es obtener expresiones que predigan los niveles de glucosa utilizando variables como: los valores previos de glucosa, la ingesta de comida (en carbohidratos), la insulina basal y las dosis de bolo de insulina, entre otras. Mediante la combinación de las gramáticas evolutivas estructuradas y la identificación dispersa, se busca obtener ecuaciones en diferencias que se ajusten a la evolución de la glucosa en el tiempo. Dicha predicción de glucosa servirá como herramienta para decidir la dosis de insulina más adecuada. Los resultados obtenidos son prometedores, permitiendo obtener expresiones interpretables.
Humberto Parejas Llanovarced A case-based approach for the selection of explanation algorithms in image classification La investigación sobre IA explicable (XAI) propone continuamente enfoques novedosos para la explicación de los modelos de clasificación de imágenes, donde podemos encontrar estrategias tanto dependientes como independientes del modelo. Sin embargo, no está claro cómo elegir el mejor enfoque de explicación para una imagen dada, ya que estos nuevos enfoques XAI son radicalmente diferentes. En este artículo, proponemos una solución CBR al problema de elegir la mejor alternativa para la explicación de un clasificador de imágenes. La base de casos refleja la percepción humana de la calidad de las explicaciones generadas con diferentes métodos de explicación de imágenes. Luego, esta experiencia se reutiliza para seleccionar el mejor enfoque de explicación para una imagen determinada.