Lingüística y Tecnologías (conjunto con la UPM)

Máster. Curso 2025/2026.

APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL - 610724

Curso Académico 2025-26

Datos Generales

SINOPSIS

COMPETENCIAS

Específicas
CE8. Conocer los modelos y métodos más relevantes (simbólicos, estadísticos y
biológicos) para el procesamiento automático de las lenguas y los fenómenos
lingüísticos en sus diferentes niveles lingüísticos: fonético-fonológico, morfológico,
sintáctico, semántico, pragmático y de discurso.
CE9. Saber describir las características del lenguaje humano que hacen difícil su
tratamiento automático.
CE10. Saber utilizar con suficiente destreza los principales paquetes de programación para resolver tareas de procesamiento del lenguaje natural en formato
texto y voz.
CE11. Conocer el manejo de las herramientas software existentes para el procesamiento de las producciones lingüísticas en diferentes lenguas (ej.
segmentadores, analizadores morfológicos, sintácticos, semánticos).

CE12. Conocer los fundamentos teóricos y de implementación de las aplicaciones existentes de Lingüística Computacional (ej. traducción automática, agentes conversacionales, recuperación de información, extracción de entidades nombradas o generación de resúmenes).

ACTIVIDADES DOCENTES

Clases teóricas
El curso se impartirá en el Campus Virtual de la UCM. Se organizará en semanas.
Cada semana se hará una propuesta temática de trabajo y se trabajará en tres
partes:
1era. parte: presentación de la propuesta temática para que sirva de guía y punto
de partida para la reflexión individual sobre su aplicación en cada asignatura
concreta. Se realizará el lunes por parte de los profesores.
Clases prácticas
2ª parte: estudio y actividades de consolidación, se realizarán a lo largo de la
semana por parte de los alumnos y con la guía de los profesores.
3ª parte: resolución de casos prácticos, se realizarán a lo largo de la semana por
parte de los alumnos.
El alumno debe calcular una dedicación aproximada de12 horas semanales a la
asignatura.
TOTAL
El curso se dividirá en 2 partes. Cada parte concluirá con la realización de un proyecto final que consistirá en la realización de una aplicación real que utilice los conocimientos adquiridos en el máster. Esta actividad será, también, evaluable.

Las tareas a realizar cada semana son:
1.- Presentación de los objetivos y contenidos del módulo. Guía para su estudio
(lunes)
2.- Estudio, por parte del alumno, de los contenidos básicos. Incluirán lecturas (en
modo texto, audio y/o vídeo) y casos prácticos resueltos.
3.- Realización de un caso práctico no resuelto evaluable.
4.- Ampliación opcional de conocimientos con el material complementario
5.- Reflexión entre iguales: uso del foro para preguntar y aclarar cuestiones de los
contenidos básicos.

No presenciales

6

Breve descriptor:

Esta asignatura tiene como objetivo que el alumno ponga en práctica los conocimientos adquiridos en el máster mediante el estudio de aplicaciones reales de la Lingüística computacional y la realización de un proyecto (o caso de estudio) real relacionados con la Lingüística computacional. 

Las aplicaciones incluyen una variedad de aplicaciones que se van actualizando. Entre estas aplicaciones la extracción de información, clasificación de textos, reconocimiento de entidades nombradas, análisis de opinión y sentimiento, sistemas de diálogo y agentes conversacionales y sistemas de generación de texto. Además, el alumno debe ser capaz de explicar en qué medida la Lingüística computacional ayuda a la inclusión y mejora de la vida de las personas, así como al progreso científico y tecnológico de la humanidad. 

La asignatura se orientará para la participación del alumno en una tarea competitiva del workshop iberlef.

Requisitos

- Conocimiento de Python y de redes neuronales
- Capacidad de leer en inglés
- Capacidad de autoaprendizaje y planificación
- Capacidad crítica: no dar nada por supuesto
- Capacidad de aprender del error

Objetivos

El objetivo básico de esta asignatura es que el alumno ponga en práctica los conocimientos adquiridos en el máster mediante el estudio de aplicaciones reales de la Lingüística computacional y la realización de un proyecto (o caso de estudio) real relacionados con la Lingüística computacional. 

El objetivo se desgrana en los siguientes objetivos específicos: 

  1. Saber definir y explicar en profundidad el funcionamiento de alguna de las principales aplicaciones de la Lingüística computacional. 
  2. Saber valorar de forma crítica las posibilidades y limitaciones de una aplicación de la Lingüística computacional 
  3. Saber describir el papel del lingüista en el desarrollo de las aplicaciones de la Lingüística computacional 
  4. Saber explicar cómo pueden contribuir las aplicaciones de la Lingüística computacional para mejorar la vida de las personas y para facilitar el progreso científico y tecnológico en beneficio de la humanidad
  5. Saber desarrollar una aplicación para participar en una tarea competitiva del workshop iberlef.

Contenido

La asignatura tiene como objetivo formar al estudiante para realizar un proyecto real con las teconlogías de la actualidad.

Se estructura en una introducción y 2 partes:

Introducción

  • El ecosistema actual de Lingüística Computacional en el panorama nacional, europeo e internacional
  • El perfil del lingüistca computaciona: ¿En qué puede trabajar? ¿Dónde? ¿Con qué equipos? ¿Qué tareas puede realizar?

Parte 1. Grandes modelos del lenguaje

  • Tipos de grandes modelos del lenguaje según su arquitectura
  • Criterios para seleccionar un gran modelo del lenguaje para una tarea de Lingüística Computacional
  • Acceso a grandes conjuntos de datos en repositorios de referencia
  • Técnicas y tipos de muestreo de datos
  • Acceso a grandes modelos del lenguaje en repositorios de referencia
  • Tipos de ajuste de grandes modelos del lenguaje
  • Ajuste fino de grandes modelos del lenguaje

Proyecto - Parte 1. Ajuste fino de un modelo encoder-only para una tarea de procesamiento de textos

Parte 2. Participación en una tarea competitiva del workshop iberlef.

  • Workshop iberlef. Tareas competitivas. Elección de tarea o tareas.
  • Análisis de la tarea elegida. Datos asociados.
  • Enfoques básicos para la resolución de la tarea.
  • Enfoques basados en modelos encoder
  • Enfoques basados en modelos decoder
  • Aplicación de mejores enfoques a conjunto de test y envío de soluciones.
  • Análisis de errores
  • Escritura de artículo para la participación en el workshop

Proyecto – Parte 2. Participación en tarea del workshop iberlef


Evaluación

La asignatura se evalúa a partir de las actividades siguientes:
- Actividades evaluables de la semana: 50% de la nota final
- Proyectos: 50% nota final

Bibliografía

JURAFSKY, D.; MARTIN J.H. Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. (borrador del 24 de agosto de 2025 de la 3ª edición en: https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf)
El capítulo 7: Large Language Models
El capítulo 8: Transformers
Xin Zhao et al. (2025). A Survey of Large Language Models. Disponible en arXiv (Version: v16)

Bibliografía y fuentes adicionales
Libro:

Alammar, J. & Grootendorst, M. (2024). Hands-On Large Language Models. O’Reilly

Otra información relevante

Mecanismos de tutorización virtual:
- Foro, correo electrónico en la asignatura virtual y videoconferencia al menos
una vez en semana
Mecanismos de contacto
-Foro de la asignatura virtual que podrá complementarse cuando sea necesario con
sesiones de videoconferencia. Lo atenderán los profesores de la asignatura.
-Correo electrónico institucional de los profesores en caso de que no tenga acceso
al campus virtual
-Además el alumno dispone de un servicio de ayuda para las incidencias informáticas
de la Universidad en https://ssii.ucm.es/estudiante

Mecanismos de contacto para quejas y sugerencias de la asignatura
- El alumno debe presentar su queja, en primer lugar, al profesor, y hacerle cuantas sugerencias considere oportunas sobre la asignatura, tanto por vía de correo
electrónico como por un buzón anónimo de “quejas y sugerencias” en la página de Presentación de la asignatura virtual.
- El alumno se podrá dirigir también al Coordinador del Máster, así como al representante de alumnos en caso de que su queja o sugerencia no sea atendida.
- Además, el máster dispone de un buzón de quejas y sugerencias en su página web atendido por el Coordinador del máster

Mecanismos para recoger la opinión de los alumnos sobre la asignatura:
Participación en el programa Docentia de la UCM complementado con una encuesta anónima preparada por los profesores en la asignatura virtual

Requisitos técnicos especiales (no de Campus Virtual):
Ordenador con conexión a internet

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo T02/02/2026 - 08/05/2026JUEVES 15:00 - 17:00AULA VIRTUAL 3ALBERTO DIAZ ESTEBAN
DOAA SAMY KHALIL SHAWER