Ciencia de Datos e Inteligencia de Negocios

Máster. Curso 2024/2025.

PREPARACIÓN DE DATOS Y MODELOS PREDICTIVOS - 610505

Curso Académico 2024-25

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
RA1 - Conocer los métodos de depuración y codificación de variables y tratamiento de datos ausentes en datos estadísticos
RA3 - Conocer la base teórica de los modelos lineales de predicción
RA13 – Reunir, depurar y transformar los datos que la empresa almacena, en información estructurada y coherente para contrastar hipótesis que traten de responder a preguntas de investigación dentro del ámbito de la Inteligencia de Negocios
RA15 - Dominar herramientas estadísticas básicas y el software estadístico especializado y avanzado para la aplicación de las técnicas de Ciencia de datos
RA16 - Aplicar de forma efectiva en el ámbito de la Inteligencia empresarial, las distintas técnicas de Ciencia de datos necesarias, discriminando entre todas ellas y buscando la solución óptima
RA17 - Modelizar problemas de clasificación y predicción dentro del ámbito de la estrategia empresarial
RA19 - Elaborar un programa básico en lenguaje de programación en un contexto de modelización predictiva
RA20 - Tomar las decisiones apropiadas en la utilización de algoritmos predictivos en un problema real
RA21 - Aplicar diferentes modelos de segmentación, agrupación de observaciones y reducción de variables
RA23 - Desarrollar el espíritu innovador en un ámbito interdisciplinario, fomentando la búsqueda de soluciones creativas a diversos tipos de problemas
RA25 - Investigar en nuevas metodologías y técnicas para la gestión y explotación de grandes bases de datos con las que crear conocimiento que apoye la toma de decisiones en la dirección estratégica y en la inteligencia empresarial
RA26 - Comunicar las conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades
RA27 - Establecer las fases y estructura de una investigación relacionada con la Ciencia de Datos partiendo de un problema concreto

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%

Presenciales

1,92

No presenciales

4,08

Semestre

1

Breve descriptor:

Esta asignatura se contempla como una introducción al análisis de datos integrado utilizando software estadístico (Miner SAS y R). Se describen técnicas estadísticas habituales con el objetivo de que se conozca el entorno informático.


Se hace especial hincapié en la presentación y resolución de problemas prácticos a los que se les va aplicando diferentes técnicas, entendiéndolas como un procedimiento sistemático de trabajo. El método de trabajo consistirá en utilizar dos grandes bases de datos y trabajar con ellas de forma integrada. 


Las técnicas a las que se dará prioridad en esta asignatura son los métodos de exploración y depuración de datos, la creación de modelos predictivos como la regresión lineal, la regresión logística y los árboles de regresión y clasificación.

Objetivos

  1. Obtener las habilidades básicas-medias de lenguajes de programación orientados al manejo y análisis de datos.

  2. Saber cargar, manipular y depurar conjuntos de datos de manera eficiente y óptima.

  3. Comprender, aplicar y desarrollo de modelos predictivos, tales como regresión lineal, regresión logística y árboles.

Contenido

  1. Metodologías de Minería de Datos y Machine Learning.

  2. Técnicas de exploración, visualización y depuración de datos.

  3. Introducción a los modelos predictivos.

  4. Regresión lineal

  5. Regresión logística.

  6. Árboles de clasificación y regresión.

Evaluación

El alumno será evaluado de manera continua a lo largo del curso. Esta evaluación consistirá en la entrega de dos trabajos individuales. Dichos trabajos tendrán un peso del 50% cada uno de ellos en la nota de evaluación continua. Sera necesario obtener un mínimo de 4 puntos en cada uno de los trabajos.
Para aquello alumnos que renuncien a la evaluación continua o que no alcancen los objetivos mínimos se les evaluará a través de un examen que constituirá el 100% de la nota.
Cualquier alumno tendrá derecho a una prueba final pudiendo resultar su calificación la nota final del curso

Bibliografía

-Hastie, Trevor; Tibshirani, Robert y Friedman, Jerome (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
- Kuhn, Max y Johnson, Kjell (2016). Applied Predictive Modelling. Springer. - Gareth, James et. al (2015). An introduction to statistical learning : with applications in R. Springer.
Brett Lantz (2019).Machine learning with R
- Swirl stats: aprendizaje básico de R dentro del propio R. Disponible gratuitamente en https://swirlstats.com/ - Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https: //jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM. - Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
- Santin González, Daniel y Pérez, López, César (2007). Minería de datos, técnicas y herramientas. Tomson.
- Cerrito B. Patricia (2006). Introduction to Data Mining Using SAS Enterprise Miner. SAS Institute.

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo A09/09/2024 - 10/01/2025VIERNES 18:00 - 19:30-DANIEL MARTIN GARCIA
Grupo B09/09/2024 - 10/01/2025MIÉRCOLES 18:00 - 19:30-JUAN ANTONIO GUEVARA GIL


Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo A09/09/2024 - 10/01/2025VIERNES 19:30 - 21:00-DANIEL MARTIN GARCIA
Grupo B09/09/2024 - 10/01/2025MIÉRCOLES 19:30 - 21:00-JUAN ANTONIO GUEVARA GIL