template-browser-not-supported

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación*

Atrás Atrás

Introducción a la Minería de Datos

Código asignatura
MMIMECOM-1-005
Curso
Primero
Temporalidad
Segundo Semestre
Carácter
Optativa
Créditos
6
Pertenece al itinerario Bilingüe
No
Guía docente

DESCRIPCIÓN Y CONTEXTUALIZACIÓN DE LA ASIGNATURA

En la actualidad el progreso del conocimiento y el desarrollo de la tecnología se soportan en gran medida en la explotación de grandes cantidades de datos empíricos recogidos de todo tipo de mediciones. Las bases de datos  facilitan el almacenamiento, actualización, ordenación y búsqueda de esos datos. La minería de datos, combina los recursos de la estadística y la computación para descubrir patrones  de comportamiento en los datos, que generen nueva información relevante y que se pueda estructurar para su uso posterior.  El proceso conlleva diferentes fases, tales como la selección y preprocesamiento de las variables, la aplicación de las técnicas  relevantes,  la validación y selección del mejor modelo  y su interpretación.

No los hay.

COMPETENCIAS DE LA ASIGNATURA

Competencias específicas de la asignatura:

10014-Conoce en qué consiste la minería de datos, los diversos tipos de problemas que resuelve y las diferentes técnicas que se utilizan.

10015-Sabe analizar un conjunto grande de datos con dos o más de las técnicas presentadas durante el curso. 10016-Sabe evaluar la capacidad predictiva de un modelo.

10017-Sabe elegir entre distintos modelos el que mejor se adapta al problema que se desea resolver.

10018-Sabe utilizar un software de minería de datos.

Competencias básicas y generales: CB6, CB7, CB10, CG1857

Competencias transversales: CT1861, CT1872

Competencias específicas de la titulación: CE1865, CE1860, CE1841, CE1859

RESULTADOS DE APRENDIZAJE DE LA ASIGNATURA

-  Entender las etapas que conlleva un proyecto de minería de datos.

- Ser capaz de asociar las principales técnicas con los distintos tipos de aprendizaje supervisado,  no supervisado y  de reglas de asociación.

-  Saber aplicar algunos de los algoritmos básicos de  reglas de asociación y medir la relevancia de las asociaciones  halladas

-  Conocer y aplicar modelos predictivos en problemas de aprendizaje supervisado

-  Saber entrenar modelos para que eviten el sobreajuste

- Comparar modelos y tener criterios para elegir razonadamente entre varios

- Comprender  los métodos de clasificación por consenso y saber aplicar  las principales técnicas disponibles.

CONTENIDOS TEORICO-PRACTICOS

- Introducción a la minería de datos.

- Aprendizaje Supervisado:

            Modelos Predictivos: Lineal  y regularizado.  Modelos No Paraméticos.

            Modelos de clasificación: Análisis Discriminante, Regresión Logística, k vecinos próximos, Máquinas de Vector Soporte  y Modelo Naïve-Bayes.

            Árboles de  Regresión y de Clasificación.

            Introducción a métodos de clasificación por consenso (Bagging, Random Forest y Boosting)

            Introducción a los Modelos gráficos probabilísticos: Redes bayesianas.

- Análisis de Conjuntos de Items Frecuentes (Análisis de reglas de asociación)

-  Elementos básicos de Minería de Textos

Metodología

El contenido teórico se expondrá en clases magistrales siguiendo referencias básicas que figuran en la Bibliografía y el material facilitado por el profesor. Estas clases magistrales se complementarán con clases de  prácticas en aula informática;  en las que se enseñará el uso de software libre  (fundamentalmente R y Weka) que permita la aplicación de las técnicas desarrolladas en las clases magistrales .

Durante el periodo docente se propondrán y recogerá un trabajo corto de carácter individual sobre  algunos de los tópicos no pertenecientes al tema de aprendizaje supervisado.

También se propondrán pequeños ejercicios o desarrollos teóricos de carácter  voluntario, pero obligatorios para el alumnado que haya solicitado evaluación diferenciada.

Sistemas de evaluación

Se consideran los siguientes tipos de evaluación:

  • SISTEMA DE EVALUACIÓN CONTINUA
  • SISTEMA DE EVALUACIÓN FINAL

Herramientas y porcentajes de calificación

SISTEMA DE EVALUACIÓN CONTINUA: trabajos individuales y por parejas 100%

SISTEMA DE EVALUACIÓN FINAL: ejercicios y trabajos individuales 100%

CONVOCATORIA ORDINARIA: ORIENTACIONES Y RENUNCIA

CRITERIOS DE LA EVALUACIÓN CONTINUA:
Realización de una tarea individual consistente en la aplicación de técnicas de aprendizaje de reglas de asociación o similar sobre un conjunto de datos: 20%

Una segunda tarea individual o por parejas donde se resuelve un problema de aprendizaje supervisado aplicando diversas técnicas y seleccionando  el modelo más adecuado.  Se debe entregar un informe que describa todo el proceso de trabajo y el código utilizado: 80%

Para aprobar la asignatura será necesario entregar ambas tareas  y alcanzar una nota de 5 sobre 10 en la calificación conjunta de ambas tareas.

CRITERIOS DE LA EVALUACIÓN FINAL:
Los estudiantes que lo soliciten, podrán someterse a una evaluación final, que podrá consistir en una prueba única, o en un conjunto de pruebas y trabajos.
Se podrá establecer de manera excepcional la asistencia a determinadas sesiones presenciales, y la superación, en su caso, de las pruebas que en ellas se establezcan.
Los estudiantes deberán solicitar la evaluación diferenciada mediante escrito razonado dirigido al Coordinador del Máster, desde el momento de la matrícula hasta transcurridos, como máximo, cinco días desde el inicio del curso. La solicitud se acompañará de todos los documentos que acrediten la imposibilidad de seguir con normalidad el desarrollo del curso. La Comisión Académica del Máster, resolverá en el plazo máximo de veinte días.

RENUNCIA:
El alumnado que haya realizado sólo parte de las tareas asignadas a lo largo del curso, será calificado como No presentado/a.

CONVOCATORIA EXTRAORDINARIA: ORIENTACIONES

Los criterios de evaluación serán los mismos que en la convocatoria ordinaria. La evaluación de las actividades realizadas a lo largo del curso (tarea durante el periodo de clase magistral y la tarea de resolución de un caso) serán válida para las dos convocatorias del curso. En consecuencia, el alumnado que haya superado estas actividades a lo largo del curso, en la convocatoria extraordinaria solo tendrá que entregar aquella tarea que no haya entregado previamente o que haya sido calificada como insuficiente. En el caso del alumnado que haya elegido la modalidad de evaluación final, en la convocatoria extraordinaria deberá realizar,  una prueba complementaria diseñada para la evaluación de las actividades realizadas a lo largo del curso equivalente a la convocatoria ordinaria. Dicha prueba puede consistir en una exposición oral, una demostración ante un ordenador o una descripción escrita de los conocimientos prácticos abordados en las actividades planteadas a lo largo del curso.

MATERIALES DE USO OBLIGATORIO

Apuntes y prácticas de la asignatura "Introducción a la Minería de Datos" publicados en la plataforma virtual de apoyo a la docencia de la Universidad.
 

BIBLIOGRAFÍA DE PROFUNDIZACIÓN

  • C.M. Bishop, Pattern Recognition and Machine Learning, Springer. (2006)
  • T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning. Data mining, Inference and Prediction, Springer. (2001),
  • L. Torgo, Data Mining with R: Learning with Case Studies. Chapman and Hall/ CRC, (2011)
  • G. Willians, Data Minig with Rattle and R. Springer, (2011)
  • I.H. Witten, E. Frank, Data Mining: Practical Machine Learning Tools and Techniques (Second Edition), Morgan Kaufmann. (2005)
  •  

REVISTAS

DIRECCIONES DE INTERNET DE INTERÉS

http://www.cs.cmu.edu/~tom/pubs/MachineLearning.pdf