Estudia
- Artes y humanidades
-
Ciencias
- Máster Erasmus Mundus en Recursos Biológicos Marinos
- Máster Universitario en Análisis de Datos para la Inteligencia de Negocios
- Máster Universitario en Biotecnología Alimentaria
- Máster Universitario en Biotecnología Aplicada a la Conservación y Gestión Sostenible de Recursos Vegetales
- Máster Universitario en Biotecnología del Medio Ambiente y la Salud
- Máster Universitario en Ciencias Analíticas y Bioanalíticas
- Máster Universitario en Conservación Marina
- Máster Universitario en Física Avanzada: Partículas, Astrofísica, Nanofísica y Materiales Cuánticos
- Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación*
- Máster Universitario en Química Teórica y Modelización Computacional
- Máster Universitario en Química y Desarrollo Sostenible
- Máster Universitario en Recursos Geológicos e Ingeniería Geológica
- Ciencias de la salud
- Ciencias sociales y jurídicas
- Ingeniería y arquitectura
- Información, acceso y becas
Introducción a la Minería de Datos
DESCRIPCIÓN Y CONTEXTUALIZACIÓN DE LA ASIGNATURA
En la actualidad el progreso del conocimiento y el desarrollo de la tecnología se soportan en gran medida en la explotación de grandes cantidades de datos empíricos recogidos de todo tipo de mediciones. Las bases de datos facilitan el almacenamiento, actualización, ordenación y búsqueda de esos datos. La minería de datos, combina los recursos de la estadística y la computación para descubrir patrones de comportamiento en los datos, que generen nueva información relevante y que se pueda estructurar para su uso posterior. El proceso conlleva diferentes fases, tales como la selección y preprocesamiento de las variables, la aplicación de las técnicas relevantes, la validación y selección del mejor modelo y su interpretación.
No los hay.
COMPETENCIAS DE LA ASIGNATURA
Competencias específicas de la asignatura:
10014-Conoce en qué consiste la minería de datos, los diversos tipos de problemas que resuelve y las diferentes técnicas que se utilizan.
10015-Sabe analizar un conjunto grande de datos con dos o más de las técnicas presentadas durante el curso. 10016-Sabe evaluar la capacidad predictiva de un modelo.
10017-Sabe elegir entre distintos modelos el que mejor se adapta al problema que se desea resolver.
10018-Sabe utilizar un software de minería de datos.
Competencias básicas y generales: CB6, CB7, CB10, CG1857
Competencias transversales: CT1861, CT1872
Competencias específicas de la titulación: CE1865, CE1860, CE1841, CE1859
RESULTADOS DE APRENDIZAJE DE LA ASIGNATURA
- Entender las etapas que conlleva un proyecto de minería de datos.
- Ser capaz de asociar las principales técnicas con los distintos tipos de aprendizaje supervisado, no supervisado y de reglas de asociación.
- Saber aplicar algunos de los algoritmos básicos de reglas de asociación y medir la relevancia de las asociaciones halladas
- Conocer y aplicar modelos predictivos en problemas de aprendizaje supervisado
- Saber entrenar modelos para que eviten el sobreajuste
- Comparar modelos y tener criterios para elegir razonadamente entre varios
- Comprender los métodos de clasificación por consenso y saber aplicar las principales técnicas disponibles.
CONTENIDOS TEORICO-PRACTICOS
- Introducción a la minería de datos.
- Aprendizaje Supervisado:
Modelos Predictivos: Lineal y regularizado. Modelos No Paraméticos.
Modelos de clasificación: Análisis Discriminante, Regresión Logística, k vecinos próximos, Máquinas de Vector Soporte y Modelo Naïve-Bayes.
Árboles de Regresión y de Clasificación.
Introducción a métodos de clasificación por consenso (Bagging, Random Forest y Boosting)
Introducción a los Modelos gráficos probabilísticos: Redes bayesianas.
- Análisis de Conjuntos de Items Frecuentes (Análisis de reglas de asociación)
- Elementos básicos de Minería de Textos
Metodología
El contenido teórico se expondrá en clases magistrales siguiendo referencias básicas que figuran en la Bibliografía y el material facilitado por el profesor. Estas clases magistrales se complementarán con clases de prácticas en aula informática; en las que se enseñará el uso de software libre (fundamentalmente R y Weka) que permita la aplicación de las técnicas desarrolladas en las clases magistrales .
Durante el periodo docente se propondrán y recogerá un trabajo corto de carácter individual sobre algunos de los tópicos no pertenecientes al tema de aprendizaje supervisado.
También se propondrán pequeños ejercicios o desarrollos teóricos de carácter voluntario, pero obligatorios para el alumnado que haya solicitado evaluación diferenciada.
Sistemas de evaluación
Se consideran los siguientes tipos de evaluación:
- SISTEMA DE EVALUACIÓN CONTINUA
- SISTEMA DE EVALUACIÓN FINAL
Herramientas y porcentajes de calificación
SISTEMA DE EVALUACIÓN CONTINUA: trabajos individuales y por parejas 100%
SISTEMA DE EVALUACIÓN FINAL: ejercicios y trabajos individuales 100%
CONVOCATORIA ORDINARIA: ORIENTACIONES Y RENUNCIA
CRITERIOS DE LA EVALUACIÓN CONTINUA:
Realización de una tarea individual consistente en la aplicación de técnicas de aprendizaje de reglas de asociación o similar sobre un conjunto de datos: 20%
Una segunda tarea individual o por parejas donde se resuelve un problema de aprendizaje supervisado aplicando diversas técnicas y seleccionando el modelo más adecuado. Se debe entregar un informe que describa todo el proceso de trabajo y el código utilizado: 80%
Para aprobar la asignatura será necesario entregar ambas tareas y alcanzar una nota de 5 sobre 10 en la calificación conjunta de ambas tareas.
CRITERIOS DE LA EVALUACIÓN FINAL:
Los estudiantes que lo soliciten, podrán someterse a una evaluación final, que podrá consistir en una prueba única, o en un conjunto de pruebas y trabajos.
Se podrá establecer de manera excepcional la asistencia a determinadas sesiones presenciales, y la superación, en su caso, de las pruebas que en ellas se establezcan.
Los estudiantes deberán solicitar la evaluación diferenciada mediante escrito razonado dirigido al Coordinador del Máster, desde el momento de la matrícula hasta transcurridos, como máximo, cinco días desde el inicio del curso. La solicitud se acompañará de todos los documentos que acrediten la imposibilidad de seguir con normalidad el desarrollo del curso. La Comisión Académica del Máster, resolverá en el plazo máximo de veinte días.
RENUNCIA:
El alumnado que haya realizado sólo parte de las tareas asignadas a lo largo del curso, será calificado como No presentado/a.
CONVOCATORIA EXTRAORDINARIA: ORIENTACIONES
Los criterios de evaluación serán los mismos que en la convocatoria ordinaria. La evaluación de las actividades realizadas a lo largo del curso (tarea durante el periodo de clase magistral y la tarea de resolución de un caso) serán válida para las dos convocatorias del curso. En consecuencia, el alumnado que haya superado estas actividades a lo largo del curso, en la convocatoria extraordinaria solo tendrá que entregar aquella tarea que no haya entregado previamente o que haya sido calificada como insuficiente. En el caso del alumnado que haya elegido la modalidad de evaluación final, en la convocatoria extraordinaria deberá realizar, una prueba complementaria diseñada para la evaluación de las actividades realizadas a lo largo del curso equivalente a la convocatoria ordinaria. Dicha prueba puede consistir en una exposición oral, una demostración ante un ordenador o una descripción escrita de los conocimientos prácticos abordados en las actividades planteadas a lo largo del curso.
MATERIALES DE USO OBLIGATORIO
Apuntes y prácticas de la asignatura "Introducción a la Minería de Datos" publicados en la plataforma virtual de apoyo a la docencia de la Universidad.
BIBLIOGRAFÍA DE PROFUNDIZACIÓN
- C.M. Bishop, Pattern Recognition and Machine Learning, Springer. (2006)
- T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning. Data mining, Inference and Prediction, Springer. (2001),
- L. Torgo, Data Mining with R: Learning with Case Studies. Chapman and Hall/ CRC, (2011)
- G. Willians, Data Minig with Rattle and R. Springer, (2011)
- I.H. Witten, E. Frank, Data Mining: Practical Machine Learning Tools and Techniques (Second Edition), Morgan Kaufmann. (2005)
REVISTAS
DIRECCIONES DE INTERNET DE INTERÉS