Estudia
- Artes y humanidades
-
Ciencias
- Máster Erasmus Mundus en Recursos Biológicos Marinos
- Máster Universitario en Análisis de Datos para la Inteligencia de Negocios
- Máster Universitario en Biotecnología Alimentaria
- Máster Universitario en Biotecnología Aplicada a la Conservación y Gestión Sostenible de Recursos Vegetales
- Máster Universitario en Biotecnología del Medio Ambiente y la Salud
- Máster Universitario en Ciencias Analíticas y Bioanalíticas
- Máster Universitario en Conservación Marina
- Máster Universitario en Física Avanzada: Partículas, Astrofísica, Nanofísica y Materiales Cuánticos
- Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación*
- Máster Universitario en Química Teórica y Modelización Computacional
- Máster Universitario en Química y Desarrollo Sostenible
- Máster Universitario en Recursos Geológicos e Ingeniería Geológica
- Ciencias de la salud
- Ciencias sociales y jurídicas
- Ingeniería y arquitectura
- Información, acceso y becas
Análisis de Datos I
- Clases Expositivas (24 Hours)
- Prácticas de Laboratorio (21 Hours)
El Análisis de Datos I es una asignatura de 6 créditos ECTS perteneciente al módulo Análisis de Datos en la que se abordan tres grandes clases de procedimientos: técnicas de reducción de datos, métodos de predicción y métodos de clasificación no supervisada.
En cada tema se plantean los objetivos del método estadístico que se va a estudiar, sus características más importantes y cómo interpretar tanto los resultados que se obtienen como sus limitaciones. Con ello se pretende que los estudiantes se familiaricen con el uso de estas técnicas, adquieran el hábito del razonamiento crítico y mejoren su capacidad para estudiar, de manera autónoma, nuevos métodos o modelos.
Otro de los objetivos importantes de la asignatura es conseguir que los alumnos sepan plantear problemas reales de una manera rigurosa y los resuelvan empleando los métodos estadísticos más adecuados, con la ayuda de algún programa informático como, por ejemplo, R.
En el primer bloque se presentan los métodos de reducción de la dimensión: Análisis de Componentes Principales, Análisis de Correspondencias y Análisis Factorial, que tienen como objetivo fundamental representar los datos originales multidimensionales en un espacio de dimensión reducida de manera que se conserva en la medida de lo posible la estructura inicial de los datos.
El segundo bloque se dedica a los métodos de predicción (regresión o clasificación supervisada): Análisis Discriminante, Árboles de Decisión y Redes Neuronales. El objetivo de estos procedimientos es definir criterios o modelos para predecir el comportamiento de un individuo a partir de la información muestral recogida.
En el tercer bloque se estudian los métodos de clasificación no supervisada o taxonomía numérica, cuyo objetivo es descubrir la existencia de subgrupos diferentes en una población global. Los procedimientos de clasificación no supervisada que se van a estudiar son los Algoritmos Jerárquicos Ascendentes y el Método de las K-medias.
Se recomienda que el estudiante tenga conocimientos de las siguientes materias:
- Estadística Descriptiva
- Cálculo de Probabilidades
- Inferencia Estadística
Competencias y resultados del aprendizaje
Las competencias que el alumno adquiere con este módulo son las siguientes:
Competencias básicas:
CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades
CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo
Competencias generales:
CG2. Adquirir las destrezas necesarias para incorporarse a equipos de trabajo en la empresa o a grupos de investigación competitivos en el ámbito de la Estadística y la Inteligencia Empresarial.
CG4. Capacidad para gestionar la información y manejar herramientas informáticas adecuadas para la resolución de los problemas surgidos en los ámbitos de la Inteligencia Empresarial y de la Estadística.
CG6. Interpretar los resultados obtenidos a partir de los modelos estadísticos y
empresariales y su aplicación en distintos ámbitos profesionales, además de redactar informes en base a las conclusiones obtenidas.
CG7 Capacidad para el pensamiento científico con actitudes asociadas al desarrollo de los métodos matemáticos como son: el cuestionamiento de las ideas intuitivas, el análisis crítico de las afirmaciones, la capacidad de análisis y de síntesis de ideas nuevas y complejas, o la toma de decisiones racionales.
CG8 Identificar y evaluar nuevas herramientas analíticas para resolver nuevos problemas en los ámbitos de la inteligencia de los negocios y la organización social.
CG10. Capacidad para la transformación de grandes cantidades de datos y la reducción de los problemas complejos, mediante un lenguaje claro y conciso, a información procesable para la audiencia final.
CG12. Reunir, depurar y transformar los datos que almacena la empresa en información estructurada y coherente para contrastar hipótesis que traten de responder a cuestiones dentro del ámbito de la inteligencia de negocios.
Competencias específicas:
CE9. Utilizar correctamente los programas de ordenador que ayuden a la resolución de los modelos analíticos de datos que aparecen en la práctica profesional e interpretar los resultados.
CE10. Redactar informes relativos al conocimiento derivado de los datos que aparecen en su ámbito de actuación con precisión, orden y claridad.
CE11. Gestionar bases de datos en distintos ámbitos profesionales.
CE12. Comprender, plantear, formular y resolver aquellos problemas susceptibles de ser abordados a través de modelos estadísticos en distintos ámbitos de gestión.
Estas competencias están asociadas a los siguientes resultados del aprendizaje:
Saber aplicar los métodos de reducción de la dimensión, eligiendo el número adecuado de dimensiones y la matriz de covariación, e interpretar convenientemente sus resultados.
Conocer los métodos de clasificación de análisis discriminante, árboles de clasificación y regresión y redes neuronales, así como sus diferencias, sus ventajas y sus inconvenientes.
Saber elegir un método adecuado de clasificación, saber aplicarlo y saber interpretar convenientemente sus resultados, teniendo en cuenta el problema del sobreajuste.
Saber validar un modelo de clasificación según diferentes técnicas.
Conocer las diferentes medidas de distancia entre individuos y grupos, con sus ventajas e inconvenientes y teniendo en cuenta el problema de las unidades, y saber aplicar un análisis de conglomerados jerárquicos e interpretar sus resultados.
Saber manejar eficientemente la información almacenada en registros y campos de un fichero de texto puro.
Contenidos
Tema 1.- ANÁLISIS DE COMPONENTES PRINCIPALES
Introducción. Cálculo de las componentes principales. Elección del número de componentes. Correlaciones entre las variable originales y las componentes. Calidad de la reconstrucción de las variables iniciales. Interpretación del significado de las componentes.
Tema 2.- ANÁLISIS DE CORRESPONDENCIAS.
Introducción. Los puntos fila y los puntos columna. Elección de la distancia. Cálculo de las componentes. Reconstrucción de la tabla de contingencia. Interpretación de los resultados. El espacio conjunto de los puntos fila y los puntos columna.
Tema 3.- ANÁLISIS FACTORIAL
Introducción. El modelo factorial. El método del factor principal. El método de máxima verosimilitud. Elección del número de factores. Rotación de los factores. Cálculo de las puntuaciones factoriales.
Tema 4.- ANÁLISIS DISCRIMINANTE
Introducción. El método de máxima verosimilitud. El método bayesiano. Factores discriminantes canónicos. Estimación de las probabilidades de error: validación cruzada.
Tema 5.- ÁRBOLES DE DECISIÓN Y CLASIFICACIÓN
Introducción. Elementos de un árbol. Criterios de división o predicción. Criterios de parada. Criterios de poda. Criterios de validación.
Tema 6.- REDES NEURONALES
Introducción. Perceptrones monocapa y multicapa. Función de activación. Algoritmos de flujo de datos. Parámetros de entrenamiento para aprendizaje supervisado. Validación.
Tema 7.- ANÁLISIS CLÚSTER
Introducción. Distancias y similaridades. Métodos jerárquicos ascendentes. Criterios de agrupación: centroide, Ward, k-vecinos más próximos, salto mínimo; ventajas e inconvenientes.
Método de las k medias. Elección del número y centro de los grupos.
De acuerdo con las pautas que establece el EEES, la asignatura se desarrollará mediante actividades presenciales y trabajo autónomo del estudiante.
Las actividades presenciales son aquéllas en las que estará presente el profesor. Se dividen en clases expositivas, prácticas de laboratorio y sesiones de evaluación.
Clases expositivas (CE): En estas clases se presentan los contenidos teóricos de la materia junto con algunos ejemplos y ejercicios que aclaren los aspectos más importantes. Los alumnos dispondrán de los materiales que se pongan en el campus virtual. Se utiliza la pizarra y los diferentes medios audiovisuales.
Clases prácticas de laboratorio (PL): Dedicadas a la resolución de problemas relacionados con el análisis estadístico de datos. Se pretende que los estudiantes:
- refuercen las competencias relacionadas con el razonamiento abstracto
- sepan expresar los objetivos de un problema en términos estadísticos, analizar los datos y obtener las conclusiones
Se utilizará el programa R.
Sesiones de evaluación (SE): Se dedicarán exclusivamente a la realización de pruebas escritas con las que se pueda valorar de forma objetiva el nivel alcanzado por los estudiantes en la adquisición de las competencias previstas.
Temas | Horas | CE | PL | Evaluaión | Total | T. Grupo | T. Autónomo | T. Total |
Tema 1 | 23 | 4 | 4 | 8 | 3 | 12 | 23 | |
Tema 2 | 23 | 4 | 3 | 7 | 2 | 14 | 23 | |
Tema 3 | 15 | 3 | 2 | 5 | 1 | 9 | 10 | |
Tema 4 | 23 | 3 | 3 | 6 | 3 | 14 | 17 | |
Tema 5 | 26 | 4 | 4 | 8 | 4 | 14 | 18 | |
Tema 6 | 15 | 2 | 2 | 4 | 2 | 9 | 11 | |
Tema 7 | 23 | 2 | 3 | 5 | 3 | 15 | 18 | |
Examen Final | 2 | 0 | 0 | 2 | ||||
Total | 150 | 22 | 21 | 2 | 45 | 18 | 87 | 105 |
Trabajo Presencial
Clases Expositivas 22
Prácticas de laboratorio campo / aula de informática / aula de idiomas 21
Sesiones de evaluación 2
Trabajo No presencial
Trabajo en Grupo 18
Trabajo Individual 87
Total 150
De forma excepcional, si las condiciones sanitarias lo requieren, se podrán incluir actividades de docencia no presencial. En cuyo caso, se informará al estudiantado de los cambios efectuados.
Evaluación ordinaria
La nota se basará en:
- evaluación continua (EC) basada en
- participación activa en clase
- resolución de tareas
- presentaciones de trabajos individuales o grupales
- examen (EX)
La nota final de la asignatura se calculará de la siguiente manera:
Nota Final = 0,5 EC + 0,5 EX si EX ≥ 3
Nota Final= mín { 0,5 EC + 0,5 EX ; 4,5) si EX < 3
donde EX y EC se corresponden con la nota del examen final y la de la evaluación continua, respectivamente. Todas ellas están calculadas sobre diez puntos.
La calificación de la evaluación continua se conserva de la convocatoria ordinaria a la extraordinaria del segundo semestre (pero no para el curso siguiente). Por lo tanto, en la convocatoria extraordinaria del segundo semestre la nota final se basará en
- evaluación continua conservada (EC)
- examen (EX)
La nota final de la asignatura se calculará de la siguiente manera:
Nota Final = 0,5 EC + 0,5 EX si EX ≥ 3
Nota Final = mín { 0,5 EC + 0,5 EX ; 4,5) si EX < 3
donde EX y EC se corresponden con la nota del examen y la de la evaluación continua conservada, respectivamente. Todas ellas están calculadas sobre diez puntos.
En la convocatoria extraordinaria del primer semestre del curso la nota final será
- 100% de examen
Evaluación diferenciada
Cuando un estudiante opte por una evaluación diferenciada, la nota final será
- 100% de examen
Excepcionalidad
De forma excepcional, si las condiciones sanitarias lo requirieren, se podrán incluir métodos de evaluación no presencial. En tal caso, se informará a los alumnos de los cambios efectuados.
Bibliografía Básica
Análisis Multivariante - Peña, Daniel
Pattern Recognition and Neural Networks - Ripley, B. D.
Bibliografía complementaria
Multivariate Analysis - Mardia, Kent, Bibby
Multivariate Observations - Seber, G.
Tratamiento Estadístico de Datos - Lebart, Morineau, Fenelon
Neural Networks for Pattern Recognition - Bishop, C.
Ueb
https://bellman.ciencias.uniovi.es/~carleos/master/manadine/curso1/AnalisisDatos1/