Estudia
- Artes y humanidades
-
Ciencias
- Máster Erasmus Mundus en Recursos Biológicos Marinos
- Máster Universitario en Análisis de Datos para la Inteligencia de Negocios
- Máster Universitario en Biotecnología Alimentaria
- Máster Universitario en Biotecnología Aplicada a la Conservación y Gestión Sostenible de Recursos Vegetales
- Máster Universitario en Biotecnología del Medio Ambiente y la Salud
- Máster Universitario en Ciencias Analíticas y Bioanalíticas
- Máster Universitario en Conservación Marina
- Máster Universitario en Física Avanzada: Partículas, Astrofísica, Nanofísica y Materiales Cuánticos
- Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación*
- Máster Universitario en Química Teórica y Modelización Computacional
- Máster Universitario en Química y Desarrollo Sostenible
- Máster Universitario en Recursos Geológicos e Ingeniería Geológica
- Ciencias de la salud
- Ciencias sociales y jurídicas
- Ingeniería y arquitectura
- Información, acceso y becas
Modelización Estadística
- Clases Expositivas (14 Horas)
- Prácticas de Aula/Semina (16 Horas)
DESCRIPCIÓN Y CONTEXTUALIZACIÓN DE LA ASIGNATURA
Modelización Estadística es una asignatura de 6 créditos ECTS en la que se estudian algunas técnicas indispensables para el análisis multivariante de datos y que se desarrolla en torno a tres grandes clases de procedimientos: técnicas de reducción de datos, métodos de predicción y métodos de clasificación.
En cada tema se plantean los objetivos del método estadístico que se va a estudiar, se demuestran los resultados teóricos más importantes, que justifican la solución obtenida y se explica la utilidad práctica de estos resultados. Con estas demostraciones se pretende, así mismo, que los estudiantes se familiaricen con los conceptos abstractos y adquieran el hábito del razonamiento crítico, además de servirles cuando tengan que estudiar nuevos métodos o modelos, de manera autónoma.
Otro de los objetivos importantes de la asignatura es conseguir que los alumnos sepan plantear problemas reales y los resuelvan empleando los métodos estadísticos más adecuados y con la ayuda de algún programa informático como, por ejemplo, R.
En el primer bloque se presentan los modelos de regresión con los que se pretenden predecir el comportaminto de una variable (dependiente) como un combinación lineal de un conjunto de variables predictoras (indpendientes). Una cuestión muy importante es como seleccionar las variables que se deben incluir en la ecuación y evaluar la calidad del ajuste obtenido. También se aborda el problema de regresión logística, es decir, cuando la variable respuesta es dicotómica (por ejemplo padecer una enfermedad o no), en este caso el objetivo será predecir o buscar un modelo para explicar cuál es la probabilidad de que la variable respuesta tome cada uno de los valores Este modelo es de amplio uso en medicina y epidemiología por estar relacionado con el uso de los odds-ratio.
En el segundo bloque se presentan los métodos de reducción de la dimensión que tienen como objetivo fundamental representar los datos originales multidimensionales en un espacio de dimensión reducida de manera que se conserva en la medida de lo posible la estructura inicial de los datos.
El tercer bloque se dedica a los métodos de predicción o clasificación supervisada, Análisis Discriminante, Árboles de Decisión y Árboles de Clasificación. El objetivo de estos procedimientos es definir criterios o modelos para predecir el comportamiento de un individuo a partir de la información muestral recogida.
En el último bloque se estudian los métodos de clasificación o taxonomía numérica, cuyo objetivo es el de descubrir la existencia de subgrupos diferentes en una población global. Los procedimientos de clasificación que se van a estudiar son los algoritmos jerárquicos ascendentes y el método de las k-medias.
No los hay.
COMPETENCIAS DE LA ASIGNATURA
Competencias específicas de la asignatura:
9929- Aplicar de manera adecuada en base a los datos y los objetivos que se pretenden las diferentes técnicas multivariables
9930- Conocer y aplicar métodos de reducción de dimensión y clasificación
9932- Saber realizar un análisis de regresión lineal (estimación, inferencia y diagnóstico).
9933- Conocer y aplicar modelos lineales generalizados, especialmente el modelo de regresión logística.
9934-I nterpretar los resultados.
9935-Tener destreza en el proceso de aplicación de estas herramientas y modelos utilizando un software estadístico.
Competencias básicas y generales: CB6, CB7, CB9, CB10, CG1857
Competencias transversales: CT1861, CT1862, CT1872
Competencias específicas de la titulación: CE1865, CE1860, CE1841, CE1859
RESULTADOS DE APRENDIZAJE DE LA ASIGNATURA
1. Regresión
· Realizar inferencias sobre los parámetros del modelo de regresión.
· Construir intervalos de predicción para la variable dependiente.
· Evaluar el ajuste del modelo encontrado
- Saber detectar la presencia de outliers
· Validar de un modelo de regresión.
· Entender los modelos Logit y Probit como modelos que permiten trabajar con variables respuesta categóricas
· Interpretar los resultados de regresión logística binaria
· Manejar paquetes estadísticos para la resolución de problemas reales.
· Elaborar informes estadísticos, con los resultados de un análisis de datos reales.
2. Reducción de la dimensión
Saber aplicar los métodos de reducción de la dimensión.
Conocer los criterios que permiten decidir cuantas dimensiones se deben elegir.
Saber interpretar el significado de las dimensiones
Distinguir entre los objetivos del Análisis de Componentes Principales, Análisis de Correspondencias y Análisis Factorial
Saber medir la calidad de la reconstrucción del espacio original en el subespacio de las nuevas variables
Conocer cuando se debe utilizar la matriz de covarianza o la matriz de correlaciones en el ACP
3. Técnicas de Clasificación Supervisada
Conocer el objetivo y planteamiento de los diferentes métodos del análisis discriminante.
Saber las diferencias entre los diferentes métodos de predicción, sus ventajas e inconvenientes.
Conocer cuando se debe aplicar cada método
Conocer el problema del sobreajuste y como se puede resolver
Conocer las diferentes técnicas de validación de los resultados.
4. Técnicas de Clasificación No Supervisada
Saber aplicar los métodos de análisis clúster.
Conocer las técnicas jerárquicas ascendentes.
Conocer las diferentes distancias entre individuos y entre grupos, sus ventajas e inconvenientes.
Saber abordar el problema de las unidades en el cálculo de las distancias
Conocer el método k-medias y su utilización complementaria a los métodos jerárquicos
5. Resultados del aprendizaje comunes
Saber combinar los diferentes métodos de análisis de datos
Saber expresar los objetivos de un problema real en términos estadísticos y que técnicas estadísticas son las más adecuadas para su resolución.
Manejar paquetes estadísticos para la resolución de problemas reales.
Elaboración de informes estadísticos.
CONTENIDOS TEORICO-PRACTICOS
Tema 1
- Introducción al análisis estadístico multivariante.
- Clasificación de las técnicas multivariables
Tema 2
- Técnicas de reducción de dimensión y clasificación:
- Análisis factorial. Análisis de componentes principales.
- Análisis de correspondencias simples y Múltiples.
- Análisis discriminante.
- Análisis de conglomerados
Tema 3
- El modelo lineal: introducción. Modelo lineal simple y general: propiedades básicas. Diagnóstico y validación del modelo. Observaciones atípicas e influyentes.
- Heterocedasticidad y autocorrelación. Multicolinealidad.
- Transformación de variables. Selección de un modelo.
- Extensiones del modelo lineal: regresión logística, modelo lineal generalizado y modelos no lineales
Metodología
De acuerdo con las pautas que establece el EEES, la asignatura se desarrollará mediante actividades presenciales y trabajo autónomo del estudiante.
Las actividades presenciales son aquellas en las que estará presente el profesor y podrán ser de los siguientes tipos: clases expositivas, prácticas de aula, prácticas de laboratorio, seminarios o tutorías grupales.
- Clases expositivas (CE): En estas clases se presentan los contenidos teóricos de la materia junto con algunos ejemplos y ejercicios que aclaren los aspectos más importantes. Los alumnos dispondrán de los apuntes de cada tema. Se utiliza la pizarra y los diferentes medios audiovisuales.
- Clases prácticas de laboratorio (PL): Se utilizará el programas, de software libre, R de estadística para analizar datos, buscar modelos de predicción.
- Prácticas de aula (PA): Dedicados la resolución de ejercicios teóricos y problemas relacionados con el análisis estadístico de datos experimentales. Se pretende que los estudiantes:
- refuercen las competencias relacionadas con el razonamiento abstracto
- sepan expresar los objetivos de un problema en términos estadísticos, analizar los datos y obtener las conclusiones
Parte importante del trabajo del alumno es de carácter personal. Los profesores orientarán en todo momento ese trabajo y estimularán que se haga con regularidad y dedicación. Se animará igualmente a que utilicen las tutorías personales donde pueden aclarar cualquier duda o dificultad que se les presente en las asignaturas.
Sistemas de evaluación
Para evaluar la asignatura se tendrá en cuenta el trabajo continuado del estudiante y una prueba final, según los siguientes criterios:
- EVALUACIÓN CONTINUA
Representa un 40 % de la puntuación final y se tendrá en cuenta la asistencia y participación en las clases y resolución de los ejercicios propuestos en las clases presenciales.
- SISTEMA DE EVALUACIÓN FINAL
Representa un 60 % de la puntuación final y consistirá en la resolución de problemas o trabajos propuestos por el profesor.
Para aprobar la asignatura será necesario alcanzar una nota de 4 sobre 10 en cada parte de la evaluación.
La calificación final se calcula aplicando la siguiente fórmula:
Califiación Final = 0,4 * EC + 0,6 * EF sí mínimo ( EC=Evaluación continua , EV=Evaluación final) >= 4
Calificación Final = mínimo (0,4 * EC + 0,6 * EF, 4,5) sí mínimo ( Evaluación continua , Evaluación final) < 4
Por ejemplo, un estudiante con 7,4 de evaluación continua y 3,4 en la evaluación final obtendría la calificación siguiente:
Calificación=0.4 * 7.4 + 0.6 * 3.4= 5.0
Calificación Final = mínimo (5.0, 4,5) = 4.5
De forma excepcional, si las condiciones sanitarias lo requieren, se podrán incluir algunas modificaciones en los métodos de evaluación presencial. En este caso se informará al estudiantado de los cambios propuestos.
CONVOCATORIA ORDINARIA: ORIENTACIONES Y RENUNCIA
CRITERIOS DE LA EVALUACIÓN FINAL:
Los estudiantes que lo soliciten, podrán someterse a una evaluación final, que podrá consistir en una prueba única, o en un conjunto de pruebas y trabajos.
Se podrá establecer de manera excepcional la asistencia a determinadas sesiones presenciales, y la superación, en su caso, de las pruebas que en ellas se establezcan.
Los estudiantes deberán solicitar la evaluación diferenciada mediante escrito razonado dirigido al Coordinador del Máster, desde el momento de la matrícula hasta transcurridos, como máximo, cinco días desde el inicio del curso. La solicitud se acompañará de todos los documentos que acrediten la imposibilidad de seguir con normalidad el desarrollo del curso. La Comisión Académica del Máster, resolverá en el plazo máximo de veinte días.
RENUNCIA:
El alumnado que haya realizado las actividades a lo largo del curso, pero no se presente a la convocatoria ordinaria, será calificado como No presentado/a.
CONVOCATORIA EXTRAORDINARIA: ORIENTACIONES
Los criterios de evaluación serán los mismos que en la convocatoria ordinaria. La evaluación de las actividades realizadas a lo largo del curso (prácticas de ordenador, ejercicios, seminarios) será válida para las dos convocatorias del curso. En consecuencia, el alumnado que haya superado estas actividades a lo largo del curso, en la convocatoria extraordinaria solo tendrá que presentarse al trabajo individual. En el caso del alumnado que no haya superado la evaluación de dichas actividades o haya elegido la modalidad de evaluación final, en la convocatoria extraordinaria deberá realizar, también, una prueba complementaria diseñada para la evaluación de las actividades realizadas a lo largo del curso. Dicha prueba puede consistir en una exposición oral, una demostración ante un ordenador o una descripción escrita de los conocimientos prácticos abordados en las actividades planteadas a lo largo del curso.
MATERIALES DE USO OBLIGATORIO
Apuntes:
http://bellman.ciencias.uniovi.es/norberto/
materiales de e-gela
Bibliografía recomendada
Regresión y Diseño de Experimentos. Daniel Peña. Alianza Editorial.
Logistic Regression. A Self-Learning Test. D. G. Kleinbaum. Springer Verlag.
Davison, A. (2003), Statistical models. Cambridge University Press and Hall
Atkinson, Riani & Cerioli (2004), Exploring multivariate data with the forward search, Springer
Escofier B., Pages J.. Análisis Factoriales Simples y Múltiples. Objetivos, métodos e interpretación. Bilbao UPV/EHU, 1992
Greenacre M.J.. Theory and aplication of Correspondence Analysis. London Academic Press, 1984
Krzanowski W.J. (2000), Principles of Multivariate Analysis, Revised Edition, Oxford University Press
Peña D.. Análisis de Datos Multivariantes. Mc Graw-Hill, 2002
Ugarte, M.D. Militino, A.F. & Arnholt, A. (2009), Probability and Statistics with R, CRC/Chapman & Hall
Bibliografía de profundización
Applied Regression Analysis, 3rd Edition. N. R. Draper, H. Smith. Wiley
Linear Regression Analysis. G. A. Seber, A. J. Lee. Wiley
Linear Models. S. R. Searle. Wiley
Belsley, D. A., Kuh, E., and Welsch., R. E. (1980). Regression Diagnostics: Identifying
Influential Data and Sources of Collinearity. New York: Wiley.
Applied Logistic Regression. D. W. Hosmer, S. Lemeshow, SWiley.
Matrix Algebra Useful for Statistics. S. R. Searle. Wiley
REVISTAS
DIRECCIONES DE INTERNET DE INTERÉS
https://cran.r-project.org/doc/contrib/Faraway-PRA.pdf (Practical Regressiona and Anova using R. J. F. Faraway)
http://www.et.bs.ehu.es/~etptupaf/nuevo/ficheros/estad3/nreg1.pdf (Análisis de Regresión. Introducción Teórica y Práctica basada en R. Fernando Tusell