template-browser-not-supported

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación*

Atrás Atrás

Modelización Estadística

Código asignatura
MMIMECOM-1-003
Curso
Primero
Temporalidad
Primer Semestre
Carácter
Optativa
Créditos
6
Pertenece al itinerario Bilingüe
No
Actividades
  • Clases Expositivas (14 Horas)
  • Prácticas de Aula/Semina (16 Horas)
Guía docente

DESCRIPCIÓN Y CONTEXTUALIZACIÓN DE LA ASIGNATURA

Modelización Estadística  es una asignatura de 6 créditos ECTS en la que se estudian algunas técnicas indispensables para el análisis multivariante de datos y que se  desarrolla en torno a tres grandes clases de procedimientos: técnicas de reducción de datos, métodos de predicción y métodos de clasificación.

En cada tema se plantean los objetivos del método estadístico que se va a estudiar, se demuestran los resultados teóricos más importantes, que justifican la solución obtenida y se explica la utilidad práctica de estos resultados. Con estas demostraciones se pretende, así mismo, que los estudiantes se familiaricen con los conceptos abstractos y adquieran el hábito del razonamiento crítico, además de servirles cuando tengan que estudiar nuevos métodos o modelos, de manera autónoma.

Otro de los objetivos importantes de la asignatura es conseguir que los alumnos sepan plantear problemas reales y los resuelvan  empleando los métodos estadísticos más adecuados y con la ayuda de algún programa informático como, por ejemplo, R.

En el primer bloque se presentan los modelos de regresión con los que se pretenden predecir el comportaminto de una variable (dependiente) como un combinación lineal de un conjunto de variables predictoras (indpendientes). Una cuestión muy importante es como seleccionar las variables que se deben incluir en la ecuación y evaluar la calidad del ajuste obtenido. También se aborda el problema de regresión logística, es decir, cuando la variable respuesta es dicotómica (por ejemplo  padecer una enfermedad o no), en este caso el objetivo será predecir o buscar un modelo para explicar cuál es la probabilidad de que la variable respuesta tome cada uno de los valores Este modelo es de amplio uso en medicina y epidemiología por estar relacionado con el uso de los odds-ratio.

En el segundo bloque se presentan los métodos de reducción de la dimensión que tienen como objetivo fundamental representar los datos originales multidimensionales en un espacio de dimensión reducida de manera que se conserva en la medida de lo posible la estructura inicial de los datos.

El tercer bloque se dedica a los métodos de predicción o clasificación supervisada, Análisis Discriminante, Árboles de Decisión y Árboles de Clasificación. El objetivo de estos procedimientos es definir criterios o modelos para predecir el comportamiento de un individuo a partir de la información muestral recogida.

En  el último bloque se estudian los métodos de clasificación o taxonomía numérica, cuyo objetivo es el de descubrir la existencia de subgrupos diferentes en una población global. Los procedimientos de clasificación que se van a estudiar son los algoritmos jerárquicos ascendentes y el método de las k-medias.

No los hay.

COMPETENCIAS DE LA ASIGNATURA

Competencias específicas de la asignatura:

9929- Aplicar de manera adecuada en base a los datos y los objetivos que se pretenden las diferentes técnicas multivariables

9930- Conocer y aplicar métodos de reducción de dimensión y clasificación

9932- Saber realizar un análisis de regresión lineal (estimación, inferencia y diagnóstico).

9933- Conocer y aplicar modelos lineales generalizados, especialmente el modelo de regresión logística.

9934-I nterpretar los resultados.

9935-Tener destreza en el proceso de aplicación de estas herramientas y modelos utilizando un software estadístico.

Competencias básicas y generales: CB6, CB7, CB9, CB10, CG1857

Competencias transversales: CT1861, CT1862, CT1872

Competencias específicas de la titulación: CE1865, CE1860, CE1841, CE1859

RESULTADOS DE APRENDIZAJE DE LA ASIGNATURA

1. Regresión

· Realizar inferencias sobre los parámetros del modelo de regresión.

· Construir intervalos de predicción para la variable dependiente.

· Evaluar el ajuste del modelo encontrado

- Saber detectar la presencia de outliers

· Validar de un modelo de regresión.

· Entender los modelos Logit y Probit como modelos que permiten trabajar con variables respuesta categóricas

· Interpretar los resultados de regresión logística binaria

· Manejar paquetes estadísticos para la resolución de problemas reales.

· Elaborar informes estadísticos, con los resultados de un análisis de datos reales.

2. Reducción de la dimensión

Saber aplicar los métodos de reducción de la dimensión.

Conocer los criterios que permiten decidir cuantas dimensiones se deben elegir.

Saber interpretar el significado de las dimensiones

Distinguir entre los objetivos del Análisis de Componentes Principales, Análisis de Correspondencias y Análisis Factorial

Saber medir la calidad de la reconstrucción del espacio original en el subespacio de las nuevas variables

Conocer cuando se debe utilizar la matriz de covarianza o la matriz de correlaciones en el ACP

3. Técnicas de Clasificación Supervisada

Conocer el objetivo y planteamiento de los diferentes métodos del análisis  discriminante.

Saber las diferencias entre los diferentes métodos de predicción, sus ventajas e inconvenientes.

Conocer cuando se debe aplicar cada método

Conocer el problema del sobreajuste y como se puede resolver

Conocer las diferentes técnicas de validación de los resultados.

4. Técnicas de Clasificación No Supervisada

Saber aplicar  los métodos de análisis clúster.

Conocer las técnicas jerárquicas ascendentes.

Conocer las diferentes distancias entre individuos y entre grupos, sus ventajas e inconvenientes.

Saber abordar el problema de las unidades en el cálculo de las distancias

Conocer el método k-medias y su utilización complementaria a los métodos jerárquicos

5. Resultados del aprendizaje comunes

Saber combinar los diferentes métodos de análisis de datos

Saber expresar los objetivos de un problema real en términos estadísticos y que técnicas estadísticas son las más adecuadas para su resolución.

Manejar paquetes estadísticos para la resolución de problemas reales.

Elaboración de informes estadísticos.

CONTENIDOS TEORICO-PRACTICOS

Tema 1

  • Introducción al análisis estadístico multivariante.
  • Clasificación de las técnicas multivariables

Tema 2

  • Técnicas de reducción de dimensión y clasificación:
  • Análisis factorial. Análisis de componentes principales.
  • Análisis de correspondencias simples y Múltiples.
  • Análisis discriminante.
  • Análisis de conglomerados

Tema 3

  • El modelo lineal: introducción. Modelo lineal simple y general: propiedades básicas. Diagnóstico y validación del modelo. Observaciones atípicas e influyentes.
  • Heterocedasticidad y autocorrelación. Multicolinealidad.
  • Transformación de variables. Selección de un modelo.
  • Extensiones del modelo lineal: regresión logística, modelo lineal generalizado y modelos no lineales

Metodología

De acuerdo con las pautas que establece el EEES, la asignatura se desarrollará mediante actividades presenciales y trabajo autónomo del estudiante.

Las actividades presenciales son aquellas en las que estará presente el profesor y podrán ser de los siguientes tipos: clases expositivas,  prácticas de aula, prácticas de laboratorio, seminarios o tutorías grupales.

  • Clases expositivas (CE):  En estas clases se presentan los contenidos teóricos de la materia junto con algunos ejemplos y ejercicios que aclaren los aspectos más importantes. Los alumnos dispondrán de los apuntes de cada tema. Se utiliza la pizarra y los diferentes medios audiovisuales.
  • Clases prácticas de laboratorio (PL): Se utilizará el programas, de software libre, R de  estadística  para analizar datos, buscar modelos de predicción.
  • Prácticas de aula (PA): Dedicados la resolución de ejercicios teóricos y problemas relacionados con el análisis estadístico de datos experimentales. Se pretende que los estudiantes:
      • refuercen las competencias relacionadas con el razonamiento abstracto
      • sepan expresar  los objetivos de un problema en términos estadísticos, analizar los datos y obtener las conclusiones

Parte importante del trabajo del alumno es de carácter personal. Los profesores orientarán en todo momento ese trabajo y estimularán que se haga con regularidad y dedicación. Se animará igualmente a que utilicen las tutorías personales donde pueden aclarar cualquier duda o dificultad que se les presente en las asignaturas.

Sistemas de evaluación

Para evaluar la asignatura se tendrá en cuenta el trabajo continuado del estudiante y una prueba final, según los siguientes criterios:

  • EVALUACIÓN CONTINUA

Representa un 40 % de la puntuación final y se tendrá en cuenta la asistencia y participación en las clases y resolución de los ejercicios propuestos en las clases presenciales.

  • SISTEMA DE EVALUACIÓN FINAL

Representa un 60 % de la puntuación final y consistirá en la resolución de problemas o trabajos propuestos por el profesor.

Para aprobar la asignatura será necesario alcanzar una nota de 4 sobre 10 en cada parte de la evaluación.

La calificación final se calcula aplicando la siguiente fórmula:

Califiación Final = 0,4 * EC + 0,6 * EF sí mínimo ( EC=Evaluación continua , EV=Evaluación final) >= 4

Calificación Final = mínimo (0,4 * EC + 0,6 * EF, 4,5) sí mínimo ( Evaluación continua , Evaluación final) < 4

Por ejemplo, un estudiante con 7,4 de evaluación continua y 3,4 en la evaluación final obtendría la calificación siguiente:

Calificación=0.4 * 7.4 + 0.6 * 3.4= 5.0

Calificación Final = mínimo (5.0, 4,5) = 4.5

De forma excepcional, si las condiciones sanitarias lo requieren, se podrán incluir algunas modificaciones en los métodos de evaluación presencial. En este caso se informará al estudiantado de los cambios propuestos.

CONVOCATORIA ORDINARIA: ORIENTACIONES Y RENUNCIA

CRITERIOS DE LA EVALUACIÓN FINAL:
Los estudiantes que lo soliciten, podrán someterse a una evaluación final, que podrá consistir en una prueba única, o en un conjunto de pruebas y trabajos.
Se podrá establecer de manera excepcional la asistencia a determinadas sesiones presenciales, y la superación, en su caso, de las pruebas que en ellas se establezcan.
Los estudiantes deberán solicitar la evaluación diferenciada mediante escrito razonado dirigido al Coordinador del Máster, desde el momento de la matrícula hasta transcurridos, como máximo, cinco días desde el inicio del curso. La solicitud se acompañará de todos los documentos que acrediten la imposibilidad de seguir con normalidad el desarrollo del curso. La Comisión Académica del Máster, resolverá en el plazo máximo de veinte días.

RENUNCIA:
El alumnado que haya realizado las actividades a lo largo del curso, pero no se presente a la convocatoria ordinaria, será calificado como No presentado/a.

CONVOCATORIA EXTRAORDINARIA: ORIENTACIONES

Los criterios de evaluación serán los mismos que en la convocatoria ordinaria. La evaluación de las actividades realizadas a lo largo del curso (prácticas de ordenador, ejercicios, seminarios) será válida para las dos convocatorias del curso. En consecuencia, el alumnado que haya superado estas actividades a lo largo del curso, en la convocatoria extraordinaria solo tendrá que presentarse al trabajo individual. En el caso del alumnado que no haya superado la evaluación de dichas actividades o haya elegido la modalidad de evaluación final, en la convocatoria extraordinaria deberá realizar, también, una prueba complementaria diseñada para la evaluación de las actividades realizadas a lo largo del curso. Dicha prueba puede consistir en una exposición oral, una demostración ante un ordenador o una descripción escrita de los conocimientos prácticos abordados en las actividades planteadas a lo largo del curso.

MATERIALES DE USO OBLIGATORIO

Apuntes:

http://bellman.ciencias.uniovi.es/norberto/

materiales de e-gela

Bibliografía recomendada

Regresión y Diseño de Experimentos. Daniel Peña. Alianza Editorial.

Logistic Regression. A Self-Learning Test. D. G. Kleinbaum. Springer Verlag.

Davison, A. (2003), Statistical models. Cambridge University Press and Hall

Atkinson, Riani & Cerioli (2004), Exploring multivariate data with the forward search, Springer

Escofier B., Pages J.. Análisis Factoriales Simples y Múltiples. Objetivos, métodos e interpretación. Bilbao UPV/EHU, 1992

Greenacre M.J.. Theory and aplication of Correspondence Analysis. London Academic Press, 1984

Krzanowski W.J. (2000), Principles of Multivariate Analysis, Revised Edition, Oxford University Press

Peña D.. Análisis de Datos Multivariantes. Mc Graw-Hill, 2002

Ugarte, M.D. Militino, A.F. & Arnholt, A. (2009), Probability and Statistics with R, CRC/Chapman & Hall

Bibliografía de profundización

Applied Regression Analysis, 3rd Edition. N. R. Draper, H. Smith. Wiley

Linear Regression Analysis. G. A. Seber, A. J. Lee. Wiley

Linear Models. S. R. Searle. Wiley

Belsley, D. A., Kuh, E., and Welsch., R. E. (1980). Regression Diagnostics: Identifying

Influential Data and Sources of Collinearity. New York: Wiley.

Applied Logistic Regression. D. W. Hosmer, S. Lemeshow, SWiley.

Matrix Algebra Useful for Statistics. S. R. Searle. Wiley

REVISTAS

DIRECCIONES DE INTERNET DE INTERÉS

https://cran.r-project.org/doc/contrib/Faraway-PRA.pdf (Practical Regressiona and Anova using R. J. F. Faraway)

http://www.et.bs.ehu.es/~etptupaf/nuevo/ficheros/estad3/nreg1.pdf (Análisis de Regresión. Introducción Teórica y Práctica basada en R. Fernando Tusell