template-browser-not-supported

Grado en Matemáticas

Back Back

Análisis de la Varianza y Regresión

Código asignatura
GMATEM01-4-005
Curso
Cuarto
Temporalidad
Primer Semestre
Carácter
Optativa
Créditos
6
Pertenece al itinerario Bilingüe
No
Actividades
  • Clases Expositivas (38 Hours)
  • Prácticas de Aula/Semina (6 Hours)
  • Prácticas de Laboratorio (14 Hours)
  • Tutorías Grupales (2 Hours)
Guía docente

NOMBRE

Análisis de la Varianza y Regresión

CÓDIGO

GMATEM01-4-005

TITULACIÓN

Grado en Matemáticas

CENTRO

Facultad de Ciencias

TIPO

Optativa

Nº TOTAL DE CRÉDITOS

6  ECTS

PERIODO

Cuarto curso

Primer cuatrimestre

IDIOMA

Español

COORDINADOR

TELÉFONO /EMAIL

UBICACIÓN

Ignacio Montes Gutiérrez

985103357 / imontes@uniovi.es

Despacho 185, Facultad de Ciencias

PROFESORADO

TELÉFONO /EMAIL

UBICACIÓN

Ignacio Montes Gutierrez985103357 / imontes@uniovi.esDespacho 185, Facultad de Ciencias

Análisis de la Varianza y Regresión es una asignatura optativa de 6 créditos ECTS que se imparte en el cuarto curso del Grado de Matemáticas. En ella se desarrollan dos técnicas de gran aplicación para el análisis de datos en numerosos campos de la ciencia: Economía, Ingeniería, Medicina, Biología, Química, Psicología, etc.

Los primeros temas están dedicados al manejo de los conceptos y  resultados teóricos asociados a las distribuciones multidimensionales; en particular nos centraremos en el estudio y propiedades de la normal multivariante y las distribuciones asociadas a su muestreo, de gran interés en problemas de estimación y contraste de hipótesis, que serán utilizadas en las técnicas posteriores.    

El análisis de la varianza (ANOVA) es una potente herramienta estadística de gran utilidad y aplicación en análisis de datos reales, ya que el objetivo principal de muchos experimentos consiste en determinar el efecto que sobre alguna variable dependiente tienen distintos  factores (variables independientes, usualmente discretas y controladas, como pueden ser la temperatura, la empresa que ha producido el bien, el día de la semana, etc.). Un aspecto al que debemos prestar especial atención cuando se trabaja con varios factores es la existencia de interacción entre ellos; es decir, el efecto que distintas combinaciones de factores pueden tener sobre los  otros. Se estudiará cómo se efectúa la descomposición de la variación de los datos en los distintos modelos, para poder asignarla a la fuente correspondiente  asi como las distribuciones asociadas a los test más usuales. Esta técnica es la base del diseño de experimentos y será aplicada también en el análisis de la regresión.

La regresión es otra herramienta estadística de muy amplio uso cuando se quiere establecer una relación entre un conjunto de variables independientes y una variable dependiente o respuesta. Se utiliza fundamentalmente en estudios en los que no se controlan, por diseño, los valores de las variables independientes (como ocurría en el caso ANOVA).

Los objetivos de un estudio de regresión pueden ser dos:

  • Obtener una ecuación que nos permita "predecir" el valor de la variable dependiente una vez conocidos los valores independientes.
  • Cuantificar la relación entre las variables independientes y la variable respuesta con el fin de conocer o explicar mejor los mecanismos de esa relación. Este enfoque se presenta cuando se busca encontrar qué variables afectan a la variable respuesta.

Un problema que se plantea a la hora de construir un modelo es qué variables independientes incluir en la ecuación, de tal manera que el modelo obtenido sea  “bueno” y “sencillo”. En la solución de este problema se utilizan técnicas inferenciales basadas en hipótesis de normalidad, por lo que su aplicación está supeditada a la verificación de estos supuestos.

También se aborda el problema de regresión logística, de aplicación cuando la variable respuesta es dicotómica (por ejemplo padecer una enfermedad o no), en este caso el objetivo será predecir o buscar un modelo para explicar cuál es la probabilidad de que la variable respuesta tome cada uno de los valores. Este modelo es de amplio uso en medicina y epidemiología por estar relacionado con el uso de los odds-ratio.

Finalmente se estudiará el caso en el que aparezcan variables cuantitativas y factor, simultameamente, a través del Ancova.

Se recomienda que el estudiante tenga aprobadas las asignaturas del módulo de Estadística:

·       Estadística Descriptiva y Probabilidad de Primer Curso.

·       Probabilidades y Estadística de Segundo Curso.

·       Inferencia Estadística de Tercer Curso.

Así mismo, se requiere manejar el cálculo matricial y el cálculo diferencial en varias variables, y programación en R.

Las competencias que el alumno adquiere con este módulo son las siguientes:

CG1, CG2, CG3, CG4, CG5, CG6, CG7, CG8, CE1, CE2, CE3, CE4, CE5, CE6, CE7, CE8, CE9,

CE10, CT1, CT2, CT3, CT4, CT5.

Estas competencias están asociadas a los siguientes resultados del aprendizaje:

· Manejar las distribuciones multidimensionales y de los distintos tipos de independencia que pueden aparecer entre sus componentes.

· Aplicar las propiedades del modelo normal multidimensional para el cálculo de probabilidades relacionadas con el mismo.

· Reconocer y manejar las distribuciones asociadas a formas cuadráticas sobre la normal multivariante.

· Plantear y resolver test de hipótesis y regiones de confianza asociados a problemas reales relacionados con la distribución Normal multidimensional.

· Saber aplicar el ANOVA, con ayuda de un paquete estadístico.

· Interpretar los distintos valores que aparecen en una tabla ANOVA.

· Estudiar la aditividad de un modelo Anova con varios factores.

· Identificar y resolver problemas relacionados con el ANOVA y MANOVA.

· Estimar e interpretar los parámetros que intervienen en un modelo lineal.

· Realizar inferencias sobre los parámetros del modelo de regresión.

· Construir intervalos de predicción para la variable dependiente.

· Evaluar el ajuste del modelo encontrado.

· Validar un modelo de regresión.

. Conocer las ventajas y las limitaciones de los modelos lineales.

· Entender los modelos Logit y Probit como modelos que permiten trabajar con variables respuesta categóricas.

· Interpretar los resultados de regresión logística binaria.

· Manejar paquetes estadísticos para la resolución de problemas reales.

· Elaborar informes estadísticos, con los resultados de un análisis de datos reales.

Según la Memoria de verificación del Título de Grado, los contenidos de esta asignatura son:

· Análisis de la varianza: Planteamiento del modelo. Test F. Comparaciones múltiples. Verificación de las hipótesis básicas del modelo. Utilización de paquetes estadísticos. 


· Regresión lineal múltiple: Estimadores mínimo cuadráticos. Contrastes de hipótesis. Intervalos de confianza. El problema de la multicolinealidad. Construcción de modelos de regresión. Utilización de paquetes estadísticos. 


Estos contenidos se desarrollarán de acuerdo al siguiente temario:

Tema 1.- Vectores aleatorios multidimensionales.

Caracterización de un vector aleatorio multidimensional. Función de distribución, densidad y de probabilidad. Vectores aleatorios discretos y absolutamente continuos. Distribuciones marginales y condicionadas. Independencia. Vector media y matriz de varianzas-covarianzas. Transformaciones de vectores aleatorios, caso lineal.

Tema 2.- La distribución Normal p-dimensional.

Introducción a la normal multivariante. Propiedades más importantes. Formas cuadráticas asociadas a la normal. Matrices normales de datos. Distribuciones de Wishart, T2 de Hotelling, Wilks.Verosimilitud y estimaciones en la familia normal p-dimensional. Tests más usuales sobre la media y la varianza, test Manova.

Tema 3 .-  Regresión lineal.

Introducción.  Estimadores de los parámetros (mínimos cuadrados y MV).  Teorema de Gauss-Markov.  Test de hipótesis e intervalos de confianza para los coeficientes de regresión y para las predicciones. Coeficiente de correlación. Test sobre el coeficiente de correlación. Correlaciones múltiple y parcial. Análisis de residuales. El problema de la multicolinealidad. Construcción de modelos de regresión.

Tema 4.- Anova unifactorial.

Modelo de efectos fijos: conceptos básicos, planteamiento del modelo, descomposición de la variabilidad total, test F. Comparaciones múltiples: tests de Scheffé, Tukey, S-N-K. Tests para la igualdad de varianzas. Transformaciones de los datos iniciales. Modelo de efectos aleatorios. Inferencias sobre los parámetros.

Tema 5.- Anova bifactorial.

Anova con varios factores: aditividad e interacción. Anova bifactorial: planeamiento de los modelos fijos aleatorio y mixto, descomposición de la variación total, Tests F. Inferencias sobre los parámetros.

Tema 6.-  Regresión logística.

Introducción al modelo logit. Relación con los odds-ratio. Estimaciones y contraste de hipótesis sobre los parámetros del modelo logístico.

Tema 7 .-  Análisis de la covarianza.

Modelo con una variable explicativa continua y otra discreta.

6. Metodología y plan de trabajo

De acuerdo con las pautas que establece el EEES, la asignatura se desarrollará mediante actividades presenciales y trabajo autónomo del estudiante.

Las actividades presenciales son aquellas en las que está presente el profesor. Se dividen en clases expositivas, prácticas de laboratorio, seminarios o prácticas de aula, tutorías grupales y sesiones de evaluación.

  • Clases expositivas (CE): En estas clases se presentan los contenidos teóricos de la materia junto con algunos ejemplos y ejercicios que aclaren los aspectos más importantes. Los estudiantes dispondrán de los apuntes de cada tema. Se utiliza la pizarra y los diferentes medios audiovisuales.
  • Clases prácticas de laboratorio (PL): Son imprescindibles en el desarrollo de esta asignatura para la resolución de problemas Se utilizará el programa de software libre R para analizar datos.
  • Prácticas de aula (PA): Dedicadas a la resolución de ejercicios teóricos y problemas relacionados con el análisis estadístico de datos experimentales. Se pretende que los estudiantes:
    • refuercen las competencias relacionadas con el razonamiento abstracto;
    • sepan expresar los objetivos de un problema en términos estadísticos, analizar los datos desde un punto de vista inferencial y extraer las conclusiones correspondientes.
  • Tutorías grupales (TG): Estas clases están dirigidas a realizar un seguimiento de los estudiantes, para ayudarles en su proceso de aprendizaje, resolver sus dudas, afianzar sus conocimientos y comprobar su grado de adquisición de competencias y destrezas.
  • Sesiones de evaluación (SE): Se dedicarán exclusivamente a la realización de pruebas escritas con las que se pueda valorar de forma objetiva el nivel alcanzado por los estudiantes en la adquisición de las competencias previstas.
  • De forma excepcional, si las condiciones sanitarias lo requieren, se podrán incluir actividades de docencia no presencial. En cuyo caso, se informará al estudiantado de los cambios efectuados.

TRABAJO PRESENCIAL

TRABAJO NO

PRESENCIAL

Temas

Total

Expo

PA

PL

TG

EVa

Total

en Grupo

Individual

Total

Tema 1

8

3

1

4

4

4

Tema 2

21

6

1

3

10

3

8

11

Tema 3

50

11

1

5

17

15

15

30

control

8

1

1

2

5

7

Tema 4

15

4

1

2

7

2

6

8

Tema 5

13

3

1

1

5

3

5

8

Tema 6

10

3

1

1

5

1

4

5

Tema 7

8

3

2

5

1

2

3

repaso

8

2

1

3

1

5

6

Examen Final

9

3

3

2

6

8

Total

150

35

6

14

2

3

60

30

60

90

MODALIDADES

Horas

%

Totales

Presencial

Clases Expositivas

35

58.3

60

Práctica de aula / Seminarios / Talleres

6

10,0

Prácticas de laboratorio / campo / aula de informática / aula de idiomas

14

23.3

Prácticas clínicas hospitalarias

Tutorías grupales

2

3.3

Prácticas Externas

Sesiones de evaluación

3

5.0

No presencial

Trabajo en Grupo

30

33.3

90

Trabajo Individual

60

66.6

Total

150

La asignatura se evaluará mediante las aportaciones en las clases de laboratorio así como la realizacion de los trabajos encomendados a lo largo del curso. Estos aspectos serán considerados dentro de la evaluación continua, y un examen final que se realizará en las convocatorias oficiales.

Competencias evaluadas en cada tipo de prueba

Prueba

Competencias

Examen escrito

CG1, CG2, CG3, CG4, CG5, CG6, CG7, CG8, CT1,CT2, CE1, CE2,CE3,CE4,CE5, CE6,CE7,CE8,CE9,CE10.

Participación en clases y realización de trabajos

CG1, CG2, CG3, CG4, CG5, CG6, CG7, CG8, CT1,CT2, CT3,CT4.CT5 CE1,CE6,CE7,CE8,CE9,CE10.

La evaluación continua representa un 80 % de la puntuación final. Para su calificación se tendrán en cuenta los siguientes elementos:

  • [EJ] Ejercicios, trabajos y exposiciones desarrollados (60% de la puntuación final).
  • [PL] Prácticas de laboratorio (20% de la puntuación final).

La participación activa del alumno en el desarrollo de la asignatura no se tendrá en cuenta (0% de la puntuación final).

El restante 20% de la puntuación final se obtendrá a través de dos exámenes parciales de carácter teórico o práctico ([EX1] y [EX2], cada uno correspondiente a un 10% de la calificación final).

La puntuación final de la asignatura se calculará de la siguiente manera:

Puntuación Final= 0,60 * EJ + 0,20 * PL + 0.10 * EX1 + 0.10 * EX2              

donde EJ, PL, EX1 y EX2 se calculan sobre diez puntos.

En las convocatorias extraordinarias cada estudiante podrá optar por mantener la puntuación obtenida en la parte de evaluación continua (EJ y PL) o realizar las tareas de recuperación que se le propongan de manera individualizada. Estas tareas serán fijadas en tutorías con los profesores de la asignatura antes la convocatoria correspondiente.

Los alumnos con dedicación a tiempo parcial, semipresencial o no presencial deberán decidir al inicio de curso si se acogen al sistema de evaluación continua o a una prueba única. En el primer caso, las entregas de ejercicios, tutorías grupales o prácticas de laboratorio se ajustarán a sus necesidades, pudiéndose sustituir por tutorías o actividades “on-line” y tutorías individualizadas. La puntuación final se calcula con la fórmula previamente descrita. Cuando opte por una prueba única, su puntuación será la calificación final.

De forma excepcional, si las condiciones sanitarias lo requieren, se podrán incluir métodos de evaluación no presencial. En cuyo caso, se informará al estudiantado de los cambios efectuados

Bibliografia Básica

Multivariate Analysis

Mardia

Academic Press

1979

Regresión y diseño de experimentos

Peña, D.

Alianza Universidad

 2010

Bibliografía complementaria

Título

Autor

Editorial

Edición

Probabilidad y Estadística

Canavos, G.

MacGraw-Hill (Interamericana)

 2003

Applied regression analysis

Draper, N.R., Smith, H.

JohnWiley Son

 1998

Applied Logistic Regresion

Hosmer y Lemeshow

Wiley

 1989

Logistic Regresion

Kleinbaum, David G., Klein, Mitchel .

Springer

 2010

Clasical and modern regression with applications

Myers, R.H

Duxbury Press

 1990

Estadística para Ingenieros y Científicos

Navidi, William

MacGraw-Hill

 2006

Matrix algebra useful for statistics

Searle, S.R.

Wiley

 1982

Linear regression analysis

George A. F. Seber, Alan J. Lee

Wiley

 2003