INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010 Cuadernillo 2 PLANTILLA
El alumno deberá entregar este segundo cuadernillo al profesor-tutor de su centro asociado o al profesor-tutor del campus (según el caso) que le haya sido asignado antes del 19 de enero del 2010 Disponemos de los datos de todos los profesores de las universidades públicas (48) durante el curso 2007-08: universidad a la que pertenecen, sexo y edad ( http://www.ine.es ). Se resumen los datos en la siguiente Tabla: Sexo Edad
Mujer
Varon
Total
65-69
2721
609
3330
60-64
5759
1819
7578
55-59
8330
3457
11787
50-54
9096
4567
13663
45-49
10373
5985
16358
40-44
10331
6471
16802
35-39
8275
6000
14275
30-34
5255
4399
9654
25-29
2210
2282
4492
20-24
171
194
365
62521
35783
98304
1. a) Si elegimos un profesor al azar ¿Cuál es la probabilidad de que sea mujer?. Solución: P( M)
35783 98304
0,36
2. a) Si elegimos al azar 6 profesores ¿cuál es la probabilidad de que la mitad sean hombres y la otra mitad mujeres? Solución:
n x n x p q x
f x PX x
6 6! 0,64 3 0,36 63 0,64 5 0,36 63 20 0,262 0,0467 0,245 3! 6 3! 3
f x
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010 Cuadernillo 2 PLANTILLA
b) Si vamos eligiendo aleatoriamente uno a uno ¿cuál es la probabilidad de que necesitemos 6 elecciones para obtener 3 mujeres? Solución: Será la probabilidad de que en los 5 primeros ensayos haya 2 mujeres por la probabilidad de que en el sexto ensayo sea mujer. Es decir:
5 2 5 2 0 , 36 0 , 64 ·0,36 10·0,13·0,26 ·0,36 0,122 2
Sabiendo que la variable Edad se distribuye normalmente, con media 46 y desviación típica 10, responda a las preguntas 3, 4 y 5. 3. ¿Cuál es el percentil 75 de la distribución?
Solución: P75 z 0,67 (Tabla IV) 0,67 P75
P75 46
10 0,67·10 46 52,70
4. ¿Qué número de profesores, aproximadamente, se encuentra entre los valores 29,5 y 44,5?
Solución: X = 44,5
→
z = (44,5-46)/10 = -0,15
X = 29.5
→
z = (29,5-46)/10 = -1,65
→
→
p = 0,4404 0,4404 (Tabla III) p = 0,0495 (Tabla III)
0,4404 -0,0495 = 0,3909 El 39,09% de los profesores se encuentra entre los valores 29,5 y 44,5, 44,5, es decir, 98304 x 0,3909 38427 profesores. →
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010 Cuadernillo 2 PLANTILLA
5. ¿Entre qué valores se encontrará el 50% de los valores centrales de la variable Edad? Solución: P25 z 0,67 (Tabla III)
0,67 P25
P25 46
10 0,67·10 46 39,30
P75 z 0,67 (Tabla IV) 0,67 P75
P75 46
10 0,67·10 46 52,70
El 50% de los valores centrales de la variable Edad se encuentra entre 39,30 y 52,70.
6. Si no dispusiéramos de los datos poblacionales, y quisiéramos estimar la media de edad del profesorado a partir de una muestra ¿qué tipos de muestreo aleatorio podemos utilizar? Solución: Podríamos utilizar los muestreos por estratificado, conglomerado y polietápico
Muestreo estratificado Podríamos realizar la selección en función del número de profesores de cada sexo.
Muestreo por conglomerado Se selecciona al azar algunas universidades, luego algunas facultades dentro de cada universidad, después algunas asignaturas dentro de cada facultad. La muestra estará formada por todos los profesores de las asignaturas seleccionadas.
Muestreo polietápico Sería una combinación de los dos anteriores.
7. Si no dispusiéramos de los datos poblacionales (pero sabemos que la desviación típica de la población es igual a 10) y quisiéramos estimar la media de la edad del profesorado, con un nivel de confianza del 95 % y un error máximo de 4 puntos ¿cuál debería ser el tamaño n de la muestra? Extraemos una muestra aleatoria de n
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010 Cuadernillo 2 PLANTILLA
profesores y obtenemos una media muestral de 47,5 años, ¿entre qué valores estimaremos que se encuentra la media poblacional?
Solución:
Tamaño de la muestra n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV)
n
1,96 2 10 2 42
24
n = 24 es el tamaño muestral mínimo para no superar un E máx = 4, con un nivel de confianza de 0,95.
Límites del intervalo de confianza Li = X - z 1-/2 Ls = X + z1-α/2
n
n
= 47,5-4 = 43,5 = 47,5+4= 51,5
Para un nivel nivel de confianza del 95%, se estima que la edad edad media de profesores de las universidades públicas está entre 43,5 y 51,5 años.
los
8. Queremos estimar el número medio de horas semanales que los profesores dedican a la docencia para un nivel de confianza del 95%. Seleccionamos aleatoriamente una muestra de 400 profesores y les pedimos que que nos indiquen el número de horas semanales que dedican impartiendo clase. Analizados estos datos obtenemos una media de 12,5 horas y una cuasidesviación típica de 4,5. ¿Cuál es el error de estimación máximo de la media? ¿Entre qué valores estimaremos que se encuentra el parámetro?
Solución:
Error de estimación máximo de la media n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV) normal
4
→
Aproximación de la t de Student a la
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010 Cuadernillo 2 PLANTILLA
E máx z 0,995
S n1 n
1,96
4,5 400
0,44
Límites del intervalo de confianza Li = X - z 1-/2 Ls = X + z 1-/2
S n 1 n S n1
= 12,5 - 0,44 = 12,06
n
= 12,5 + 0,44 = 12,94
Para un nivel de confianza confianza del 95%, se estima que el tiempo medio que los profesores de las universidades públicas dedican a impartir clases está entre 12,06 y 12,94 horas semanales.
9. Queremos estimar la proporción de profesores que se dedican a la investigación para un nivel de confianza del 95%. Seleccionamos una muestra aleatoria de 144 profesores y obtenemos una proporción de 0,6 ¿Cuál es el error de estimación máximo? ¿Entre qué valores se encuentra el parámetro? Solución:
Error de estimación máximo de la proporción n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV) P = 0,60 Se cumple la condición para la aproximación a la normal: nP(1-P)
≥
5
→
144(0,60)(0,40) = 34,56
Emáx = 1,96
(0,60)(0,40) 144
0,08
Límites del intervalo de confianza L i 0,60 0,08 052 L S 0,60 0,08 0,68
Para un nivel de confianza del 95%, se estima que la proporción de profesores profesores de las universidades públicas que se dedican a la investigación está entre 0,52 0,52 y 0,68.
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Curso 2009-2010 Cuadernillo 2 PLANTILLA
10. Queremos conocer la satisfacción laboral de los profesores. Seleccionamos aleatoriamente una muestra muestra de 400 profesores y medimos esa variable en una una escala de intervalo (de 0 a 10) obteniendo una satisfacción media igual a 8 y una cuasidesviación típica de 9. Para un nivel de confianza del 95%, ¿cuál es el error de estimación máximo de la media? ¿Entre qué valores estimaremos que se encuentra la satisfacción media de toda la población de profesores de las universidades públicas durante el curso 2007-08?
Solución:
Error de estimación máximo de la media n.c. = 0,95 → z1-α/2 = z0,975 = 1,96 (Tabla IV)
→
Aproximación de la t de Student a la
normal E máx z 0,995
S n1 n
1,96
9 400
0,88
Límites del intervalo de confianza Li = X - z 1-/2 Ls = X + z1-α/2
S n 1 n S n1 n
= 8 - 0,88 = 7,12 = 8 + 0,88 = 8,88
Para un nivel nivel de confianza del 95%, se estima que la satisfacción satisfacción media de los profesores de las universidades públicas es un valor entre 7,12 y 8,88 en una escala de 0 a 10.
6