Apoyo para Tesis y Trabajo de grado

Parte de mi aporte como profesional, docente e investigadora venezolana; a los estudiantes que buscan enriquecer sus conocimientos, sustentar sus trabajos y mejorar personal y profesionalmente. Éxitos¡¡¡

30/5/11

Determinación de Tamaños de Muestra para Estimaciones


Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con conceptos que ya se han visto a través de este material.


¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la media poblacional?. La respuesta depende del error estándar de la media, si este fuera cero, entonces se necesitaría una sola media que será igual necesariamente a la media poblacional desconocida , porque  = 0. Este caso extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras menor sea el error estándar de la media, menor es el tamaño de muestra necesario para lograr un cierto grado de precisión.
Se estableció antes que una forma de disminuir el error de estimación es aumentar el tamaño de la muestra, si éste incluye el total de la población, entonces  sería igual a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que el error de estimación sea tan pequeño como queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimación , se puede escoger un tamaño de muestra n tal que P() = Nivel de confianza. Con el propósito de determinar n. El error máximo de estimación esta dado por:
Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la ecuación resultante, obtenemos:
Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados fraccionarios.

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:
De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:

  1. Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 libras?
  2. Solución:
    En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95% de confianza en que  difiere en menos de 4 libras de .
  3. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real?
  4. Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas. ¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?
    Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como beneficio una estimación más exacta.
  5. Suponga que en el ejercicio anterior se tiene una población de 300 focos, y se desea saber de que tamaño debe de ser la muestra. El muestreo se realizará sin reemplazo.

Solución:Como se tiene una población finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor de corrección.
Si se tiene una población finita de 300 focos sólo se tiene que extraer de la población una muestra sin reemplazo de 56 focos para poder estimar la duración media de los focos restantes con un error máximo de 10 horas.

Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea menor que una cantidad específica.
Elevando al cuadrado la ecuación anterior se despeja y nos queda:
Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el tamaño de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporción de la población y ese valor se puede sustituir en la fórmula, pero si no se sabe nada referente a esa proporción entonces se tienen dos opciones:
  • Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimación de P. Después con el uso de la fórmula se podría determinar de forma aproximada cuántas observaciones se necesitan para proporcionar el grado de precisión que se desea.
  • Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se obtiene el tamaño de muestra mayor posible. Observe el siguiente ejemplo:

Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se sustituirán en la formula para observar los diferentes tamaños de muestras. El nivel de confianza que se utilizará es del 95% con un error de estimación de 0.30.
p
n
0.10
3.84
0.20
6.82
0.30
8.96
0.40
10.24
0.50
10.67
0.60
10.24
0.70
8.96
0.80
6.82
0.90
3.84


Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la muestra alcanza su máximo valor.

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:
De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
  1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02?
  2. Solución:Se tratarán a las 500 familias como una muestra preliminar que proporciona una estimación de p=340/500=0.68.
    Por lo tanto si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.
  3. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qué proporción del electorado conoce la opinión de ella, respecto al uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se necesita si se requiere un confianza del 95% y un error máximo de estimación de 0.10?

Solución:En este problema, se desconoce totalmente la proporción de residentes que conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p.
Se requiere un tamaño de muestra de 97 residentes para que con una confianza del 95% la estimación tenga un error máximo de 0.10.

Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta dado por:
En esta ecuación se nos pueden presentar dos casos:
  • Los tamaños de muestra son iguales.
  • Los tamaño de muestra son diferentes .

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja n ya que n1 es igual a n2.
Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.

Ejemplo:
Un director de personal quiere comparar la efectividad de dos métodos de entrenamiento para trabajadores industriales a fin de efectuar cierta operación de montaje. Se divide un número de operarios en dos grupos iguales: el primero recibe el método de entrenamiento 1, y el segundo, el método 2. Cada uno realizará la operación de montaje y se registrará el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan una desviación estándar aproximadamente de 2 minutos. Si se desea que la estimación de la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada grupo de entrenamiento?
Cada grupo debe contener aproximadamente 31 empleados.

Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta dado por:
En esta ecuación se nos pueden presentar dos casos:
  • Los tamaños de muestra son iguales.
  • Los tamaño de muestra son diferentes .

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja n ya que n1 es igual a n2.
Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.
Ejemplo:
Una compañía de productos alimenticios contrató a una empresa de investigación de mercadotecnia , para muestrear dos mercados, I y II, a fin de comparar las proporciones de consumidores que prefieren la comida congelada de la compañía con los productos de sus competidores. No hay información previa acerca de la magnitud de las proporciones Py P2. Si la empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con una probabilidad de 0.95, ¿ cuántos consumidores habrá que muestrear en cada mercado?
Se tendrá que realizar encuestas a 1201 consumidores de cada mercado para tener una estimación con una confianza del 95% y un error máximo de 0.04.

  1. Se probó una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40 defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a la verdadera fracción de elementos defectuosos.
  2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo, exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de montaje. Si la experiencia previa sugiere que  = 16 seg. mide la variación en el tiempo de montaje entre un trabajador y otro al realizar una sola operación de montaje, ¿cuántos operarios habrá que incluir en la muestra?
  3. El decano registró debidamente el porcentaje de calificaciones D y F otorgadas a los estudiantes por dos profesores universitarios de matemáticas. El profesor I alcanzó un 32%, contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente. Estime la diferencia entre los porcentajes de calificaciones D y F otorgadas por los dos profesores. Utilice un nivel de confianza del 95% e interprete los resultados.
  4. Suponga que se quiere estimar la producción media por hora, en un proceso que produce antibiótico. Se observa el proceso durante 100 períodos de una hora, seleccionados al azar y se obtiene una media de 34 onzas por hora con una desviación estándar de 3 onzas por hora. Estime la producción media por hora para el proceso, utilizando un nivel de confianza del 95%.
  5. Un ingeniero de control de calidad quiere estimar la fracción de elementos defectuosos en un gran lote de lámparas. Por la experiencia, cree que la fracción real de defectuosos tendría que andar alrededor de 0.2. ¿Qué tan grande tendría que seleccionar la muestra si se quiere estimar la fracción real, exacta dentro de 0.01, utilizando un nivel de confianza fe 95%?
  6. Se seleccionaron dos muestras de 400 tubos electrónicos, de cada una de dos líneas de producción, A y B. De la línea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la diferencia real en las fracciones de defectuosos para las dos líneas, con un coeficiente de confianza de 0.90 e interprete los resultados.
  7. Se tienen que seleccionar muestras aleatorias independientes de n1=n2=n observaciones de cada una de dos poblaciones binomiales, 1 y 2. Si se desea estimar la diferencia entre los dos parámetros binomiales, exacta dentro de 0.05, con una probabilidad de 0.98. ¿qué tan grande tendría que ser n?. No se tiene información anterior acerca de los valores P1 y P2, pero se quiere estar seguro de tener un número adecuado de observaciones en la muestra.
  8. Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de largueros de aluminio utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia pasada con el proceso de fabricación se supone que las desviaciones estándar de las resistencias a la tensión son conocidas. La desviación estándar del larguero 1 es de 1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm2. Se sabe que el comportamiento de las resistencias a la tensión de las dos clases de largueros son aproximadamente normal. Se toma una muestra de 10 largueros del tipo 1 obteniéndose una media de 87.6 Kg/mm2, y otra de tamaño 12 para el larguero 2 obteniéndose una media de 74.5 Kg/mm2. Estime un intervalo de confianza del 90% para la diferencia en la resistencia a la tensión promedio.
  9. Se quiere estudiar la tasa de combustión de dos propelentes sólidos utilizados en los sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustión de los dos propelentes tiene aproximadamente la misma desviación estándar; esto es 1=
2 = 3 cm/s. ¿Qué tamaño de muestra debe utilizarse en cada población si se desea que el error en la estimación de la diferencia entre las medias de las tasas de combustión sea menor que 4 cm/s con una confianza del 99%?.


Respuesta a los Problemas propuestos
  1. 0.07532  P  0.1246
  2. n= 44
  3. 0.0222  P1- P2  0.1978
  4. 33.412    34.588
  5. n= 6147
  6. 0.059  PB-PA  0.141
  7. n= 1086
  8. 12.22  1-2  13.98
  9. n= 8

No hay comentarios:

Publicar un comentario