27/6/11

Universo y Muestra.

Una muestra es un conjunto de unidades, una porción del total, que nos representa la conducta del universo en su conjunto.

Una muestra, en un sentido amplio, no es más que eso, una parte del todo que llamamos universo y que sirve para representarlo.

Sin embargo, no todas las muestras resultan útiles para llevar a cabo un trabajo de investigación. Lo que se busca al emplear una muestra es que, observando una porción relativamente reducida de unidades, se obtengan conclusiones semejantes a las que lograríamos si estudiáramos el universo total. Cuando una muestra cumple con esta condición, es decir, cuando nos refleja en sus unidades lo que ocurre en el universo, la llamamos muestra representativa. Por lo tanto, una muestra representativa contiene las características relevantes de la población en las mismas proporciones en que están incluidas en tal población. Sus conclusiones son susceptibles de ser generalizadas al conjunto del universo, aunque para ello debamos añadir un cierto margen de error en nuestras proyecciones.

Las muestras pueden ser clasificadas, en una primera división en probabilísticas y no probabilísticas.

En las muestras probabilísticas, la característica fundamental es que todo elemento del universo tiene una determinada probabilidad de integrar la muestra, y esa probabilidad puede ser calculada matemáticamente con precisión. En las muestras no probabilísticas ocurre lo contrario y el investigador no tiene idea del error que puede estar introduciendo en sus apreciaciones.

Las muestras no probabilísticas más usadas son:
  •  Muestra accidental. Es aquella que se obtiene sin ningún plan preconcebido; las unidades elegidas resultan producto de circunstancias fortuitas. Si entrevistamos a los primeros 50 transeúntes que pasan por cierta calle o medimos la profundidad del mar a lo largo de un trayecto entre dos puntos cualesquiera, estaremos en presencia de una muestra accidental; los datos obtenidos podrán o no representar al universo en estudio. El investigador no puede saber hasta qué punto sus resultados podrán proyectarse, con confiabilidad, hacia el conjunto más amplio que desea conocer.
  • Muestra por cuotas. Consiste en predeterminar la cantidad de elementos de cada categoría que habrán de integrar la muestra. Así podemos asignar una cuota de 50 hombres y 50 mujeres a una muestra de 100 individuos, asumiendo que ésa es la distribución de la población total. Por más que esa presunción llegue a ser válida, no deja de existir cierta arbitrariedad en este modo de proceder, por lo que la rigurosidad estadística de las muestras por cuotas se reduce considerablemente.
  • Muestra intencional. Las unidades se eligen en forma arbitraria, designando a cada unidad según características que para el investigador resulten de relevancia. Se emplea, por lo tanto, el conocimiento y la opinión personal para identificar aquellos elementos que deben ser incluidos en la muestra. Se basa, primordialmente, en la experiencia de alguien con la población. Estas muestras son muy útiles y se emplean frecuentemente en los estudios de caso, por más que la posibilidad de generalizar conclusiones a partir de ellas, sea en rigor nula. En algunas oportunidades se usan como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.
  Muestras aleatorias.

Como dijimos, en ellas cada uno de los elementos del universo tiene una probabilidad determinada y conocida de ser seleccionado. Los procedimientos más usuales para la obtención de muestras aleatorias son:

  • Azar simple. Este procedimiento se inicia confeccionando una lista de todas las unidades que configuran el universo, numerando correlativamente cada una de ellas. Luego, mediante cualquier sistema (tabla de números al azar, programas de computación), se van sorteando al azar estos números hasta completar el total de unidades que deseamos que entren en la muestra. De este modo, la probabilidad que cada elemento tienen de aparecer en la muestra es exactamente la misma. Si cada uno de los elementos que integran la población no tiene la misma posibilidad de ser elegido, se habla entonces de una muestra viciada. Este método nos garantiza una selección completamente aleatoria, pero resulta muy lento y costoso, pues nos obliga a elaborar listas completas de todas las unidades de interés, lo que a veces es sencillamente imposible. Por este motivo, sólo se emplea cuando los universos son relativamente pequeños. Este método no será adecuado si, por ejemplo, queremos sacar una muestra de todas las personas analfabetas que existen en un país. En cambio, si nuestra intención es extraer una muestra del universo de todos los alumnos que ingresan a una universidad en un determinado año, resultará muy adecuado.
  • Azar sistemático. También se requiere de un listado completo de las unidades que integran el universo en estudio. Luego se efectúan las siguientes operaciones:

  • Se calcula la constante K, que resulta de dividir el número total de unidades que componen el universo por el número de unidades que habrán de integrar la muestra:

  • K = N/n
    Donde:
    N = número total de unidades que componen e universo.
    n = número total de unidades que integrarán la muestra.

  • Se efectúa un sorteo para elegir un número que sea inferior o igual al valor de K. Como primera unidad para integrar la muestra se elige aquella que, en la lista general, posea idéntico número de orden al sorteado. Si designamos con A este primer valor, la segunda unidad elegida será la que lleve el número A + K, la tercera corresponderá a A + 2K y así sucesivamente hasta llegar a A + (n - 1)K.

  • Supongamos un universo constituido por 2.800 elementos, del que deseamos obtener una muestra de 70 casos. Tenemos entonces:
    N = 2.800
    n = 70
    K = 2.800 / 70 = 40
    Ahora, mediante cualquier procedimiento, buscamos al azar un número entero cuyo valor figure entre los límites de 1 y 40. En este caso, el número elegido es el 32. Entonces, las unidades que pasarán a formar parte de la muestra serán las que lleven los siguientes números de orden:

    1° unidad
    32
    2° unidad
    32 + 40
    72
    3° unidad
    32 + 80
    112
    ....

    70° unidad
    32 + 2760
    2.792
    Las ventajas y desventajas de este procedimiento son casi idénticas a la de las muestras al azar simple. Los procedimientos computacionales hacen mucho más fácil efectuar el sorteo de las unidades y no existe el riesgo de que la muestra quede sesgada por algún tipo de regularidad que no conocemos y que esté presente en el universo.
    • Muestras por conglomerados. Esta técnica tiene utilidad cuando el universo que se requiere estudiar admite ser subdividido en universos menores de características similares a las del universo total. Se procede a subdividir el universo en un número finito de conglomerados y, entre ellos, se pasa a elegir algunos que serán los únicos que se investigarán; esta elección puede realizarse por el método del azar simple o por el del azar sistemático. Una vez cumplida esta etapa, puede efectuarse una segunda selección, dentro de cada uno de los conglomerados elegidos, para llegar a un número aún más reducido de unidades muestrales. La ventaja de esta técnica es que obvia la tarea de confeccionar el listado de todas las unidades del universo. Su desventaja mayor radica en que, al efectuarse el muestreo en dos etapas, los errores muestrales de cada una se van acumulando, lo que da un error mayor que para los métodos anteriores. La técnica de conglomerados suele utilizarse cuando queremos extraer muestras de los habitantes de un conjunto geográfico amplio, por ejemplo, una gran ciudad o un conjunto de pueblos, por lo que se procede a tomar cada pueblo o grupo de manzanas como un conglomerado independiente; del mismo modo, se la utiliza para conocer las reservas forestales y marinas, para estudiar las estrellas y otros casos semejantes.
    • Muestras estratificadas. Este método supone que el universo puede desagregarse en sub - conjuntos menores, homogéneos internamente pero heterogéneos entre sí. Cada uno de estos estratos se toma luego como un universo particular, de tamaño más reducido, y sobre él se seleccionan muestras según cualquiera de los procedimientos anteriores. Por ejemplo, si quisiéramos estudiar las actitudes políticas de los estudiantes de una universidad, podríamos subdividir en estratos de acuerdo con el tipo de estudios que cursen, suponiendo que estas actitudes van a ser diferentes entre quienes siguen Ingeniería, Letras, Medicina u otras carreras. Luego, efectuaríamos un muestreo dentro de cada sub - universo así definido para, finalmente, realizar un análisis integrando los resultados de todas las sub - muestras.
      Tanto en el muestreo estratificado como en el de conglomerados, la población se divide en grupos bien definidos. Usamos el muestreo estratificado cuando hay una amplia variación entre los grupos. Usamos el muestreo por conglomerados en el caso opuesto: cuando hay una variación considerable dentro de cada grupo, pero los grupos son esencialmente similares entre sí.
      
    Tamaño de la muestra y error muestral.
     Recordemos que la muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las características que definen a la población de la cual fue extraída, lo cual nos indica que es representativa. Es decir, que para hacer una generalización exacta de una población, es necesario tomar una muestra representativa. Por lo tanto, la validez de la generalización depende de la validez y tamaño de la muestra.

    Cuando trabajamos con muestras, generalmente se presentan dos tipos de errores:
     Error sistemático. Llamado de distorsión o sesgo de la muestra, se presentan por causas ajenas a la muestra:
    • Situaciones inadecuadas: se presentan, por ejemplo, cuando el encuestador tiene dificultades para obtener la información y la sustituye por la que más fácilmente está a su alcance, que no siempre es la más confiable.
    • Insuficiencia en la recolección de datos: hay distorsión por falta de respuestas, o respuestas inadecuadas, ya sea por ignorancia o falta de datos relativos a los elementos incluidos. Distorsiones del encuestador causadas por prejuicios, interés personal o por fallas en la aplicación de instrumentos.
    • Errores de cobertura a causa de que no se han incluido elementos importantes y significativos para la investigación que se realiza.
    • Error de muestreo o muestral. Cualquiera sea el procedimiento utilizado y la perfección del método empleado, la muestra diferirá de la población. A esta diferencia se la denomina error de muestreo.
    Cuando una muestra es aleatoria o probabilística, es posible calcular sobre ella el error muestral. Este error indica el porcentaje de incertidumbre, es decir, el riesgo que se corre de que la muestra elegida no sea representativa. Si trabajamos con un error calculado en 5%, ello significa que existe un 95% de probabilidades de que el conjunto muestral represente adecuadamente al universo del cual ha sido extraído.
    A medida que incrementamos el tamaño de la muestra, el error muestral tiende a reducirse, pues la muestra va acercándose más al tamaño del universo. Del mismo modo, para una muestra determinada, su error será menor cuanto más pequeño sea el universo a partir del cual se la ha seleccionado. Así, para un universo de 10.000 casos, una muestra de 200 unidades tendrá un error mayor que una de 300; una muestra de 200 casos, por otra parte, tendrá un error mayor si el universo tiene 10.000 unidades que si éste posee solamente 2.000.
    Para fijar el tamaño de la muestra adecuado a cada investigación, es preciso primero determinar el porcentaje de error que estamos dispuestos a admitir. Una vez hecho esto, deberán realizarse las operaciones estadísticas correspondientes para poder calcular el tamaño de la muestra que nos permite situarnos dentro del margen de error aceptado.
     A veces, sin embargo, el tamaño de la muestra queda determinado previamente por consideraciones prácticas; en tales casos, no hay otra alternativa que aceptar el nivel de error que su magnitud acarree.


    Bibliografía:
    Sabino, Carlos A. EL PROCESO DE INVESTIGACIÓN. Argentina (1996). Ed. Lumen - Humanitas.

     
    Puedes contactarme en twitter:
    @tesisdeinvestig
    @yaquelinfranco
    Siempre estaré en la disposición de ayudar

    1 comentario:

    1. Hola, leí esto "Sin embargo, no todas las muestras resultan útiles para llevar a cabo un trabajo de investigación." y me pareció interesante sin embargo ya no volviste a tocar el tema de si es posible hacer proyectos de tesis en los cuales no sean necesario hacer un muestreo por tener variables deterministas. Estoy en pleno desarrollo de mi tesis y propongo una aplicación para mejorar un proceso específico, según lo que me han dicho es que en muchos casos de tesis de ingeniería no aplica el muestreo ni la población, pero como puedo sustentar todo esto? gracias.

      ResponderEliminar