La muestra y la estadística descriptiva
Autor | Alfredo Ascanio Guevara |
Páginas | 25-56 |
25
Capítulo 2
La muestra y la estadística descriptiva
Este capítulo 2 presenta los conceptos básicos relativos al tamaño de la
muestra, los criterios para establecer la distribución de frecuencia y analizar
los estadígrafos principales de la estadística descriptiva.
Comienza con el asunto de la muestra ya que al existir la imposibilidad de
conocer los parámetros del universo, es necesario hacer los análisis con una
parte representativa de la población total. Igualmente, los resultados con base
en las muestras tienen que ser interpretados, para tener la seguridad de que se
pueden utilizar, como veremos más adelante en otro capítulo. Luego se tocará
el tema relativo a las variables y la distribución de frecuencias.
2.1 La muestra y selección del tamaño
La representatividad de la muestra es un asunto crítico para el análisis de
los datos, pues solamente si se somete una muestra aleatoria a un test de
signicación, es decir que exista una buena probabilidad que los valores de
la muestra representen las características de los parámetros del universo de
donde fue extraída, entonces podríamos inferir que la data y los resultados
que surgen de esa muestra son adecuados para tomar decisiones.
El tamaño de la muestra depende si el universo es nito o innito en cuanto
al número de personas, objetos o eventos. Se ha señalado que un universo
o población innita es aquella que sobrepasa los 100.000 sujetos, objetos o
eventos (R.Sierra Bravo,1982,p.188).
Es evidente que la estadística como herramienta analítica, es fundamental para
sacar el mejor partido de los hechos observados e incluso establecer políticas.
ESTADÍSTICA DEL TURISMO - ALFREDO ASCANIO GUEVARA
26
Entendiendo por políticas las reglas o guías que expresan los límites para que
pueda ocurrir la acción (Mintzberg, et.al, 1997, p.,7).
El conocimiento que podemos obtener al relacionar los datos cuantitativos,
bien sea con una recta de regresión o con una tabla de contingencia, serán
primero descriptivos para luego proceder al conocimiento signicativo,
pues los estadígrafos de una muestra no necesariamente corresponden a los
parámetros del universo de donde la muestra fue extraída.
El tamaño de la muestra es un asunto clave, pues se debe contar con un número
suciente de elementos elegidos al azar, para estar seguros que se representa
al universo ( Sierra Bravo, 1883,p. 185).
El tamaño de la muestra depende de cuatro factores, a saber:
1. El tamaño de la población (nita o innita)
2. El nivel de conanza que queremos adoptar
3. El error de estimación admitido y expresado en porcentaje
4. La desviación estándar o típica expresada por una sigma
Un criterio práctico y útil para establecer el tamaño de la población es señalar
que todo universo superior a los 100.000 sujetos, objetos o eventos se considera
una población innita y al contrario, todo universo menor de 100.000 sujetos,
objetos o eventos es considerada una población nita.
La fórmula para calcular el tamaño de la muestra para una población innita
es como sigue:
n = (sigma) 2 x p x q / (error) 2
El investigador establece que el nivel de conanza que desea aplicar:
supongamos que sea el 99,7%, entonces la sigma será igual a 3, y si el nivel de
conanza es 95,5% la sigma para ese caso es 2.
En la fórmula p y q son dos elementos que al ser sumados se obtiene el 100%,
como por ejemplo: p = el 80% de los turistas se alojan en casas familiares, y
q = el 20% restante lo hacen en hoteles.
El margen de error lo ja el investigador, el cual puede ir desde el 1%, pasando
por 2%, 3%, 4%, 5% y 10%. En la medida en que el margen de error sea mayor,
menor será el tamaño de la muestra, pero la precisión se vería comprometida.
CAP. 2 - LA MUESTRA Y LA ESTADÍSTICA DESCRIPTIVA
27
Se ha señalado que en las investigaciones en ciencias sociales ese error no
debe ser mayor del 6% (Richardson,1999).
Supongamos que una empresa turística desea hacer una investigación
de mercado sobre los comportamientos de los visitantes en una región
determinada, donde el censo ha señalado que los turistas allí llegan a 200.000
y que además y mediante un sondeo se conoció que el 80% de los turistas se
alojan en casas de familia y el 20% en la hotelería comercial.
Se necesita estimar el tamaño de la muestra para poder aplicar un cuestionario
y se pide trabajar con un nivel de conanza del 95,5% ( con 2 sigmas) y con
un error admitido del 3%, y siempre con la condición de que estamos en
presencia de una población mayor de 100.000 turistas en esa localidad, o sea
una población innita.
n = (sigma)2 x p x q / (error)2
n = (2)2 x 80 x 20 / (error)2
n = 4 x 80 x 20 / 9 = 6.400 / 9 = 711 visitantes a entrevistar
Supongamos ahora que se pretende investigar el comportamiento de los
visitantes que llegan a un Parque Nacional en una cantidad de 10.000 personas
y que siendo una población nita se debe adoptar la fórmula apropiada.
Igualmente se desea que el nivel de conanza sea del 95,5% (2 sigmas) y el
margen de error admitido 3%, pero se desconoce la relación de p x q, por lo
que se aplica en la fórmula la relación 50% y 50%:
n = (sigma)2 x p x q x N / (error)2 ( N – 1) + (sigma)2 por p x q
n = 4 x 50 x 50 x 10.000 / 9 ( 10.000 – 1) + 4 x 50 x 50
n = 100.000.000 / 89.991 + 10.000
n = 100.000.000 / 99.991
n = 1.000 visitantes a entrevistar.
Es prudente tomar un 20% más del resultado (Briones,1996, p. 94).
Por lo general al encuestar a la clientela podríamos estar en presencia de una
población nita de visitantes, que acuden al lugar y por un período de varios
meses como pueden ser 207 personas que presentan varias ocupaciones y
que en forma estraticada se pueden dividir en profesionales y comerciantes.
Para continuar leyendo
Solicita tu prueba