El tamaño de muestra del de una muestra estadística es el número de observaciones que lo constituyan. Es el típicamente denotado n, y es un número entero no negativo (número natural ).

Típicamente, diversos tamaños de muestra llevan a diversa precisión de la medida. Esto se puede ver en las reglas estadísticas tales como la ley de los grandes números y del teorema de límite central . Todo el ser otro igual, un más grande n del tamaño de muestra lleva a la precisión creciente en estimaciones de las varias características de la población .

Un ejemplo típico sería cuando un estadístico desea estimar el medio aritmético de una variable al azar continua (por ejemplo, la altura de una persona). Si se asume que tienen una muestra al azar con observaciones independientes, después si la variabilidad de la población (según lo medido por el σ de la desviación estándar ) se sabe, después el error estándar del medio de muestra es dado por la fórmula: del del
\ sigma \ raíz cuadrada {n}.

Es fácil demostrar que como el n llega a ser grande, esta variabilidad llega a ser muy pequeña. Esto rinde a pruebas más sensibles de la hipótesis con la energía estadística del mayor e intervalos de confianza más pequeños .

Con técnicas de muestreo más complicadas, tales como muestreo estratificado, la muestra se puede dividir a menudo en submuestras. Típicamente, si hay el k tales submuestras (de diversos estratos del k ) entonces cada uno de ellos tendrá un ni, i del tamaño de muestra = 1, 2,…, el k . Este el ni debe ajustarse a la regla ese n 1 + el n 2 +… + el k del del n = el n (es decir que el tamaño de muestra total es dado por la suma de los tamaños de la submuestra). La selección esta el ni se puede hacer óptimo de varias maneras, usar (por ejemplo) la asignación óptima de Neyman.

Otros ejemplos

Teorema de límite central

El teorema de límite central es un resultado significativo que depende de tamaño de muestra. Indica que mientras que el tamaño de una muestra de observaciones independientes se acerca a infinito, con tal que los datos vengan de una distribución con la variación finita, que la distribución de muestra del medio de muestra se acerca a de distribución normal.

Cálculo de proporciones

Una puntería estadística típica es demostrar con la certeza del 95% que el valor verdadero de un parámetro está dentro de un B de la distancia de la estimación : El B es una gama de error que disminuye con el aumento del tamaño de muestra ( n ). El valor del B generado se refiere como el intervalo de confianza del 95%.

Por ejemplo, una situación simple está estimando una proporción en una población . Para hacer así pues, un estadístico estimará los límites de un intervalo de confianza del 95% para una proporción desconocida .

La regla empírica para (un máximo o un “conservador ") el B para una proporción deriva del hecho el perito de una proporción, \ sombrero p = X/n, (donde está el número el X observaciones “positivas de”) tiene distribución binomial de a (escalada) y es también una forma del medio de la muestra (de una distribución de Bernoulli que tiene una variación máxima de 0.25 para el p del parámetro = 0. Así pues, el X / n del medio de muestra tiene máximo n de la variación 0. Para el suficientemente grande n (ésta significa generalmente que necesitamos haber observado por lo menos 10 respuestas positivas y 10 negativas), esta distribución será aproximada de cerca por un de distribución normal con el mismo medio y variación.

Usar esta aproximación, puede ser demostrado que el ~95% de la probabilidad de esta distribución miente dentro de 2 desviaciones estándar del medio. Debido a esto, un intervalo de la forma del

l (\, \ sombrero p +2 \ raíz cuadrada {0.25/n} del sombrero p -2 \ raíz cuadrada {0.25/n}) = (\ sombrero p -, \ sombrero p+B) de B

formará un intervalo de confianza del 95% para la proporción verdadera.

Si requerimos el ε del error de muestreo ser no más grande que algún B encuadernado, podemos solucionar la ecuación del

l \ varepsilon \ aproximadamente B=2 \ raíz cuadrada {0.25/n} =1/\ raíz cuadrada {n}

para darnos

1/\ varepsilon^2 \ aproximadamente 1/B^2=n del

Así pues, n de = B 100 <=> el = 10%, n de = B 400 <=> el = 5%, n = 1000 del <=> B el = ~3%, y n de = B 10000 <=> el = 1%. Uno ve estos números cotizados a menudo en informes de noticias de los sondeos de opinión y de otras encuestas por muestreo

Extensión a otros casos

Generalmente si un medio de la población se estima usar el medio de la muestra de observaciones del n de una distribución con el ² del σ de la variación, después si el n es bastante grande (típicamente >30) el teorema de límite central puede ser aplicado para obtener un intervalo de confianza aproximado del 95% del del de la forma (\ barra x -, \ barra x de B + B), B=2 \ sigma \ raíz cuadrada {n}

Si el ε del error de muestreo se requiere ser no más grande que el limitado B, como arriba, entonces el
4 \ sigma^2/\ varepsilon^2 \ aproximadamente 4 \ sigma^2/B^2=n del

Nota, si el medio es ser estimado usar los parámetros P que se deben primero estimar de la misma muestra, después preservar el suficiente " grados de la libertad, " el tamaño de la muestra debe ser por lo menos   del n ; +  P .

Tamaños de muestra Required para las pruebas de la hipótesis

Los estadísticos de un revestimiento del problema común están calculando el tamaño de muestra requerido para rendir cierta energía para una prueba, dada un tipo predeterminado α de la tarifa del error de I. Un ejemplo típico para esto es como sigue:

Dejar el X i , i = 1, 2,…, el n sea observaciones independientes tomadas de un de distribución normal con el μ y la variación malos σ2 . Consideremos dos hipótesis, una hipótesis nula :

H_0:\ mu=0

y una hipótesis alternativa: = \ mu^* de H_ a:\mu del del

l

para una cierta “diferencia significativa más pequeña” μ* >0. Éste es el valor más pequeño para el cual cuidamos sobre la observación de una diferencia. Ahora, si deseamos (1) al H 0 del rechazo con una probabilidad por lo menos de 1 β cuando El H a es verdad (es decir una energía de 1 β), y (2) el H 0 del rechazo con el α de la probabilidad cuando el H 0 es verdad, después necesitamos el siguiente:

Si el z α es el punto de porcentaje superior del α del de distribución normal estándar, entonces

\ banda (\ barra x >z_ {\} \ sigma \ raíz cuadrada {n} de la alfa|= \ alfa de H_0 \ del texto {verdad})

y tan

'rechazo H 0 si nuestro muestra promedio ( \ barra x) es más que z_ {\} \ sigma \ raíz cuadrada {n} de la alfa

es una regla de decisión que satisface (2). (La nota, ésta es una 1 prueba atada)

Ahora deseamos para que esto suceda con una probabilidad por lo menos 1 β cuando El H a es verdad. En este caso, nuestro promedio de la muestra vendrá de un de distribución normal con μ* malo. Por lo tanto requerimos

\ banda (\ barra x >z_ {\} \ sigma \ raíz cuadrada {n} de la alfa|H_a \) {verdadero} \ geq 1 \ del texto beta

Con la manipulación cuidadosa, esto se puede demostrar para suceder cuando n \ geq \ ^2 dejado (\ frac {\ Phi^ {- 1} (1 \ beta) +z_ {\ alfa}} {\ MU \ sigma} \ derecho) del

l

donde está la función el \ Phi de distribución acumulativa normal .

Ver también

Diseño de los experimentos
Muestreo (estadísticas)
Energía estadística
Muestreo estratificado

.

  • Zenithic
  • Istvan Bakx
    Random links:Lamnidae | Amadeus (película) | Hayder de Crimea | Kalkara

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">