El tamaño de muestra del de una muestra estadística es el número de observaciones que lo constituyan. Es el típicamente denotado n, y es un número entero no negativo (número natural ).
Típicamente, diversos tamaños de muestra llevan a diversa precisión de la medida. Esto se puede ver en las reglas estadísticas tales como la ley de los grandes números y del teorema de límite central . Todo el ser otro igual, un más grande n del tamaño de muestra lleva a la precisión creciente en estimaciones de las varias características de la población .
Un ejemplo típico sería cuando un estadístico desea estimar el medio aritmético de una variable al azar continua (por ejemplo, la altura de una persona). Si se asume que tienen una muestra al azar con observaciones independientes, después si la variabilidad de la población (según lo medido por el σ de la desviación estándar ) se sabe, después el error estándar del medio de muestra es dado por la fórmula:
Es fácil demostrar que como el n llega a ser grande, esta variabilidad llega a ser muy pequeña. Esto rinde a pruebas más sensibles de la hipótesis con la energía estadística del mayor e intervalos de confianza más pequeños .
Con técnicas de muestreo más complicadas, tales como muestreo estratificado, la muestra se puede dividir a menudo en submuestras. Típicamente, si hay el k tales submuestras (de diversos estratos del k ) entonces cada uno de ellos tendrá un ni, i del tamaño de muestra = 1, 2,…, el k . Este el ni debe ajustarse a la regla ese n 1 + el n 2 +… + el k del del n = el n (es decir que el tamaño de muestra total es dado por la suma de los tamaños de la submuestra). La selección esta el ni se puede hacer óptimo de varias maneras, usar (por ejemplo) la asignación óptima de Neyman.
Por ejemplo, una situación simple está estimando una proporción en una población . Para hacer así pues, un estadístico estimará los límites de un intervalo de confianza del 95% para una proporción desconocida .
La regla empírica para (un máximo o un “conservador ") el B para una proporción deriva del hecho el perito de una proporción, , (donde está el número el X observaciones “positivas de”) tiene distribución binomial de a (escalada) y es también una forma del medio de la muestra (de una distribución de Bernoulli que tiene una variación máxima de 0.25 para el p del parámetro = 0. Así pues, el X / n del medio de muestra tiene máximo n de la variación 0. Para el suficientemente grande n (ésta significa generalmente que necesitamos haber observado por lo menos 10 respuestas positivas y 10 negativas), esta distribución será aproximada de cerca por un de distribución normal con el mismo medio y variación.
Usar esta aproximación, puede ser demostrado que el ~95% de la probabilidad de esta distribución miente dentro de 2 desviaciones estándar del medio. Debido a esto, un intervalo de la forma de B
formará un intervalo de confianza del 95% para la proporción verdadera.
Si requerimos el ε del error de muestreo ser no más grande que alguÌn B encuadernado, podemos solucionar la ecuación
para darnos
del
Así pues, n de = B 100 <=> el = 10%, n de = B 400 <=> el = 5%, n = 1000 del <=> B el = ~3%, y n de = B 10000 <=> el = 1%. Uno ve estos números cotizados a menudo en informes de noticias de los sondeos de opinión y de otras encuestas por muestreo
Si el ε del error de muestreo se requiere ser no más grande que el limitado B, como arriba, entonces el
del
Nota, si el medio es ser estimado usar los parámetros P que se deben primero estimar de la misma muestra, después preservar el suficiente " grados de la libertad, " el tamaño de la muestra debe ser por lo menos   del n ; + P .
Dejar el X i , i = 1, 2,…, el n sea observaciones independientes tomadas de un de distribución normal con el μ y la variación malos σ2 . Consideremos dos hipótesis, una hipótesis nula :
y una hipótesis alternativa: = \ mu^* de H_ a:\mu del