En las estadísticas, un intervalo de confianza del (CI) es una estimación del intervalo de un parámetro de población . En vez de estimar el parámetro por un solo valor, un intervalo de estimaciones probables se da. Cómo las estimaciones están probablemente es determinado por el coeficiente de confianza. Cuanto más probable es para que el intervalo contenga el parámetro, más ancho el intervalo será.

Los intervalos de confianza se utilizan para indicar la confiabilidad de una estimación. Por ejemplo, un ci se puede utilizar para describir cómo son los resultados confiables del examen. En igualdad de circunstancias, un resultado del examen con un pequeño ci es más confiable que un resultado con un ci grande.

En un sentido más estrecho, un ci para un parámetro de población es un intervalo con un asociado p de la proporción que se genere de una muestra escogida al azar de una población subyacente tales que si el muestreo fuera repetido las épocas numerosas y el intervalo de confianza recalculado de cada muestra según el mismo método, un p de la proporción de los intervalos de confianza contendría el parámetro de población en la pregunta. Los intervalos de confianza son la forma más frecuente de la valoración de intervalo .

Si el U y el V son estadísticas (es decir, las variables al azar observable cuya distribución de probabilidad depende de un cierto θ inobservable del parámetro, y \ banda (U< \ thetal |\ theta) =x (donde está un número el x entre 0 y 1)

entonces el intervalo al azar ( U,   El V ) es un " 100 % del intervalo de confianza del x para el θ". El x del número (divulgado a veces como porcentaje (100%· x )) se llama el nivel de confianza o el coeficiente de confianza. En práctica aplicada moderna, la mayoría de los intervalos de confianza se indican en el nivel del 95% (ZAR 1984).

Los intervalos de confianza desempeñan un papel similar en las estadísticas de Frequentist al intervalo de la credibilidad en las estadísticas Bayesian .

Ejemplo práctico

Una máquina llena las tazas de la margarina, y se supone para ser ajustada de modo que el contenido malo de las tazas esté cercano a 250 gramos de margarina. Por supuesto no es posible llenar cada taza de exactamente 250 gramos de margarina. Por lo tanto el peso del relleno se puede considerar para ser un X de la variable al azar. La distribución del X se asume aquí para ser una de distribución normal con el μ desconocido de la expectativa y (por simplicidad) el σ sabido de la desviación estándar = 2. Para comprobar si la máquina se ajusta adecuado, una muestra del n = 25 tazas de margarina se elige al azar y las tazas pesadas. Los pesos de margarina son X_1, \ puntean, X_ {25} , una muestra escogida al azar del X .

Para conseguir una impresión del μ de la expectativa, es suficiente dar una estimación. El perito apropiado es el medio de muestra: \ sombrero \ mu= \ barra X= \ frac {1} {n} \ ^n X_i. del

l del sum_ {i=1}

La muestra demuestra los pesos reales x_1, \ puntos, x_ {25} , con medio: del

l \ x= de la barra \ frac {1} {25} \ x_i del ^ del sum_ {i=1} {25} = 250.

Si recogemos otra muestra de 25 tazas, podríamos esperar fácilmente encontrar valores como 250. Un valor medio de muestra de 280 gramos sin embargo sería extremadamente raro si el contenido malo de las tazas está de hecho cerca de 250g. Hay un intervalo entero alrededor del valor observado 250.2 del medio de muestra dentro de el cual, si el medio de población entero toma realmente un valor en esta gama, los datos observados no serían considerados particularmente inusuales. Tal intervalo se llama un intervalo de confianza para el μ del parámetro. ¿Cómo calculamos tal intervalo? Las puntos finales del intervalo tienen que ser calculadas de la muestra, así que son las estadísticas, funciones del, \ puntean de la muestra X_1, X_ {25} y por lo tanto las variables al azar ellos mismos.

En nuestro caso podemos determinar las puntos finales considerando que el del medio de muestra \ la barra X de una muestra normalmente distribuida también está distribuido normalmente, con el mismo μ de la expectativa, pero con el \ la sigma \ raíz cuadrada {n} del error estándar = 0. Por estandardizando nosotros conseguimos una variable al azar Z del

l = \ = \ frac {\ barra X \ MU} {0.5} del frac {\ barra X \ MU} {\ sigma \ raíz cuadrada {n}}

dependiente en μ, pero con una independiente de distribución normal estándar del μ del parámetro que se estimará. Por lo tanto es posible encontrar &minus de los números; z y z, independiente del μ, donde el Z miente mientras tanto con la probabilidad 1  −  α, una medida de cómo es confidente queremos ser. Tomamos 1  −   α = 0. Tenemos tan: P del

l (- z \ le Z \ le z) = 1 \ alfa = 0. El z del número sigue de: \ phi del

l (z) = P (Z \ le z) = 1 - \ frac {\ alfa} 2 = 0.975 \, z= del de \ Phi^ {- 1} (\ = \ Phi^ {- 1} (0.96 \, de la phi (z)),

(véase el probit y la función de distribución acumulativa ), y nosotros conseguir:

0.95 = 1 \ alpha=P (- z \ le Z \ le z)=P \ ido (- 1.96 \ le \ frac {\ barra X \ MU} {\} \ le 1.96 \ de la sigma \ raíz cuadrada {n}) derecho


=P \ ido (\ barra X - 1.96 \ frac {\ sigma}} \ le \ MU \ le \ barra X + 1.96 \ frac {\ sigma} {\ raíz cuadrada {n}} \) derecho {\ raíz cuadrada {n} el =P del

l del
\ salió (\ barra X - 1.5 \ le \ MU \ le \ barra X + 1.5 \ derecho) de el =P del

l del
\ se fue (\ barra X - 0.98 \ le \ MU \ le \ barra X + 0.

Esto se pudo interpretar como: con la probabilidad 0.95 a una elegiremos un intervalo de confianza en el cual resolvamos el μ del parámetro entre las puntos finales estocásticas, pero eso no significa que la posibilidad de resolver el μ del parámetro en intervalo de confianza es el 95%: del

l \ barra X - 0 {.}98

y del \ de la barra X + 0.

Cada vez que se repiten las medidas, habrá otro valor para el \ la barra malos X de la muestra. En el 95% de casos el μ estará entre las puntos finales calculadas de este medio, pero en el 5% de los casos no estará. El intervalo de confianza real es calculado incorporando los pesos medidos en la fórmula.95 intervalos de confianza se convierten: del

l (\ barra x - 0. \,

Este intervalo ha fijado las puntos finales, en donde el μ pudo estar mientras tanto (o no). No hay probabilidad de tal acontecimiento. no podemos decir: " con la probabilidad (1  −  el α) el μ del parámetro miente en la confianza interval." Sabemos solamente eso por la repetición en 100 (1  −  el α) % del μ de los casos estará en el intervalo calculado. En 100α % de los casos sin embargo no hace. Y desafortunadamente no sabemos en cuáles de los casos sucede esto. Ése es porqué decimos: con el nivel de confianza del 100 (1  −  del μ del α) % miente en la confianza interval."

El cuadro siguiente demuestra 50 realizaciones de un intervalo de confianza para el μ. Observación de los medios de muestra que elegimos de la población de todas las realizaciones. Allí la probabilidad es el 95% que terminamos para arriba elegir un intervalo que contenga el parámetro. Después de la realización apenas tenemos nuestro intervalo elegido. Según lo visto del cuadro había una ocasión justa que elegimos un intervalo que contiene el μ; sin embargo pudimos ser desafortunados y haber escogido el incorrecto. Nunca sabremos; nos pegan con nuestro intervalo.

Ejemplo teórico

Suponer el X 1,…, el n del del X son una muestra independiente de una población normalmente distribuida con el μ y la variación σ2 del medio . Dejar del

l \ overline {X} = (X_1+ \ cdots+X_n), \, de /n

S^2= \ frac {1} {n-1} \ ^n del sum_ {i=1} \ (X_i- \ overline {} \, de X \ derecho) ^2. dejado del

Entonces T= del

l \ frac {\ - \ MU} {s \ raíz cuadrada {n} del overline {X}}

tiene distribución T de un estudiante con &minus del n ; 1 grado de libertad. Observar que la distribución del T no depende de los valores del μ de los parámetros y del σ2 inobservables; es decir, es una cantidad giratoria .o porcentaje de esta distribución, entonces el \ banda del

l \ salió (- c

(Nota: " 95th" y " 0.9" estar correcto en las expresiones precedentes. Hay una ocasión del 5% que el T será menos que − c y una ocasión del 5% que sea más grande que + el c . Así, la probabilidad que el T estará entre el − el c y + el c es el 90%.)

Por lo tanto \ banda \ (\ overline {X} - < \ mu< \ overline {X} +cS/\ raíz cuadrada {n} \ derecho) del cS/\ raíz cuadrada {n} =0.9 dejado del

l \,

y tenemos un intervalo de confianza (estocástico) teórico del 90% para el μ.

Después de observar la muestra encontramos el \ el overline {x} de los valores para el \ el overline {X} y el s para el S, de el cual computamos el intervalo de confianza \, , del

l

un intervalo con números fijos como puntos finales, cuyo podemos no más decir allí es cierta probabilidad que contiene el μ del parámetro. Cualquier μ está en este intervalo o no es.

Cómo entender intervalos de confianza

Los niveles de confianza se dan típicamente junto a estadísticas resultando del muestreo.

En un " de la declaración; somos los 90% confidentes eso entre el 35% y los 45% de votantes favorecen a candidato A", el 90% es nuestro nivel de confianza y 35%-45% es nuestro intervalo de confianza.

Es muy tempting entender mal esta declaración así. Utilizamos el U de las mayúsculas y el V para las variables al azar; es convencional utilizar el u de las letras minúsculas y el v para sus valores observados en un caso particular. El malentendido es la conclusión eso \ banda (, u< \ thetal

para después de que se hayan observado los datos, deducir una distribución de probabilidad condicional del θ, dada los datos. Por ejemplo, suponer que el X es el normalmente distribuido con el θ y la variación 1. (del valor previsto es grueso poco realista tomar la variación que se sabrá mientras que el valor previsto se debe deducir de los datos, pero hace el ejemplo simple.) El X de la variable al azar es observable. (El &minus del X de la variable al azar; el θ es observable del no, puesto que su valor depende de θ.) Entonces &minus del X ; el θ se distribuye normalmente con la expectativa 0 y la variación 1. Dado que el 90% de las mentiras de distribución normal estándar entre el − 1.645, sabemos: \ banda (- 1. \,

Por lo tanto, =0.9 \, del \ banda (X-1.645) del

l

tan el intervalo del &minus del X ; 1.645 es un intervalo de confianza del 90% para el θ. Pero cuando se observa el X = 82, podemos entonces decir eso \ =0.9 \ mbox del \ banda (82-1.645) del

l {?}

Esta conclusión no sigue de las leyes de la probabilidad porque el θ no es un " variable" al azar; ; es decir, no se ha asignado ninguna distribución de probabilidad ella. Los intervalos de confianza son generalmente un método del frequentist, es decir, empleado por los que interpreten el " probability" del 90%; como " ocurrencia en el 90% de todo el cases". Suponer, por ejemplo, que el θ es la masa Neptuno del planeta, y la aleatoriedad en nuestro error de la medida significa ese 90% del tiempo nuestra declaración que la masa está entre este número y que el número estará correcto. La masa no es cuál es al azar. Por lo tanto, dado que la hemos medido para ser 82 unidades, no podemos decir que en el 90% de todos los casos, la masa está entre el &minus 82; 1. No hay tales casos; hay, después de todos, solamente un planeta Neptuno.

Pero si las probabilidades se interpretan como grados de creencia algo que como frecuencias relativas de la ocurrencia de acontecimientos al azar, es decir, si somos el Bayesians algo que frequentists, podemos el entonces decirnos somos los 90% sure que la masa está entre el &minus 82; ¿1.645? Muchas respuestas a esta pregunta se han propuesto, y son filosófico polémicas. La respuesta no será un teorema matemático, sino un principio filosófico. Menos polémicos son los intervalos creíbles Bayesian en cuál comienza con una distribución de probabilidad anterior del θ, y encuentran una distribución de probabilidad posterior, que es la distribución de probabilidad condicional del θ dada los datos.

Para los usuarios de los métodos del frequentist, la explicación de un intervalo de confianza puede ascender algo como: " El el intervalo de confianza representa los valores para el parámetro de población para el cual la diferencia entre el parámetro y la estimación observada no es el estadístico significativo en el " del nivel del 10%;. Los críticos de los métodos del frequentist sugieren que esto oculte la interpretación verdadera y, a los críticos, incomprensible del frequentist que se pudo expresar como: " si el parámetro de población de hecho miente dentro del intervalo de confianza, después la probabilidad que el perito o será la estimación observada realmente, o está más cercano al parámetro, es del inferior o igual " 90% ;. El intervalo de confianza se puede también expresar en términos de muestras: " El era este procedimiento que se repetirá en muestras múltiples, el intervalo de confianza calculado (que diferenciaría para cada muestra) abarcaría el parámetro de población verdadero el 90% del time." Los usuarios de de métodos Bayesian, si produjeron un intervalo de confianza, pudieron por el contrario decir el " El mi grado de creencia que el parámetro sea de hecho en el intervalo de confianza es " del 90% ;. Los desacuerdos sobre estas ediciones no son desacuerdos sobre soluciones a los problemas matemáticos. Son algo desacuerdos sobre las maneras de las cuales las matemáticas deben ser aplicadas. ¡datos ellos mismos hacen la conclusión epistemic dudosa. -->

Intervalos de confianza en la medida

Más concreto, los resultados de medidas son acompañados a menudo por intervalos de confianza. Por ejemplo, suponer que una escala está sabida para rendir la masa real de un objeto más un error al azar normalmente distribuido con el medio 0 y el σ sabido del de la desviación estándar . Si pesamos 100 objetos de masa sabida en esta escala y divulgamos el ±σ de los valores, después podemos esperar encontrar eso el alrededor 68% de las gamas divulgadas para incluir el Massachusetts real.

Si deseamos divulgar valores con un valor más pequeño del error estándar, después repetimos los tiempos del n de la medida y hacemos un promedio de los resultados. Entonces el intervalo de confianza 68. \ sigma \ raíz cuadrada {n} . Por ejemplo, la repetición de la medida 100 veces reduce el intervalo de confianza a 1/10 de la anchura original.

Observar que cuando divulgamos un intervalo de confianza 68.2% (generalmente llamado error estándar) como σ ± del v, esto no significa que la masa verdadera tiene una ocasión 68.2% de ser en la gama divulgada. De hecho, la masa verdadera está en la gama o no. ¿Cómo se puede un valor fuera de la gama decir para tener ocasión de estar en la gama? Algo, nuestra declaración significa que 68.2% de las gamas que divulgamos que con el σ ± ser probable incluir el Massachusetts verdadero.

Esto no es apenas una sutileza. Bajo interpretación incorrecta, cada uno de las 100 medidas descritas arriba estaría especificando una diversa gama, y la masa verdadera supuesto tiene una ocasión del 68% de ser en cada gama. También, supuesto tiene una ocasión del 32% de estar fuera de cada gama. Si dos de las gamas suceden ser desunir, las declaraciones son obviamente contrario. Decir que una gama es 1 a 2, y el otro es 2 a 3. supuesto, la masa verdadera tiene una ocasión del 68% de estar entre 1 y 2, pero solamente una ocasión del 32% de ser menos de 2 o más de 3. La interpretación incorrecta lee más en la declaración que se significa.

Por una parte, bajo interpretación correcta, cada declaración que hacemos es realmente verdad, porque las declaraciones no están sobre ninguna gama específica. Podríamos divulgar que una masa es el ± 10.1 gramos, mientras que es realmente 10.6 gramos, y no mentir. Pero si divulgamos menos de 1000 valores y más de dos de ellos son ése lejos apagado, tendremos alguno que explican para hacer.

Es también posible estimar un intervalo de confianza sin saber la desviación estándar del error al azar. Esto es hecha usar la distribución T, o usando los métodos que vuelven a muestrear no paramétrico tales como el elástico de bota, que no requieren que el error tenga un de distribución normal.

Intervalos de confianza robustos

En curso de pesaje de 1000 objetos, bajo condiciones prácticas, es fácil creer que el operador pudo incurrir en una equivocación en procedimiento y divulgar tan una masa incorrecta (de tal modo que hace un tipo del error sistemático ). Suponer que él tiene 100 objetos y él los pesó todos, uno a la vez, y repitió el proceso entero diez veces. Entonces él puede calcular una desviación estándar de muestra para cada objeto, y busca los afloramientos que cualquier objeto con una desviación estándar inusualmente grande tiene probablemente un afloramiento en sus datos. Éstos se pueden quitar por varias técnicas no paramétricas. Si él repitiera el proceso solamente tres veces, él simplemente tomaría a mediano de las tres medidas y σ del uso para dar un intervalo de confianza. Los 200 weighings adicionales servidos para detectar y para corregir solamente para el error de operador y no hicieron nada mejorar el intervalo de confianza. Con más repeticiones, él podría utilizar un malo truncado, desechando decir los valores más grandes y más pequeños y hacer un promedio del resto. Él podría entonces utilizar un cálculo del elástico de bota para determinar un intervalo de confianza más estrecho que lo calculada de σ, y así que obtener una cierta ventaja de una gran cantidad de trabajo adicional.

Estos procedimientos son el robusto contra los errores procesales que no son modelados por la asunción que el equilibrio tiene un σ sabido fijo de la desviación estándar. En los usos prácticos donde el error de operador ocasional puede ocurrir, o el equilibrio puede funcionar incorrectamente, las asunciones detrás de cálculos estadísticos simples no se pueden tomar para concedido. Antes de confiar en los resultados de 100 objetos pesó apenas tres veces cada uno para tener intervalos de confianza calculados de σ, es necesario probar para y quitar un número razonable de afloramientos (que prueban la asunción que el operador es cuidadoso y de corrección para el hecho de que él no es perfecto), y probar la asunción que los datos tienen realmente un de distribución normal con el σ de la desviación estándar.

El análisis teórico de tal experimento es complicado, pero es fácil fijar una hoja de balance que extraiga números al azar de un de distribución normal con el σ de la desviación estándar para simular la situación (=norminv del uso (rand (), 0, el σ)). Ver por ejemplo Wittwer, J., " Simulación de Monte Carlo en Excel: Un Guide" práctico;, 1 de junio de 2004. Estas técnicas también trabajan en oficina abierta y gnumeric.

Después de quitar afloramientos obvios, uno podía restar el punto medio de los otros dos valores para cada objeto, y examina la distribución de los 200 números resultantes. Debe ser normal con la desviación cerca cero y estándar mala un poco más grande que σ. Un cálculo simple de la hoja de balance de Monte Carlo revelaría los valores típicos para la desviación estándar (alrededor 105 a 115% del σ). O, uno podía restar el medio de cada trío de los valores, y examina la distribución de 300 valores. El medio es idénticamente cero, pero la desviación estándar debe ser algo más pequeña (alrededor 75 a el 85% de σ).

Intervalos de confianza para las proporciones y las cantidades relacionadas

considera también:

la margen de error Un intervalo de confianza aproximado para un medio de población se puede construir para las variables al azar que no se distribuyen normalmente en la población, confiando en el teorema de límite central, si los tamaños de muestra y las cuentas son bastante grandes. Las fórmulas son idénticas al caso arriba (donde el medio de muestra realmente se distribuye normalmente sobre el medio de población). La aproximación será absolutamente buena con solamente algunas observaciones docena en la muestra si la distribución de probabilidad de la variable al azar no es demasiado diferente de distribución normal (e. su función de distribución acumulativa no tiene ninguna discontinuidades y su oblicuidad es moderada).

Un tipo de medio de muestra es el medio de un indicador variable, que adquiere el valor 1 para verdad y el valor 0 para falso. (Los estadísticos llaman a menudo el " de las variables del indicador; variables" simulado;, solamente ese término también es utilizado con frecuencia por los matemáticos para el concepto de una variable encuadernada .) El medio de tal variable es igual a la proporción que tiene el igual variable a uno (en la población y en cualquie muestra). Así, el medio de muestra para un VARÓN etiquetado variable en datos es apenas la proporción de observaciones muestreadas que tengan MALE  =  1, es decir la proporción que es masculino. Ésta es una característica útil de las variables del indicador especialmente para la prueba de la hipótesis.

Para aplicar el teorema de límite central, uno debe utilizar bastante grande una muestra. Una regla empírica áspera es que una debe ver por lo menos 5 casos en los cuales el indicador sea 1 y por lo menos 5 en los cuales es 0. Los intervalos de confianza construidos usar las fórmulas antedichas pueden incluir los números negativos o los números mayor de 1, pero las proporciones no pueden ser negativas o exceder obviamente de 1. La probabilidad asignada a los números negativos y a los números mayor de 1 es generalmente pequeña cuando el tamaño de muestra es grande y la proporción que es estimada no está demasiado cercana a 0 o a 1.

Intervalos de confianza para los casos a donde el método antedicho asigna una probabilidad substancial (− ∞,   0) o a (1,   el ∞) puede ser construido invirtiendo pruebas de la hipótesis. Si pensamos en hipótesis que conduce probamos sobre la gama factible del conjunto de valores de parámetro, e incluyendo cualquier valor para las cuales una sola prueba de la hipótesis no rechazara la hipótesis nula que el valor verdadero era ese valor, dado nuestro valor de la muestra, podemos hacer un intervalo de confianza basado en el teorema de límite central que no viola las características básicas de proporciones.

Por una parte, las proporciones de la muestra pueden adquirir solamente un número finito de valores, así que el teorema de límite central y el de distribución normal no son las mejores herramientas para construir un intervalo de confianza. Un mejor método confiaría en la distribución binomial o la distribución beta, y hay un número de mejores métodos en uso extenso. Para los detalles en ventajas y desventajas de cada uno, ver:
" Valoración de intervalo para un Proportion" binomial;, Lorenzo D. Tony Cai, Anirban DasGupta, ciencia estadística, volumen 16, número 2 (mayo, 2001) del, pagina 101-117.

Significado de la confianza del

Hay una diferencia en significar entre el uso común de la palabra “confianza” y su uso estadístico, que es a menudo confuso al laico. En uso común, una demanda hasta la confianza del 95% en algo se toma normalmente como indicación de certeza virtual. En estadísticas, una demanda hasta la confianza del 95% significa simplemente que el investigador ha visto algo ocurrir que sucede solamente una vez en veinte o menos. Si uno fuera rodar dos dados y conseguir seises dobles, poco demandaría esto como prueba que los dados eran fijos, aunque estadístico el discurso de uno podría tener confianza del 97% que eran. Semejantemente, el encontrar de un acoplamiento estadístico en la confianza del 95% no es prueba, ni incluso evidencia muy buena, que hay cualquier conexión verdadera entre las cosas ligadas.

Cuando un estudio implica pruebas estadísticas múltiples, algunos laicos asumen que la confianza asociada a las pruebas individuales es la confianza una debe tener en los resultados del estudio sí mismo. De hecho, los resultados de todas las pruebas estadísticas conducidas durante un estudio deben ser juzgados en conjunto en la determinación de qué confianza una puede poner en los acoplamientos positivos que produce. Si un investigador que conduce un estudio realiza 40 pruebas estadísticas en la confianza del 95%, ella puede esperar que cerca de dos de las pruebas vuelvan positivos falsos. Si ella de hecho encuentra 3 acoplamientos, la confianza asociada a esos acoplamientos “como resultado del examen” es realmente el cerca de 32%; es lo que ella debe esperar para ver dos tercios del tiempo.

Ver también

Análisis de variación
Región de confianza
Intervalo de la predicción
Análisis de regresión
Regresión dividida en segmentos
Frecuencia acumulativa
que ata (estadísticas) con correa
Intervalo de confianza binomial de la proporción

Calculadoras en línea

Calculadoras del intervalo de confianza de TAMU

.

  • Zenithic
  • Augusta Theodosia Drane
    Random links:Beriliosis | Barón Ardenerie | BT-13 valeroso | Dan Folger | Al Norte Del Sur

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">