Prueba (&chi del ji-cuadrado de Pearson del ; 2) es una de una variedad de pruebas - los procedimientos estadísticos del Ji-cuadrado cuyos resultados son evaluados por la referencia a la distribución del Ji-cuadrado. Sus características primero fueron investigados por el Karl Pearson .

Prueba una hipótesis nula que las frecuencias relativas de la ocurrencia de los acontecimientos observados siguen una distribución de frecuencia especificada . Los acontecimientos se asumen para ser la independiente y para tener la misma distribución, y los resultados de cada acontecimiento deben ser mutuamente - exclusiva. Un ejemplo simple es la hipótesis que un exagonal ordinario muere es " fair", es decir, los seis resultados ocurren igualmente a menudo. El ji-cuadrado de Pearson es la original y la mayoría de la prueba ampliamente utilizada del ji-cuadrado.

el Ji-cuadrado es calculado encontrando la diferencia entre cada frecuencia observada y teórica para cada resultado posible, ajustándolas, dividiendo cada uno por la frecuencia teórica, y tomando la suma de los resultados. El número de grados de la libertad es igual al número de resultados posibles, menos 1: \ chi^2_ {n-1} del

l = \ ^ del sum_ {i=1} {n} {(O_i - E_i) ^2 \ sobre E_i}

donde

l O_i = una frecuencia observada;
E_i = una frecuencia (teórica) prevista, afirmada por la hipótesis nula; n del
= el número de resultados posibles de cada acontecimiento.

El ji-cuadrado de Pearson se utiliza para determinar dos tipos de comparación: pruebas de la calidad del ajuste y pruebas de la independencia. Una prueba de la calidad del ajuste establece independientemente de si una distribución de frecuencia observada diferencia de una distribución teórica. Una prueba de la independencia determina si las observaciones apareadas respecto a dos variables, expresadas en una tabla de contingencia, son independiente de uno a - por ejemplo, si la gente de diversas regiones diferencia en la frecuencia con la cual ella divulga que ella apoya a candidato político.

Una probabilidad del ji-cuadrado de 0.05 o menos es interpretada comúnmente por los trabajadores aplicados como justificación para rechazar la hipótesis nula que la variable de la fila está sin relación (es decir, relacionado solamente aleatoriamente) a la variable de la columna. La hipótesis alterna no se rechaza cuando las variables tienen una relación asociada.

Ejemplo

Por ejemplo, para probar la hipótesis que una muestra escogida al azar de 100 personas ha sido exhausta de una población en quien los hombres y las mujeres son iguales en frecuencia, el número observado de hombres y de mujeres sería comparado a las frecuencias teóricas de 50 hombres y de 50 mujeres. Si había 45 hombres en la muestra y 55 mujeres, entonces \ chi^2 del

l = {(45 - 50) ^2 \ sobre 50} + {(55 - 50) ^2 \ sobre 50} = 1.

Si la hipótesis nula es verdad (es decir, eligen a los hombres y a las mujeres con probabilidad igual en la muestra), la estadística de prueba será extraída de una distribución del ji-cuadrado con un grado de la libertad . Aunque uno pudo contar con dos grados de la libertad (una por cada uno para los hombres y las mujeres), debemos considerar que el número total de hombres y de mujeres estamos obligados (100), y hay así solamente un grado de la libertad (2  −   1). Alternativo, si se sabe la cuenta masculina la cuenta femenina es resuelta, y viceversa.

La consulta de la distribución del Ji-cuadrado para 1 grado de libertad demuestra que la probabilidad de observar esta diferencia (o una diferencia más extrema que esto) si los hombres y las mujeres son igualmente numerosos en la población es aproximadamente 0. Esta probabilidad es más alta que los criterios convencionales para la significación estadística, nosotros no rechazarían tan normalmente la hipótesis nula que el número de hombres en la población es igual que el número de mujeres.

Problemas

La aproximación a la distribución del ji-cuadrado analiza si las frecuencias previstas son demasiado bajas. Será normalmente aceptable siempre y cuando no más los de 10% de los acontecimientos han contado con frecuencias debajo de 5. Donde hay solamente 1 grado de libertad, la aproximación no es confiable si las frecuencias previstas están debajo de 10. en este caso, una mejor aproximación puede ser tenida reduciendo el valor absoluto de cada diferencia entre las frecuencias observadas y previstas por 0.5 antes de ajustar; esto se llama corrección para la continuidad de Yates .

En caso de que el valor previsto, E, se encuentre para ser pequeño (indicando una pequeña probabilidad subyacente de la población, o una pequeña cantidad de observaciones), la aproximación normal de la distribución polinomial puede fallar, y en tales casos se encuentra para ser más apropiado utilizar la G-prueba, una probabilidad - estadística de prueba basada. Donde está pequeño el tamaño de muestra total, es necesario utilizar una prueba exacta apropiada, típicamente la prueba binomial o (para las tablas de contingencia) la prueba exacta de Fisher; pero observar que esta prueba asume totales marginales fijos y sabidos.

Distribución

La distribución nula de la estadística de Pearson con filas del j y columnas del k es aproximada por la distribución del Ji-cuadrado con (  del k ; −   1) (  del j ; −   1) grados de libertad.

Esta aproximación se presenta como la distribución verdadera, bajo hipótesis nula, si el valor previsto es dado por una distribución polinomial . Para los tamaños de muestra grandes, el teorema de límite central dice que esta distribución tiende hacia cierto de distribución normal multivariante.

Dos células

En el caso especial donde hay solamente dos células en la tabla, los valores previstos siguen una distribución binomial, =^d del E del

l \ mbox {compartimiento} (n, p),

donde p del

l = probabilidad, bajo hipótesis nula, n del
= número de observaciones en la muestra.

En el ejemplo antedicho la probabilidad presumida de una observación masculina es 0. Así esperamos observar a 50 varones.

Si el n es suficientemente grande, la distribución binomial antedicha puede ser aproximada como por la distribución (normal) gausiana y la estadística de prueba de Pearson aproxima así una distribución del Chi, del

l \ mbox {compartimiento} (n, p) \ approx^d \ mbox {N} (NP, NP (1-p)).

Dejar el O1 ser el número de observaciones de la muestra que estén en la primera célula. La estadística de prueba de Pearson se puede expresar como + \ frac del \ del frac del

l {(O_1-np) ^2} {NP} {(n-O_1-n (1-p))^2} {n (1-p)},

cuál se puede alternadamente expresar como del

l \ ido (\ frac {(O_1-np)}{\ raíz cuadrada {NP (1-p)}} \) ^2. derecho

Por la aproximación normal a un binomio que éste es el cuadrado de una variante aleatoria normal estándar, y por lo tanto que es distribuido como ji-cuadrado con 1 grado de libertad. Observar que el denominador es una desviación estándar de la aproximación gausiana, puede ser escrito tan \ frac del

l {(O_1- \ MU) ^2} {\ sigma^2}.

Para constante con el significado de la distribución del ji-cuadrado, estamos midiendo cómo el probable el número observado de desviaciones estándar lejos del medio está bajo aproximación gausiana (que es una buena aproximación para el grande n ).

La distribución del ji-cuadrado entonces se integra en la derecha del valor de la estadística de obtener la probabilidad que este resultado o peor fue observado dada el modelo.

Muchas células

Las discusiones similares como arriba llevan al resultado deseado. (TODO: detalles que) cada célula (a menos que la final, cuyo valor es determinado totalmente por el otra) se trata como variable binomial independiente, y sus contribuciones se suman y cada uno contribuye un grado de libertad.

Aplicaciones avanzadas

Una forma más complicada, pero más ampliamente utilizada de la prueba del ji-cuadrado de Pearson se presenta en el caso donde la hipótesis nula del interés incluye parámetros desconocidos. Por ejemplo podemos desear probar si un ciertos datos sigan un de distribución normal pero sin especificar un medio o la variación . En esta situación los parámetros desconocidos necesitan ser estimados por los datos, típicamente por la valoración de toda probabilidad, y estas estimaciones entonces se utilizan para calcular los valores previstos en la estadística de Pearson. Se indica comúnmente que los grados de libertad para la distribución del ji-cuadrado de la estadística son entonces   del k ; −   1  −   r, donde está el número el r de parámetros desconocidos. Este resultado es válido cuando los datos originales eran polinomiales y por lo tanto los parámetros estimados son eficientes para reducir al mínimo la estadística del ji-cuadrado. Más generalmente sin embargo, cuando la valoración de toda probabilidad no coincide con la valoración mínima del ji-cuadrado, la distribución mentirá en alguna parte entre una distribución del ji-cuadrado con el   del k ; −   1  −     del r y del k ; −   1 grado de libertad (véase por ejemplo Chernoff y Lehmann 1954).

Ver también

Prueba mediana
Ábaco del Chi

.

  • Zenithic
  • Hipphipp!
    Random links:Guillermo Halcrow | Kettlewell | EL Rancho Vegas | Walters máximo | Colocarse para arriba hablan para arriba

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">