Prueba (&chi del ji-cuadrado de Pearson del ; 2) es una de una variedad de pruebas - los procedimientos estadísticos del Ji-cuadrado cuyos resultados son evaluados por la referencia a la distribución del Ji-cuadrado. Sus características primero fueron investigados por el Karl Pearson .
Prueba una hipótesis nula que las frecuencias relativas de la ocurrencia de los acontecimientos observados siguen una distribución de frecuencia especificada . Los acontecimientos se asumen para ser la independiente y para tener la misma distribución, y los resultados de cada acontecimiento deben ser mutuamente - exclusiva. Un ejemplo simple es la hipótesis que un exagonal ordinario muere es " fair", es decir, los seis resultados ocurren igualmente a menudo. El ji-cuadrado de Pearson es la original y la mayoría de la prueba ampliamente utilizada del ji-cuadrado.
el Ji-cuadrado es calculado encontrando la diferencia entre cada frecuencia observada y teórica para cada resultado posible, ajustándolas, dividiendo cada uno por la frecuencia teórica, y tomando la suma de los resultados. El número de grados de la libertad es igual al número de resultados posibles, menos 1:
donde
l = una frecuencia observada;
= una frecuencia (teórica) prevista, afirmada por la hipótesis nula; = el número de resultados posibles de cada acontecimiento.
El ji-cuadrado de Pearson se utiliza para determinar dos tipos de comparación: pruebas de la calidad del ajuste y pruebas de la independencia. Una prueba de la calidad del ajuste establece independientemente de si una distribución de frecuencia observada diferencia de una distribución teórica. Una prueba de la independencia determina si las observaciones apareadas respecto a dos variables, expresadas en una tabla de contingencia, son independiente de uno a - por ejemplo, si la gente de diversas regiones diferencia en la frecuencia con la cual ella divulga que ella apoya a candidato político.
Una probabilidad del ji-cuadrado de 0.05 o menos es interpretada comúnmente por los trabajadores aplicados como justificación para rechazar la hipótesis nula que la variable de la fila está sin relación (es decir, relacionado solamente aleatoriamente) a la variable de la columna. La hipótesis alterna no se rechaza cuando las variables tienen una relación asociada.
Por ejemplo, para probar la hipótesis que una muestra escogida al azar de 100 personas ha sido exhausta de una población en quien los hombres y las mujeres son iguales en frecuencia, el número observado de hombres y de mujeres sería comparado a las frecuencias teóricas de 50 hombres y de 50 mujeres. Si había 45 hombres en la muestra y 55 mujeres, entonces
Si la hipótesis nula es verdad (es decir, eligen a los hombres y a las mujeres con probabilidad igual en la muestra), la estadística de prueba será extraída de una distribución del ji-cuadrado con un grado de la libertad . Aunque uno pudo contar con dos grados de la libertad (una por cada uno para los hombres y las mujeres), debemos considerar que el número total de hombres y de mujeres estamos obligados (100), y hay así solamente un grado de la libertad (2 − 1). Alternativo, si se sabe la cuenta masculina la cuenta femenina es resuelta, y viceversa.
La consulta de la distribución del Ji-cuadrado para 1 grado de libertad demuestra que la probabilidad de observar esta diferencia (o una diferencia más extrema que esto) si los hombres y las mujeres son igualmente numerosos en la población es aproximadamente 0. Esta probabilidad es más alta que los criterios convencionales para la significación estadística, nosotros no rechazarían tan normalmente la hipótesis nula que el número de hombres en la población es igual que el número de mujeres.
En caso de que el valor previsto, E, se encuentre para ser pequeño (indicando una pequeña probabilidad subyacente de la población, o una pequeña cantidad de observaciones), la aproximación normal de la distribución polinomial puede fallar, y en tales casos se encuentra para ser más apropiado utilizar la G-prueba, una probabilidad - estadística de prueba basada. Donde está pequeño el tamaño de muestra total, es necesario utilizar una prueba exacta apropiada, típicamente la prueba binomial o (para las tablas de contingencia) la prueba exacta de Fisher; pero observar que esta prueba asume totales marginales fijos y sabidos.
Esta aproximación se presenta como la distribución verdadera, bajo hipótesis nula, si el valor previsto es dado por una distribución polinomial . Para los tamaños de muestra grandes, el teorema de límite central dice que esta distribución tiende hacia cierto de distribución normal multivariante.
donde p del
l = probabilidad, bajo hipótesis nula, n del
= número de observaciones en la muestra.
En el ejemplo antedicho la probabilidad presumida de una observación masculina es 0. Así esperamos observar a 50 varones.
Si el n es suficientemente grande, la distribución binomial antedicha puede ser aproximada como por la distribución (normal) gausiana y la estadística de prueba de Pearson aproxima así una distribución del Chi,
Dejar el O1 ser el número de observaciones de la muestra que estén en la primera célula. La estadística de prueba de Pearson se puede expresar como + \ frac del
cuál se puede alternadamente expresar como
Por la aproximación normal a un binomio que éste es el cuadrado de una variante aleatoria normal estándar, y por lo tanto que es distribuido como ji-cuadrado con 1 grado de libertad. Observar que el denominador es una desviación estándar de la aproximación gausiana, puede ser escrito tan
Para constante con el significado de la distribución del ji-cuadrado, estamos midiendo cómo el probable el número observado de desviaciones estándar lejos del medio está bajo aproximación gausiana (que es una buena aproximación para el grande n ).
La distribución del ji-cuadrado entonces se integra en la derecha del valor de la estadística de obtener la probabilidad que este resultado o peor fue observado dada el modelo.
.
| Random links: | Guillermo Halcrow | Kettlewell | EL Rancho Vegas | Walters máximo | Colocarse para arriba hablan para arriba |