En las estadísticas, la confiabilidad es la consistencia de un sistema de medidas o del instrumento de medida. Éste puede cualquiera ser si las medidas del mismo instrumento dan (prueba-reexaminar) o son probables dar la misma medida, o en el caso de instrumentos más subjetivos, si dos asesores independientes dan las cuentas similares (confiabilidad del Inter-rater). La confiabilidad no implica la validez . Es decir, una medida confiable está midiendo algo constantemente, pero no no necesario qué se supone para medir. Por ejemplo, mientras que hay muchas pruebas confiables de capacidades específicas, no todos serían válidos para predecir, por ejemplo, funcionamiento de trabajo.
En ciencias experimentales, la confiabilidad es el grado a el cual las medidas de una prueba siguen siendo constantes sobre repetido prueban del mismo tema bajo condiciones idénticas. Un experimento es confiable si rinde resultados constantes de la misma medida. Es no fiable si las medidas repetidas dan diversos resultados.
En la ingeniería, la confiabilidad es la capacidad de un sistema o de un componente de realizar sus funciones required bajo condiciones indicadas por un período especificado de time." Se divulga a menudo en términos de probabilidad. Las evaluaciones de la confiabilidad implican el uso de muchas herramientas estadísticas. Ver la ingeniería de confiabilidad para la discusión adicional.
La confiabilidad se puede estimar con una variedad de métodos que bajen en dos tipos: la Solo-administración y la múltiple-administración. los métodos de la Múltiple-administración requieren que dos gravámenes estén administrados. En el prueba-reexaminar el método de, confiabilidad se estima como el coeficiente de correlación del producto-momento de Pearson entre las dos administraciones de la misma medida. En el método de las formas del suplente del, la confiabilidad es estimada por el coeficiente de correlación del producto-momento de Pearson de dos diversas formas de una medida, administradas generalmente juntas. los métodos de la Solo-administración incluyen la prueba bipartida del y la consistencia interna del . El método de la prueba bipartida trata las dos mitades de una medida como formas alternas. Este " parte en dos el reliability" la estimación entonces se intensifica a la longitud completa de la prueba usar la fórmula de la predicción de Lancero-Brown. La medida más común de la consistencia interna es la alfa de Cronbach, que se interpreta generalmente como el medio de todos los coeficientes posibles de la prueba bipartida.
Cada uno de estos métodos de la valoración es sensible a diversas fuentes de error y así que no se pudo esperar ser igual. También, la confiabilidad es una característica de las cuentas del de una medida algo que la medida sí mismo y se dice así ser la muestra dependiente del . Las estimaciones de la confiabilidad a partir de una muestra pudieron diferenciar de los de una segunda muestra (más allá de qué pudo ser previsto debido a las variaciones del muestreo) si la segunda muestra se extrae de una diversa población porque la confiabilidad verdadera es diferente en esta segunda población. (Esto es verdad de medidas de todos los tipos--los criterios pudieron medir casas bien con todo tener confiabilidad pobre cuando están utilizados para medir las longitudes de insectos.)
La confiabilidad se puede mejorar por la claridad de la expresión (para los gravámenes escritos), alargando la medida, y otros medios informales. Sin embargo, el análisis psicométrico formal, llamó el análisis del artículo, se considera la mayoría del modo eficaz de aumentar confiabilidad. Este análisis consiste en el cómputo de las dificultades del artículo del y de los índices de la discriminación del artículo del, el 3ultimo índice que implica el cómputo de correlaciones entre los artículos y la suma de las cuentas del artículo de la prueba entera.
.
. (donde está el porcentaje de averías el )
En la teoría clásica de la prueba, la confiabilidad se define matemáticamente como el cociente de la variación de la cuenta verdadera del y de la variación de la cuenta observada . O, equivalente, uno menos el cociente de la variación de la cuenta del error del y de la variación del observó la cuenta : _ del
donde _ del es el símbolo para la confiabilidad de la cuenta observada, X ; el , el , y el son las variaciones en las cuentas medida, verdadera y del error respectivamente. Desafortunadamente, no hay manera de observar o de calcular directo la cuenta verdadera, así que una variedad de métodos se utilizan para estimar la confiabilidad de una prueba.
Algunos ejemplos de los métodos para estimar confiabilidad incluyen prueba-reexaminan confiabilidad, confiabilidad de la consistencia interna, y confiabilidad de la paralelo-prueba. Cada método viene en el problema de imaginar la fuente de error en la prueba algo diferente.
Era bien sabido a los teóricos clásicos de la prueba que la precisión de la medida no es uniforme a través de la escala de la medida. Las pruebas tienden a distinguir mejor para los prueba-tomadores con los niveles moderados del rasgo y peor entre prueba-tomadores high- y bajo-que anotan. La teoría de la respuesta del artículo amplía el concepto de confiabilidad de un solo índice a una función llamada la función de información del . La función de información de IRT es lo contrario del error estándar observado condicional de la cuenta en cualquier puntuación del test dada. Niveles más altos de información de IRT indican una precisión más alta y así mayor confiabilidad.
.
| Random links: | Raya vertical (puntuación) | Ulises, Nebraska | 1662 en literatura | Ferrocarril de Sydenham, Sydney |