En las estadísticas, una región de confianza del es una generalización multidimensional de un intervalo de confianza . Es un sistema de puntos en un n - espacio dimensional, representado a menudo pues un elipsoide alrededor de un punto que sea una solución estimada a un problema, aunque cualquier forma pueda ocurrir.

Se calcula la región de confianza de una manera tal que si un sistema de medidas fuera repetido muchas veces y una región de confianza calculada de la misma manera en cada sistema de medidas, después cierto porcentaje del tiempo, en promedio, (e. el 95%) la región de confianza incluiría el punto que representa el " true" valores del sistema de variables que son estimadas. Sin embargo, hace medio del no, cuando se ha calculado una región de confianza, que hay una probabilidad del 95% que el " true" los valores mienten dentro de la región, puesto que no asumimos ninguna distribución de probabilidad particular del " true" valores y nosotros mayo o mayo no tener otra información sobre donde están probables mentir.

El caso de la independiente, errores idénticamente normal-distribuidos

Suponer que hemos encontrado un \ un boldsymbol {\ un beta} de la solución al problema overdetermined siguiente: = \ + \ boldsymbol {\ varepsilon} del mathbf {X} del \ del mathbf del {Y} \ del boldsymbol {\ beta}

donde está un el Y n - vector de la columna del dimensaional contener los valores observados, X es un n - por la matriz del p que pueden representar un modelo físico y que se asume para ser sabida exactamente, el \ el boldsymbol {\ beta} es un vector de la columna que contiene los parámetros del p que deben ser estimados, y el \ el boldsymbol {\ varepsilon} es un n - vector dimensional de la columna de los errores que se asumen para ser el independiente distribuido con las distribuciones normales con cero malo y cada uno que tiene iguales el mismo desconocido \ sigma^2 de la variación.

Según pañero y Smith, (100 - el \ alpha) un % común de la región de confianza para los elementos del \ del boldsymbol {\ de beta} es representado por el sistema de los valores del b del vector que satisfacen la desigualdad siguiente: ^ del del

l (\ - \ mathbf {b} del boldsymbol {\ beta}) \ prima \ ^ del mathbf {X} \ prima \ mathbf {X} (\ boldsymbol {\ beta} - \) \ le ps^2 F (, \ NU, 1 - \ alfa) del mathbf {b} de p

donde el variable b representa cualquier punto en la región de confianza, el p es el número de parámetros, es decir el número de elementos del \ del boldsymbol {\ del beta} , s 2 del vector es una estimación unbiassed del \ sigma^2 igual al \ al frac {\ varepsilon^ \ prima \ varepsilon} {n - p} , F es la distribución F, \ NU = n - p, y el \ alpha es el nivel estadístico de la significación, y los medios del X^ \ prime del símbolo el transportan de X.

La desigualdad antedicha define una región elipsoidal en el p - cartesiano dimensional p de R del espacio de parámetro. El centro del elipsoide está en el \ el boldsymbol \ beta de la solución. Según la prensa y otros, es más fácil trazar el elipsoide después de hacer la descomposición del valor singular. Las longitudes de las hachas del elipsoide son proporcionales a los reciprocals de los valores en las diagonales de la matriz diagonal, y las direcciones de estas hachas son dadas por las filas de la 3ro matriz de la descomposición.

M3inimos cuadr3aticos cargados

Ahora dejarnos consideran el caso más general donde algunos elementos distintos del \ del boldsymbol {\ varepsilon} han sabido la covariación diferente a cero (es decir los errores en las observaciones no se distribuyen independiente), y/o las desviaciones estándar de los errores no son todo iguales. Suponen que covariación matriz de \ boldsymbol {\ varepsilon} es \ mathbf {} \ sigma^2 de V, donde está un el V n - por la matriz no singular del n que era igual a \ mathbf {} \ sigma^2 de I en el caso más específico manejado en la sección anterior, (donde está la matriz el I de identidad ,) pero aquí se permite tener elementos apagado-diagonales diferentes a cero el representar de la covariación de pares de observaciones individuales, así como no no necesario tener todos los elementos diagonales iguales.

Según el pañero y Smith (P. 108), es posible encontrar un no singular P de la matriz simétrica tales que del

l \ = \ = \ mathbf {V} del mathbf {P} del ^ \ de la prima \ del mathbf del mathbf {P} {P} \ del mathbf {P}

En efecto, el P es una raíz cuadrada del V de la matriz de covariación.

El problema de los m3inimos cuadr3aticos = \ + \ boldsymbol {\ varepsilon} del mathbf {X} del \ del mathbf del

l {Y} \ del boldsymbol {\ beta}

se puede entonces transformar izquierdo-multiplicando cada término por lo contrario del P, la formación de la nueva formulación del problema = \ + \ mathbf {f} del mathbf {Q} del \ del mathbf del {Z} \ del boldsymbol {\ beta}

donde

\ mathbf {Z} = \ mathbf {P} ^ {- 1} \ mathbf {Y}
\ mathbf {Q} = \ mathbf {P} ^ {- 1} \ mathbf {X} y
\ mathbf {f} = \ mathbf {P} ^ {- 1} \ boldsymbol {\ varepsilon}

Una región de confianza común para los parámetros, es decir para los elementos del \ del boldsymbol {\ de beta} , según el pañero y Smith P. 109 entonces es limitada por el elipsoide dado cerca: ^ del del

l (\ - \ boldsymbol del mathbf {b} {\ beta}) \ prima \ ^ \ prima \ mathbf del mathbf {Q} {Q} (\ - \ boldsymbol del mathbf {b} {\ beta}) = {\ frac {p} {n - p}} (\ ^ \ prima \ mathbf del mathbf {Z} {Z} - \ ^ del mathbf {b} \ prima \ ^ \ prima \ mathbf del mathbf {Q} {Z}) F (p, NP, 1 \ alfa)

Problemas no lineares

Las regiones de confianza se pueden definir para cualquier distribución de probabilidad. El experimentador puede elegir el nivel de significación y la forma de la región, y entonces el tamaño de la región es determinado por la distribución de probabilidad. Una opción natural es utilizar como límite un sistema de puntos con el constante \ chi^2 (valores del Chi .

Un acercamiento es utilizar una aproximación linear al modelo no linear, que puede ser una aproximación cercana en la vecindad de la solución, y después aplica el análisis para que un problema linear encuentre una región de confianza aproximada. Esto puede ser un acercamiento razonable si la región de confianza no es muy grande y los segundos derivados del modelo no son también muy grandes.

Ver también


regresión linear

.

  • Zenithic
  • Khandu Wangchuk
    Random links:Działdowo | 1969 en Canadá | Carl von Linde | Platesetter | Lista de errores en estampillas portuguesas de las ex-Colonias del 1921 de Angola

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">