En las estadísticas, un intervalo de la predicción del lleva la misma relación a una observación futura que un intervalo de confianza lleve a un parámetro de población inobservable. Los intervalos de la predicción predicen la distribución de puntos individuales, mientras que los intervalos de confianza estiman el medio de población verdadero o la otra cantidad de interés que no puede ser observada.

Es decir una estimación del intervalo de un parámetro, tal como un medio de la población se llama generalmente un intervalo de confianza . Una estimación del intervalo de una variable se llama un intervalo de la predicción.

Un ejemplo común dado en clases de las estadísticas es el intervalo de la predicción para una variable de la respuesta al encontrar la línea de regresión de los m3inimos cuadr3aticos . Si dan el toda la población en los datos, esto no es necesario. Sin embargo, si los datos son una muestra, después la línea de regresión verdadera no puede ser sabido. El valor previsto del variable y de la respuesta, encontrado usar la ecuación de la línea de regresión de los datos de la muestra, tendrá una margen de error. El valor previsto del y es una estadística, no un parámetro . Para este valor del y, un intervalo de la predicción puede ser encontrado. Utilizamos la desviación estándar (error estándar) de la distribución de la cuesta para hacer esto. El valor del y es una estimación del punto y estamos buscando un intervalo de la predicción para esa estimación.

Ejemplo

Suponer que uno ha extraído una muestra de una población normalmente distribuida . El medio y la desviación estándar de la población son desconocidos excepto en cuanto pueden ser estimados basaron en la muestra. Se desea para predecir la observación siguiente. Dejar el n ser el tamaño de muestra; dejar el μ y σ ser la desviación respectivamente mala y estándar inobservable de la población. Dejar el X 1,…, el n del del X, ser la muestra; dejar el n +1 del del X ser la observación futura que se predirá. Dejar del

l \ _n= del overline {X} (X_1+ \ cdots+X_n) /n

y

S_n^2= {1 \ sobre del n-1} \ ^n del sum_ {i=1} (_n de X_i- \ del overline {X}) ^2.

Entonces es bastante rutinario demostrar eso del

l {X_ {n+1} - \ _n del overline {X} \ sobre \ raíz cuadrada {S_n^2+S_n^2/n}} = {X_ {n+1} - \ _n del overline {X} \ sobre S_n \ raíz cuadrada {1+1/n}}

tiene distribución T de un estudiante con &minus del n ; 1 grado de libertad. Por lo tanto tenemos \ banda \ (\ overline {X} _n-T_a S_n \ raíz cuadrado {1+ (1/n)} \ leq X_ {n+1} \ leq \ overline {X} _n+T_a S_n \ raíz cuadrado {1+ (1/n)} \, \ derecho) =p dejado del

l

donde está los 100 el Ta ((1  +  porcentaje p ) /2)th de la distribución T del estudiante con &minus del n ; 1 grado de libertad. Por lo tanto los números del

l \ _n \ raíz cuadrada {1+ (1/n)} del _n \ P.T_a {S} del overline {X}

son las puntos finales de un % del intervalo de la predicción de 100 p para el   del n del del X ; +  1.

Ver también

Intervalo de confianza
Extrapolación
Predicción
Análisis de regresión
Seymour Geisser
Valoración de la tendencia

.

  • Zenithic
  • Jun Kaname
    Random links:Lista de atracciones turísticas en Mumbai | La rueda del juego de tarjeta cobrable del tiempo | Universidad de Wagner | Isla de Visokoi | Todos seleccionan los tebeos

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">