En la teoría de las probabilidades y las estadísticas, la variación de una variable al azar, la distribución de probabilidad, o la muestra es una medida de la dispersión estadística, haciendo un promedio de la distancia ajustada de sus valores posibles del valor previsto . Considerando que el medio es una manera de describir la localización de una distribución, la variación es una manera de capturar su escala o grado de extensión hacia fuera. La unidad de variación es el cuadrado de la unidad de la variable original. La raíz cuadrada de la variación, llamada el la desviación estándar, tiene las mismas unidades que el variables original y puede ser más fácil de interpretar por esta razón.

La variación de un verdadero - la variable al azar valorada es su momento central del segundo, y también sucede ser su segundo cumulante . Apenas pues algunas distribuciones no tienen un medio, algunas no tienen una variación también. El medio existe siempre que exista la variación, pero no viceversa.

Definición

Si el μ = E ( X ) es el valor previsto (medio) X de la variable al azar, después la variación es = \ operatorname {E} (- \ MU del \ del operatorname del

l {Var} (x) de X) ^ 2. \,

Esta definición abarca las variables al azar que son el discreto, el continuo, o ni uno ni otro. De todos los puntos sobre los cuales ajustó desviaciones se habría podido calcular, el medio produce el valor mínimo para la suma hecha un promedio de desviaciones ajustadas.

Muchas distribuciones, tales como la distribución de Cauchy, no tienen una variación porque diverge el integral relevante. Particularmente, si una distribución no tiene un valor previsto, no tiene una variación tampoco. El inverso no es verdad: hay las distribuciones para las cuales el valor previsto existe, pero no lo hace la variación.

Caso discreto

Si la variable al azar es el discreto con el p 1 de la función de masa de probabilidad,   …,   el n , éste del del p es equivalente a del

l \ p_i ^2 del ^n del sum_ {i=1} (- \ MU del x_i) \.

(Nota: esta variación se debe dividir por la suma de pesos en el caso de una variación cargada discreto .) Es decir, es el valor previsto del cuadrado de la desviación del X de su propio medio. En lengua llana, puede ser expresado como " El promedio del cuadrado de la distancia de cada punto de referencias del mean". Es así la desviación media cuadrático del . La variación del X de la variable al azar se señala típicamente como Var ( X ), \ el scriptstyle \ sigma_X^2, o simplemente σ2.

Características

La variación es no negativa porque los cuadrados son positivos o cero. La variación de una variable al azar es 0 si y solamente si la variable es degenerada, es decir, adquiere un valor constante con la probabilidad 1, y la variación de una variable en un conjunto de datos es 0 si y solamente si todas las entradas tienen el mismo valor.

La variación es el invariante con respecto a cambios en un parámetro de localización . Es decir, si un constante se agrega a todos los valores de la variable, la variación es sin cambios. Si todos los valores son escalados por un constante, la variación es escalada por el cuadrado de eso constante. Estas dos características se pueden expresar en la fórmula siguiente: del

l \ operatorname {Var} (aX+b)=a^2 \ operatorname {Var} (X).

La variación de una suma finita de variables al azar sin correlación es igual a la suma de sus variaciones.

supone que las observaciones se pueden repartir en los subgrupos según una cierta segunda variable. Entonces la variación del grupo total es igual al medio de las variaciones de los subgrupos más la variación de los medios de los subgrupos. Esta característica se conoce como la descomposición de la variación o la ley de la variación total y desempeña un papel importante en el análisis de variación . Por ejemplo, suponer que un grupo consiste en un subgrupo de hombres y un subgrupo igualmente grande de mujeres. Suponer que los hombres tienen una longitud de cuerpo mala de 180 y que la variación de sus longitudes es 100. Suponer que las mujeres tienen una longitud mala de 160 y que la variación de sus longitudes es 50. Entonces medio de variación es (100 + 50)/2 = 75; la variación de los medios es la variación de 180, 160 que es 100. Entonces, porque el grupo total de hombres y las mujeres combinadas, la variación de las longitudes de cuerpo será 75 + 100 = 175. Observar que esto utiliza N para el denominador en vez de N - 1.

In un caso más general, si los subgrupos tienen tamaños desiguales, después deben ser cargados proporcional a su tamaño en los cómputos de los medios y de las variaciones. La fórmula es también válida con más de dos grupos, e incluso si es la variable que agrupa la fórmula de continuous.

This implica que la variación del grupo total no puede ser más pequeña que el medio de las variaciones de los subgrupos. Nota, sin embargo, que la variación total no es necesario más grande que las variaciones de los subgrupos. En el ejemplo antedicho, cuando analizan a los subgrupos por separado, la variación es influenciada solamente por las diferencias del hombre-hombre y las diferencias de la mujer-mujer. Si combinan a los dos grupos, sin embargo, después las diferencias de las hombre-mujeres entran en el

  • de la variación also.

    Muchas fórmulas de cómputo para la variación se basan en esta igualdad: El la variación es igual al medio de los cuadrados menos el cuadrado del medio. por ejemplo, si consideramos los números 1, 2, 3, 4 entonces el medio de los cuadrados está (1 × 1 + 2 el × 2 + 3 el × 3 + 4 el × 4)/4 = 7.5, así que el cuadrado del medio es 6. Por lo tanto la variación es 7.5  −   6.25, que es de hecho el mismo resultado obtuvieron anterior con las fórmulas de la definición. Muchas calculadoras de bolsillo utilizan un algoritmo que se base en esta fórmula y que permita que computen la variación mientras que se incorporan los datos, sin almacenar todos los valores en memoria. El algoritmo es ajustar solamente tres variables cuando se incorpora un nuevo valor de datos: El número de datos entró hasta ahora (el n ), la suma de los valores hasta ahora (el S ), y la suma de los valores ajustados hasta ahora (el SS ). Por ejemplo, si los datos son 1, 2, 3, 4, después después de incorporar el primer valor, el algoritmo tendrían el n = 1, el S = 1 y SS = 1. Después de incorporar el segundo valor (2), tendría el n = 2, el S = 3 y SS = 5. Cuando se incorporan todos los datos, tendrían el n = 4, el S = 10 y SS = 30. Después, el medio se computa como M = el S / n, y finalmente la variación se computa como   del SS /del n ; −   M DEL × DEL M . En este ejemplo el resultado sería 30/4 - 2.5  −   6. Si se va la estimación de la muestra imparcial a ser computada, el resultado será multiplicado por el n /(  del n ; −   1), que rinde 1.

    Características, formales

    8. Variación del de la suma de las variables sin correlación

    Una razón del uso de la variación preferentemente a otras medidas de dispersión es que la variación de la suma (o de la diferencia) de las variables al azar sin correlación es la suma de sus variaciones: del

    l \ operatorname {Var} \ ^n grande (\ del sum_ X_i {i=1} \ grande) = \ ^n del sum_ {i=1} \ operatorname {Var} (X_i).

    Esta declaración se hace a menudo con la condición más fuerte que las variables son la independiente, pero el uncorrelatedness es suficiente. Tan si las variables tienen la misma variación σ2, después, puesto que la división por el n es una transformación linear, esta fórmula implica inmediatamente que es la variación de su medio = \ operatorname {Var} \ (\ frac {1} {n} \ ^n X_i del sum_ {i=1} \ derecho) = dejado \ frac {1} {n^2} n \ sigma^2 del \ del operatorname del

    l {Var} (\ overline {X}) = \ frac {\ sigma^2} {n}.

    Es decir, la variación del medio disminuye con el n . Este hecho se utiliza en la definición del error estándar del medio de muestra, que se utiliza en el teorema de límite central . Variación del de la suma de las variables correlacionadas

    Generalmente si se correlacionan las variables, después la variación de su suma es la suma de sus covariaciones

    \ operatorname {} \ dejado (\ ^n X_i del Var del sum_ {i=1} \ derecho) = \ ^n del sum_ {i=1} \ ^n del sum_ {j=1} \ operatorname {Cov} (X_i, X_j).

    Aquí Cov es la covariación, que es cero para las variables al azar independientes (si existe). La fórmula indica que la variación de una suma es igual a la suma de todos los elementos en la matriz de covariación de los componentes. Esta fórmula se utiliza en la teoría de la alfa de Cronbach en la teoría clásica de la prueba.

    Tan si las variables tienen variación igual σ2 y la correlación media de variables distintas es ρ, después la variación de su medio es

    \ operatorname {Var} (\ overline {X}) = \ frac {\ sigma^2} {n} + \ frac {n-1} {} \ rho \ sigma^2. de n

    Esto implica que la variación del medio aumenta con el promedio de las correlaciones. Por otra parte, si las variables tienen variación de la unidad, por ejemplo si se estandardizan, después ésta simplifica a

    \ operatorname {Var} (\ overline {X}) = \ frac {1} {n} + \ frac {n-1} {} \ rho. de n

    Esta fórmula se utiliza en la fórmula de la predicción de Lancero-Brown de la teoría clásica de la prueba. Esto converge al ρ si el n va al infinito, a condición de que la correlación media sigue siendo constante o converge también. Tan para la variación del medio de variables estandardizadas con correlaciones iguales o la correlación media convergente tenemos del

    l \ lim_ {n \ \ infty} \ = \ rho. del operatorname {Var} (\ overline {X})

    Por lo tanto, la variación del medio de una gran cantidad de variables estandardizadas es aproximadamente igual a su correlación media. Esto hace claramente que el medio de muestra de variables correlacionadas no converge generalmente al medio de población, aunque la ley de los grandes números indica que el medio de muestra convergerá para las variables independientes. Variación del de una suma cargada de las variables

    Características 6 y 8, junto con esta característica de la página de la covariación : Cov (hacha,   del ; por ) =   del ab del ; Cov ( X,   El Y ) implica en común eso del

    l \ operatorname {Var} (aX+bY) =a^2 \ operatorname {Var} (x) + b^2 \ operatorname {Var} (y) + 2ab \, \ operatorname {Cov} (X, Y).

    Esto implica eso en una suma cargada de variables, la variable con el peso más grande tendrá un peso desproporcionado grande en la variación del total. Por ejemplo, si el X y el Y son sin correlación y el peso del X es dos veces el peso del Y, después el peso de la variación del X ser cuatro veces el peso de la variación del Y . Descomposición del de la variación

    La fórmula general para la descomposición de la variación o la ley de la variación total es: Si el X y el Y son dos variables al azar y existe la variación del X, entonces = \ operatorname {Var} del \ del operatorname del

    l {Var} (x) (\ operatorname {E} (X|Y)) + \ operatorname {E} (\ operatorname {Var} (X|Y)).

    Aquí, E ( X | El Y ) es la expectativa condicional dado Y del X, y Var ( X | El Y ) es la variación condicional del dado Y del X. (Una explicación más intuitiva de A es que dado un valor particular del Y, después el X sigue una distribución con E mala ( X | Y ) y variación Var ( X | Y ). La fórmula antedicha dice cómo encontrar Var ( X ) basado en las distribuciones de estas dos cantidades cuando el Y se permite variar.) Esta fórmula se aplica a menudo en el análisis de variación, donde está la fórmula correspondiente SS_ del

    l {\ mbox {total}} = SS_ {\ mbox {en medio}} + SS_ {\ mbox {dentro}}.

    También se utiliza en análisis de la regresión linear, donde está la fórmula correspondiente SS_ del

    l {\ mbox {total}} = SS_ {\ mbox {regresión}} + SS_ {\ mbox {residual}}.

    Esto se puede también derivar de la aditividad de las variaciones (característica 8), puesto que la cuenta (observada) total es la suma de la cuenta prevista y de la cuenta del error, donde están sin correlación los 3ultimos dos. Fórmula de cómputo del para la variación

    La fórmula de cómputo para la variación sigue de una manera directa de las linearidades de valores previstos y de la definición antedicha:

    {} \ operatorname {Var} (X)= \ operatorname {E} (X^2 - 2 \, X \, \ operatorname {E} (x) + (\ operatorname {E} (x)) ^2), = \ operatorname {E} del del

    l {} (X^2) - 2 (\ operatorname {E} (x)) ^2 + (\ operatorname {E} (x)) ^2, = \ operatorname {E} del del

    l {} (X^2) - (\ operatorname {E} (x)) ^2.

    Esto es de uso frecuente calcular la variación en la práctica, aunque sufra del error numérico de la aproximación si los dos componentes de la ecuación son similares en magnitud.

    Característica característica

    El segundo momento de una variable al azar logra el valor mínimo cuando está tomado alrededor del medio de la variable al azar, es decir \ mathrm {E} X = \ _a del mathrm {argmin} \ el mathrm {E} (X - a)^2. Este característica podría ser invertido, es decir si función \ phi satisface \ mathrm {E} X = \ mathrm {argmin} _a \ mathrm {} \ phi (X de E - a) entonces es necesario del \ de la phi de la forma = x^2 + b. Esto es también verdad en caso multidimensional.

    Aproximar la variación de una función

    El método del delta utiliza las extensiones second-order de Taylor para aproximar la variación de una función de uno o más variables al azar. Por ejemplo, la variación aproximada de una función de una variable se da cerca


    \ operatorname {Var} \ ido \ aproximadamente \ ido (f'(\ operatorname {} \ dejado de E) \ derecho) ^2 \ operatorname {} \ left del Var

    a condición de que el f es dos veces diferenciable y ése el medio y la variación del X es finito.

    Variación de población y variación de muestra

    La variación de población de una población finita del N del tamaño se da generalmente cerca

    {} \ sigma^2 = \ frac 1N \ ^N del sum_ {i=1} \ (- \ overline {x} del x_i \ derecho) ^ dejado 2 \,

    o si la población es una población del extracto con la banda de la distribución de probabilidad:

    {} \ sigma^2 = \ ^N del sum_ {i=1} \ (- \ overline {x} del x_i \ derecho) ^ dejado 2 \, \ banda (x_i),

    donde está el medio el \ el overline {x} de población. Éste es simplemente un caso especial de la definición general de la variación introducida arriba, pero restringida a las poblaciones finitas.

    En muchas situaciones prácticas, la variación verdadera de una población no es el sabido a priori y se debe computar de alguna manera. Al tratar de las poblaciones infinitas, esto es generalmente imposible.

    Un método común está estimando la variación de poblaciones (finitas o infinitas) grandes de una muestra . ¡Tomamos un de la muestra (y_1, \ puntea, y_n) de los valores del n de la población, mucho más, pero porqué debemos nosotros? Hay dos cosas distintas que podemos hacer con esta muestra: primero, podemos tratarla como población finita y describir su variación; en segundo lugar, podemos estimar la variación de población subyacente de esta muestra. --estimación del >and la variación en base de esta muestra. Hay varios buenos peritos. Dos de ellos son bien sabido: = \ frac 1n \ ^n del sum_ {i=1} \ (y_i - \ overline {y} \ derecho) ^ dejado 2 del

    l s_n^2 = \ (\ frac {1} {n} \ ^ del sum_ {i=1} {n} y_i^2 \ derecho) - dejado \ overline {y} ^2, y = \ frac {1} {n-1} \ ^n del sum_ {i=1} \ (y_i - \ overline {y} \ derecho) = dejado \ frac {1} {n-1} \ ^n y_i^2 del s^2 del ^ 2 del sum_ {i=1} - \ frac {n} {n-1} \ overline {y} ^2,

    Ambos se refieren como variación de muestra del . La mayoría de las calculadoras electrónicas avanzadas pueden calcular s_n^2 y s^2at la prensa de un botón, en este caso ese botón generalmente se etiqueta el \ sigma^2 o el \ sigma_n^2 para s_n^2 y \ el sigma_ {n-1} ^2 para s^2.

    Los dos peritos diferencian solamente levemente como vemos, y para valores más grandes del n del tamaño de muestra la diferencia es insignificante. Segundo es un perito imparcial de la variación de población, significando que su valor previsto E es igual a la variación verdadera de la variable al azar muestreada. Primer se puede ver como la variación de la muestra considerada como población.

    El sentido común sugeriría para aplicar la fórmula de la población a la muestra también. La razón que es en polarización negativa es que el medio de muestra está generalmente algo más cercano a las observaciones en la muestra que el medio de población está a estas observaciones. Esto está tan porque el medio de muestra está por definición en el medio de la muestra, mientras que el medio de población puede incluso mentir fuera de la muestra. Las desviaciones al medio de muestra serán tan a menudo más pequeñas que las desviaciones al medio de población, y por eso, si la misma fórmula se aplica a ambos, después esta estimación de la variación en promedio será algo más pequeña en la muestra que en la población.

    Una fuente común de confusión es que la variación de muestra del del término puede referir o al perito imparcial s^2 de la variación de población, o al \ sigma^2 de la variación de la muestra vista como población finita. Ambos se pueden utilizar para estimar la variación de población verdadera. Aparte de consideraciones teóricas, no importa realmente se utiliza cuál, en cuanto a pequeños tamaños de muestra que ambas son inexactas y para los valores grandes del n son prácticamente iguales. Ingenuo computando la variación dividiendo por el n en vez del n -1 subestima sistemáticamente la variación de población. Por otra parte, en usos prácticos la mayoría del informe de la gente la desviación estándar algo que la variación de muestra, y la desviación estándar que se obtiene de la versión imparcial del n -1 de la variación de muestra tiene un diagonal negativo leve (sin embargo para las muestras normalmente distribuidas una corrección leve teóricamente interesante pero raramente usada existe para eliminar este diagonal). Sin embargo, en estadísticas aplicadas es una convención para utilizar la versión del n -1 si la variación o la desviación estándar se computa de una muestra.

    En la práctica, para n grande, la distinción es a menudo de menor importancia. En el curso de medidas estadísticas, tamaños de muestra tan pequeños en cuanto a la autorización el uso de la variación imparcial virtualmente nunca ocurrir. En este contexto la prensa y otros comentó ese si la diferencia entre el de n y el &minus del de n; 1 importa nunca a usted, después usted está probablemente hasta ningún buen de todos modos - e., intentar verificar una hipótesis cuestionable con datos marginales.

    Distribución de la variación de muestra

    El ser una función de las variables al azar la variación de muestra es sí mismo una variable al azar, y es natural estudiar su distribución. En caso de que y_i sean realizaciones gausianas independiente, el teorema de Cochran demuestra que s^2 sigue una distribución escalada del Ji-cuadrado:

    (n-1) \ frac {s^2} {\ sigma^2} \ sim \ chi^2_ {n-1}

    Como consecuencia directa, sigue ese \ operatorname {E} (s^2)= \ sigma^2.

    Sin embargo, incluso en la ausencia de la asunción gausiana, es todavía posible probar que s^2 es imparcial para el \ sigma^2.

    Generalizaciones

    Si X es vector - la variable al azar valorada, con valores en el \ el mathbb {R} ^n, y pensado en como un vector de la columna, después la generalización natural de la variación es \ el operatorname {E} ((- \ MU) (- \ MU de X de X) ^ \ operatorname {T}) , donde está la transposición el \ MU = \ operatorname {E} (X) y X^ \ operatorname {T} de X, y así que es un vector de fila. Esta variación es una matriz cuadrada semi-definite positiva, designada comúnmente la matriz de covariación .

    Si X es complejo - la variable al azar valorada, con valores en \ el mathbb {C} , después su variación es \ el operatorname {E} ((- \ MU) (- \ MU de X de X) ^*) , donde está la conjugación X^* del complejo de X. Esta variación es también una matriz cuadrada semi-definite positiva.

    Historia

    La variación término primero fue introducida por el Ronald Fisher en su de papel del 1918 la correlación entre los parientes en la suposición de la herencia mendeliana .

    Momento de inercia

    La variación de una distribución de probabilidad es análoga al momento de la inercia en los mecánicos clásicos de una distribución en masa correspondiente a lo largo de una línea, con respecto a la rotación sobre su centro de masa. Es debido a esta analogía que las cosas tales como la variación están llamadas los momentos 'de las distribuciones de probabilidad (la matriz de covariación es análoga al momento del tensor de la inercia para las distribuciones multivariantes.)

    Ver también

    style=" del
    Medio de muestra y covariación
    Valoración de las matrices de covariación
    Algoritmos para la variación calculadora
    una desigualdad en los parámetros de la localización y de la escala
    Curtosis
    Variación cualitativa
    Oblicuidad
    Semivariance
    Variación verdadera
    Variación explicada y variación inexplicada
    Error absoluto malo
  • .

  • Zenithic
  • Eagle (town), Wisconsin
    Random links:Finley, Wisconsin | Cheiromeles | Pre-Cerámica B neolítico | Yvon Poitras | Huguette Oligny

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">