En la teoría de las probabilidades y las estadísticas, la variación de una variable al azar, la distribución de probabilidad, o la muestra es una medida de la dispersión estadística, haciendo un promedio de la distancia ajustada de sus valores posibles del valor previsto . Considerando que el medio es una manera de describir la localización de una distribución, la variación es una manera de capturar su escala o grado de extensión hacia fuera. La unidad de variación es el cuadrado de la unidad de la variable original. La raíz cuadrada de la variación, llamada el la desviación estándar, tiene las mismas unidades que el variables original y puede ser más fácil de interpretar por esta razón.
La variación de un verdadero - la variable al azar valorada es su momento central del segundo, y también sucede ser su segundo cumulante . Apenas pues algunas distribuciones no tienen un medio, algunas no tienen una variación también. El medio existe siempre que exista la variación, pero no viceversa.
Esta definición abarca las variables al azar que son el discreto, el continuo, o ni uno ni otro. De todos los puntos sobre los cuales ajustó desviaciones se habría podido calcular, el medio produce el valor mínimo para la suma hecha un promedio de desviaciones ajustadas.
Muchas distribuciones, tales como la distribución de Cauchy, no tienen una variación porque diverge el integral relevante. Particularmente, si una distribución no tiene un valor previsto, no tiene una variación tampoco. El inverso no es verdad: hay las distribuciones para las cuales el valor previsto existe, pero no lo hace la variación.
Si la variable al azar es el discreto con el p 1 de la función de masa de probabilidad, …, el n , éste del del p es equivalente a (Nota: esta variación se debe dividir por la suma de pesos en el caso de una variación cargada discreto .) Es decir, es el valor previsto del cuadrado de la desviación del X de su propio medio. En lengua llana, puede ser expresado como " El promedio del cuadrado de la distancia de cada punto de referencias del mean". Es así la desviación media cuadrático del . La variación del X de la variable al azar se señala típicamente como Var ( X ), , o simplemente σ2. La variación es no negativa porque los cuadrados son positivos o cero. La variación de una variable al azar es 0 si y solamente si la variable es degenerada, es decir, adquiere un valor constante con la probabilidad 1, y la variación de una variable en un conjunto de datos es 0 si y solamente si todas las entradas tienen el mismo valor. La variación es el invariante con respecto a cambios en un parámetro de localización . Es decir, si un constante se agrega a todos los valores de la variable, la variación es sin cambios. Si todos los valores son escalados por un constante, la variación es escalada por el cuadrado de eso constante. Estas dos características se pueden expresar en la fórmula siguiente: La variación de una suma finita de variables al azar sin correlación es igual a la suma de sus variaciones. supone que las observaciones se pueden repartir en los subgrupos según una cierta segunda variable. Entonces la variación del grupo total es igual al medio de las variaciones de los subgrupos más la variación de los medios de los subgrupos. Esta característica se conoce como la descomposición de la variación o la ley de la variación total y desempeña un papel importante en el análisis de variación . Por ejemplo, suponer que un grupo consiste en un subgrupo de hombres y un subgrupo igualmente grande de mujeres. Suponer que los hombres tienen una longitud de cuerpo mala de 180 y que la variación de sus longitudes es 100. Suponer que las mujeres tienen una longitud mala de 160 y que la variación de sus longitudes es 50. Entonces medio de variación es (100 + 50)/2 = 75; la variación de los medios es la variación de 180, 160 que es 100. Entonces, porque el grupo total de hombres y las mujeres combinadas, la variación de las longitudes de cuerpo será 75 + 100 = 175. Observar que esto utiliza N para el denominador en vez de N - 1. In un caso más general, si los subgrupos tienen tamaños desiguales, después deben ser cargados proporcional a su tamaño en los cómputos de los medios y de las variaciones. La fórmula es también válida con más de dos grupos, e incluso si es la variable que agrupa la fórmula de continuous. This implica que la variación del grupo total no puede ser más pequeña que el medio de las variaciones de los subgrupos. Nota, sin embargo, que la variación total no es necesario más grande que las variaciones de los subgrupos. En el ejemplo antedicho, cuando analizan a los subgrupos por separado, la variación es influenciada solamente por las diferencias del hombre-hombre y las diferencias de la mujer-mujer. Si combinan a los dos grupos, sin embargo, después las diferencias de las hombre-mujeres entran en el Características
8. Variación del de la suma de las variables sin correlación
Una razón del uso de la variación preferentemente a otras medidas de dispersión es que la variación de la suma (o de la diferencia) de las variables al azar sin correlación es la suma de sus variaciones:
Esta declaración se hace a menudo con la condición más fuerte que las variables son la independiente, pero el uncorrelatedness es suficiente. Tan si las variables tienen la misma variación σ2, después, puesto que la división por el n es una transformación linear, esta fórmula implica inmediatamente que es la variación de su medio = \ operatorname {Var} \ (\ frac {1} {n} \ ^n X_i del sum_ {i=1} \ derecho) = dejado \ frac {1} {n^2} n \ sigma^2 del
Es decir, la variación del medio disminuye con el n . Este hecho se utiliza en la definición del error estándar del medio de muestra, que se utiliza en el teorema de límite central . Variación del de la suma de las variables correlacionadas
Generalmente si se correlacionan las variables, después la variación de su suma es la suma de sus covariaciones
Aquí Cov es la covariación, que es cero para las variables al azar independientes (si existe). La fórmula indica que la variación de una suma es igual a la suma de todos los elementos en la matriz de covariación de los componentes. Esta fórmula se utiliza en la teoría de la alfa de Cronbach en la teoría clásica de la prueba.
Tan si las variables tienen variación igual σ2 y la correlación media de variables distintas es ρ, después la variación de su medio es
de n
Esto implica que la variación del medio aumenta con el promedio de las correlaciones. Por otra parte, si las variables tienen variación de la unidad, por ejemplo si se estandardizan, después ésta simplifica a
de n
Esta fórmula se utiliza en la fórmula de la predicción de Lancero-Brown de la teoría clásica de la prueba. Esto converge al ρ si el n va al infinito, a condición de que la correlación media sigue siendo constante o converge también. Tan para la variación del medio de variables estandardizadas con correlaciones iguales o la correlación media convergente tenemos del operatorname {Var} (\ overline {X})
Por lo tanto, la variación del medio de una gran cantidad de variables estandardizadas es aproximadamente igual a su correlación media. Esto hace claramente que el medio de muestra de variables correlacionadas no converge generalmente al medio de población, aunque la ley de los grandes números indica que el medio de muestra convergerá para las variables independientes. Variación del de una suma cargada de las variables
Características 6 y 8, junto con esta característica de la página de la covariación : Cov (hacha,   del ; por ) =   del ab del ; Cov ( X, El Y ) implica en común eso
Esto implica eso en una suma cargada de variables, la variable con el peso más grande tendrá un peso desproporcionado grande en la variación del total. Por ejemplo, si el X y el Y son sin correlación y el peso del X es dos veces el peso del Y, después el peso de la variación del X ser cuatro veces el peso de la variación del Y . Descomposición del de la variación
La fórmula general para la descomposición de la variación o la ley de la variación total es: Si el X y el Y son dos variables al azar y existe la variación del X, entonces = \ operatorname {Var} del
Aquí, E ( X | El Y ) es la expectativa condicional dado Y del X, y Var ( X | El Y ) es la variación condicional del dado Y del X. (Una explicación más intuitiva de A es que dado un valor particular del Y, después el X sigue una distribución con E mala ( X | Y ) y variación Var ( X | Y ). La fórmula antedicha dice cómo encontrar Var ( X ) basado en las distribuciones de estas dos cantidades cuando el Y se permite variar.) Esta fórmula se aplica a menudo en el análisis de variación, donde está la fórmula correspondiente
También se utiliza en análisis de la regresión linear, donde está la fórmula correspondiente
Esto se puede también derivar de la aditividad de las variaciones (característica 8), puesto que la cuenta (observada) total es la suma de la cuenta prevista y de la cuenta del error, donde están sin correlación los 3ultimos dos. Fórmula de cómputo del para la variación
La fórmula de cómputo para la variación sigue de una manera directa de las linearidades de valores previstos y de la definición antedicha:
= \ operatorname {E} del = \ operatorname {E} del
Esto es de uso frecuente calcular la variación en la práctica, aunque sufra del error numérico de la aproximación si los dos componentes de la ecuación son similares en magnitud.
del Var
a condición de que el f es dos veces diferenciable y ése el medio y la variación del X es finito.
La variación de población de una población finita del N del tamaño se da generalmente cerca
o si la población es una población del extracto con la banda de la distribución de probabilidad:
donde está el medio el de población. Éste es simplemente un caso especial de la definición general de la variación introducida arriba, pero restringida a las poblaciones finitas.
En muchas situaciones prácticas, la variación verdadera de una población no es el sabido a priori y se debe computar de alguna manera. Al tratar de las poblaciones infinitas, esto es generalmente imposible.
Un método común está estimando la variación de poblaciones (finitas o infinitas) grandes de una muestra . ¡Tomamos un de los valores del n de la población, mucho más, pero porqué debemos nosotros? Hay dos cosas distintas que podemos hacer con esta muestra: primero, podemos tratarla como población finita y describir su variación; en segundo lugar, podemos estimar la variación de población subyacente de esta muestra. --estimación del >and la variación en base de esta muestra. Hay varios buenos peritos. Dos de ellos son bien sabido: = \ frac 1n \ ^n del sum_ {i=1} \ (y_i - \ overline {y} \ derecho) ^ dejado 2 del
l y = \ frac {1} {n-1} \ ^n del sum_ {i=1} \ (y_i - \ overline {y} \ derecho) = dejado \ frac {1} {n-1} \ ^n y_i^2 del
Ambos se refieren como variación de muestra del . La mayoría de las calculadoras electrónicas avanzadas pueden calcular y at la prensa de un botón, en este caso ese botón generalmente se etiqueta el o el para y para .
Los dos peritos diferencian solamente levemente como vemos, y para valores más grandes del n del tamaño de muestra la diferencia es insignificante. Segundo es un perito imparcial de la variación de población, significando que su valor previsto es igual a la variación verdadera de la variable al azar muestreada. Primer se puede ver como la variación de la muestra considerada como población.
El sentido común sugeriría para aplicar la fórmula de la población a la muestra también. La razón que es en polarización negativa es que el medio de muestra está generalmente algo más cercano a las observaciones en la muestra que el medio de población está a estas observaciones. Esto está tan porque el medio de muestra está por definición en el medio de la muestra, mientras que el medio de población puede incluso mentir fuera de la muestra. Las desviaciones al medio de muestra serán tan a menudo más pequeñas que las desviaciones al medio de población, y por eso, si la misma fórmula se aplica a ambos, después esta estimación de la variación en promedio será algo más pequeña en la muestra que en la población.
Una fuente común de confusión es que la variación de muestra del del término puede referir o al perito imparcial de la variación de población, o al de la variación de la muestra vista como población finita. Ambos se pueden utilizar para estimar la variación de población verdadera. Aparte de consideraciones teóricas, no importa realmente se utiliza cuál, en cuanto a pequeños tamaños de muestra que ambas son inexactas y para los valores grandes del n son prácticamente iguales. Ingenuo computando la variación dividiendo por el n en vez del n -1 subestima sistemáticamente la variación de población. Por otra parte, en usos prácticos la mayoría del informe de la gente la desviación estándar algo que la variación de muestra, y la desviación estándar que se obtiene de la versión imparcial del n -1 de la variación de muestra tiene un diagonal negativo leve (sin embargo para las muestras normalmente distribuidas una corrección leve teóricamente interesante pero raramente usada existe para eliminar este diagonal). Sin embargo, en estadísticas aplicadas es una convención para utilizar la versión del n -1 si la variación o la desviación estándar se computa de una muestra.
En la práctica, para grande, la distinción es a menudo de menor importancia. En el curso de medidas estadísticas, tamaños de muestra tan pequeños en cuanto a la autorización el uso de la variación imparcial virtualmente nunca ocurrir. En este contexto la prensa y otros comentó ese si la diferencia entre el de n y el &minus del de n; 1 importa nunca a usted, después usted está probablemente hasta ninguÌn buen de todos modos - e., intentar verificar una hipótesis cuestionable con datos marginales.
Como consecuencia directa, sigue ese .
Sin embargo, incluso en la ausencia de la asunción gausiana, es todavía posible probar que es imparcial para el .
Si es complejo - la variable al azar valorada, con valores en , después su variación es , donde está la conjugación del complejo de . Esta variación es también una matriz cuadrada semi-definite positiva.
.
| Random links: | Finley, Wisconsin | Cheiromeles | Pre-Cerámica B neolítico | Yvon Poitras | Huguette Oligny |