En la probabilidad y las estadísticas, la desviación estándar de una distribución de probabilidad, la variable al azar, o la población o el conjunto múltiple de valores es una medida de la extensión de sus valores. Se denota generalmente con el σ de la letra (sigma minúscula ). Se define como la raíz cuadrada de la variación .

Para entender la desviación estándar, tener presente que la variación es el promedio del de las diferencias ajustadas entre los puntos de referencias y el medio. La variación se tabula en las unidades ajustadas. La desviación estándar, siendo la raíz cuadrada de esa cantidad, por lo tanto mide la extensión de datos sobre el medio, medida en las mismas unidades que los datos.

Dicha más formalmente, la desviación estándar es la desviación de la media cuadrada (RMS) de la raíz de valores de su medio aritmético .

Por ejemplo, en la población {4, 8}, el medio es 6 y las desviaciones del medio son {− 2, 2}. Esas desviaciones ajustadas son {4, 4} el promedio cuyo (la variación) es 4. Por lo tanto, la desviación estándar es 2. en este caso 100% de los valores en la población está en una desviación estándar del medio.

La desviación estándar es la acción más común de la dispersión estadística, midiendo cómo la extensión los valores en un conjunto de datos está extensamente. Si muchos puntos de referencias están cercanos al medio, después la desviación estándar es pequeña; si muchos puntos de referencias están lejos del medio, después la desviación estándar es grande. Si todos los valores de datos son iguales, después la desviación estándar es cero.

Para una población, la desviación estándar se puede estimar por una desviación estándar modificada ( s ) de una muestra . Las fórmulas se dan abajo.

Definición y cálculo

Un ejemplo simple

Suponer que deseábamos encontrar la desviación estándar del sistema de los números 4 y 8.

Paso 1 del : encuentran el medio aritmético (o el promedio) de 4 y 8, del

l (4+8)/2=6.

Paso 2 del : diferencia entre cada número y el medio,
4 - 6 del hallazgo de del
= 8 - 6 del
de -2 = 2.

Paso 3 del : cuadrado cada uno de del
2^2=4. del del de las diferencias (- 2) ^2=4

Paso 4 del : suma de los cuadrados obtenidos,
4+4=8. del

Paso 5 del : divisoria de la suma por la cuenta de los números (aquí tenemos dos números), 8/2 = 4.

Paso 6 del : toman la raíz cuadrada no negativa del cociente, \ raíz cuadrada {4} =2. del

l

Así pues, la desviación estándar es 2.

Desviación estándar de una variable al azar

La desviación estándar de un X de la variable al azar se define como: = \ raíz cuadrada {\ operatorname {Var} (x)} del del

l \ del del = \ raíz cuadrada {\ operatorname {E} (X^2) - (\ operatorname {E} (x)) ^2} = \ raíz cuadrada {\ operatorname {E} ((x \ operatorname {E} (x)) ^2)} de la sigma

donde está E ( X ) el valor previsto X, y el Var ( X ) es la variación X .

No el todas las variables al azar de tiene una desviación estándar, puesto que estos valores previstos no necesitan existir. Por ejemplo, la desviación estándar de una variable al azar que siga una distribución de Cauchy es indefinida porque su E ( X ) es indefinida.

Si el X de la variable al azar adquiere el de los valores \, \ puntea del scriptstyle x_1, x_N (que sean los números verdaderos con probabilidad igual, después su desviación estándar puede ser computado como sigue. Primero, el medio X, \ overline {x} , se define como adición : = \ frac {1} {N} \ = \ frac {x_1+x_2+ \ cdots+x_N} {N} del \ del overline del

l {x} del x_i del ^N del sum_ {i=1}

donde está el número el N de muestras recogidas. Después, la desviación estándar simplifica a = \ raíz cuadrada {\ frac {1} {N} \ ^N del sum_ {i=1} (- \ overline {x} del x_i) ^2} del \ de la sigma del

l .

Es decir la desviación estándar de un uniforme discreto X de la variable al azar puede ser calculada como sigue:

para cada valor x_i calcula el de la diferencia \ - \ overline {x} del x_i del scriptstyle entre el i del del x y el del valor medio \ el scriptstyle \ el overline {x} .

  • Calcular los cuadrados de estas diferencias.
  • Encontrar el promedio de las diferencias ajustadas. Esta cantidad es la variación σ2.
  • Tomar la raíz cuadrada de la variación.

    La expresión antedicha se puede también substituir por = \ raíz cuadrada del \ de la sigma del

    l {\ frac {1} {} \ dejado (\ ^N x_i^2 - N \ overline {x} ^2 de N del sum_ {i=1} \ derecho)}.

    La igualdad de estas dos expresiones se puede demostrar por un pedacito de la álgebra: el del

    l \ comienza {alinear} \ ^N del sum_ {i=1} (x_i - \ overline {x}) ^2 y = {} \ ^N del sum_ {i=1} (x_i^2 - 2 x_i \ overline {x} + \ del overline {x} ^2) \ \ y {} = \ ^N dejado (\ del sum_ x_i^2 {i=1} \ derecho) - \ dejado (2 \ x_i del ^N del overline {x} \ del sum_ {i=1} \ derecho) + \ de N \ del overline {x} ^2 \ y {} = \ ^N dejado (\ del sum_ x_i^2 {i=1} \ derecho) - 2 \ overline {x} (N \ overline {x}) + \ de N \ del overline {x} ^2 \ y {} = \ ^N dejado (\ del sum_ x_i^2 {i=1} \ derecho) - N \ overline {x} ^2. \ extremo {alinear}

    Cálculo de la desviación estándar de población de la desviación estándar de muestra

    En el mundo real, encontrar la desviación estándar de un toda la población es poco realista excepto en ciertos casos, tales como de prueba estandardizado, donde muestrean a cada miembro de una población. En la mayoría de los casos, la desviación estándar es estimada examinando una muestra escogida al azar recogida de la población. La acción más común usada es la desviación estándar de muestra del, que se define cerca

    s} ^2 \, = \ raíz cuadrada {\ frac {1} {N-1} \ ^N del sum_ {i=1} (- \ overline {x} del x_i),

    donde está la muestra el \ el scriptstyle \ {x_1, \, x_2, \, \, \, x_N de los ldots \} y \ scriptstyle \ el overline {x} es el medio de la muestra. El   del N del denominador; −   1 es el número de grados de la libertad en el vector \ scriptstyle (, \, \ puntea de x_1- \ del overline {x}, \, x_N- \ overline {x}) .

    La razón de esta definición es que el s 2 es un perito imparcial para la variación σ2 de la población subyacente, si existe esa variación y los valores de la muestra se dibujan independiente con el reemplazo. Sin embargo, el s es el no al perito imparcial para el σ de la desviación estándar; tiende a subestimar la desviación estándar de población. Aunque un perito imparcial para el σ se sepa cuando la variable al azar es el normalmente distribuido, la fórmula es complicada y asciende a una corrección de menor importancia. Por otra parte, la imparcialidad, en este sentido de la palabra, no es siempre deseable; ver el diagonal de un perito .

    Otro perito usado a veces es el similar del de la expresión \ raíz cuadrada {\ frac {1} {N} \ ^N del sum_ {i=1} (- \ overline {x} del x_i) ^2} \, \. Esta forma tiene un error medio cuadrático de un uniformemente más pequeño que el perito imparcial, y es la estimación de la probabilidad máxima cuando distribuyen la población normalmente.

    Desviación estándar de una variable al azar continua

    Las distribuciones continuas dan generalmente una fórmula para calcular la desviación estándar en función de los parámetros de la distribución. La desviación estándar de un X de la variable al azar continua con el p ( x ) de la función de densidad de probabilidad está generalmente = \ raíz cuadrada del \ de la sigma del

    l {\ internacional (x \ MU) ^2 \, p (x) \, dx} Donde \ MU del = \ internacional x \, p (x) \, dx

    Ejemplo

    Demostraremos cómo calcular la desviación estándar de una población. Nuestro ejemplo utilizará las edades de cuatro niños jovenes: {  5, 6, 8, 9 }. calcula el promedio malo, \ overline {x} : = \ frac {1} {N} \ ^N x_i del \ del overline del

    l {x} del sum_ {i=1}

    Tenemos N = 4 porque hay cuatro puntos de referencias: ¡

    l x_1 = 5 \, \! ¡
    de x_2 = 6 \, \! ¡
    de x_3 = 8 \, \! ¡
    de x_4 = 9 \, \! = \ frac {1} {4} \   del \ del overline del

    l {x} del sum_ {i=1} ^4 x_i;           Reemplazo del N por 4 = \ frac {1} {4} \ (x_1 + x_2 + x_3 +x_4 \ derecho) dejado del \ del overline del

    l {x} = \ frac {1} {4} \ (5 + 6 + 8 + 9 \ derechos) dejado del \ del overline del

    l {x} del

    l \ overline {x} =   7;   Éste es el medio. calcula la desviación estándar, \ sigma \, \! . (Puesto que los cuatro valores representan a toda la población, no utilizamos la fórmula para la desviación estándar estimada en este caso): = \ raíz cuadrada {\ frac {1} {N} \ ^N del sum_ {i=1} (- \ overline {x} del x_i) ^2} del \ de la sigma del

    l del

    l \   = \ raíz cuadrada {\ frac {1} {4} \ sum_ {i=1} ^4 (- \ overline {x} del x_i) ^2} de la sigma;           Reemplazo del N por 4 = \ raíz cuadrada del \ de la sigma del

    l {\ frac {1} {4} \   del sum_ {i=1} ^4 (x_i - 7)^2} ;           Reemplazo del \ del overline {x} por 7

    \ sigma = \ raíz cuadrado {\ frac {1} {4} \ dejados (x_1 - 7)^2 + (x_2 - 7)^2 + (x_3 - 7)^2 + (x_4 - 7)^2 \ derecho}

    \ sigma = \ raíz cuadrado {\ frac {1} {4} \ dejados (5 - 7)^2 + (6 - 7)^2 + (8 - 7)^2 + (9 - 7)^2 \ derechos} = \ raíz cuadrada {\ frac {1} {4} \ dejados ((- 2) ^2 + (- 1) ^2 + 1^2 + 2^2 \ derecho)} del \ de la sigma del

    l = \ raíz cuadrada {\ frac {1} {4} \ dejados (4 + 1 + 1 + 4 \ derechos)} del \ de la sigma del

    l = \ raíz cuadrada {\ frac {10} {4}} del \ de la sigma del

    l

    \ sigma = \ raíz cuadrado {2.5} \ aproximadamente 1.58

    La desviación estándar de las edades de los cuatro niños es tan la raíz cuadrada de 2.5, o aproximadamente 1.

    Estaba este sistema a la muestra extraída de una población más grande de niños, y la pregunta actual era una estimación de la desviación estándar de la población, la convención substituiría el N del denominador (o 4) en el paso 2 aquí con &minus del N ; 1 (o 3).

    Interpretación y uso

    Una desviación estándar grande indica que los puntos de referencias están lejos del medio y una pequeña desviación estándar indica que están arracimados de cerca alrededor del medio.

    Por ejemplo, cada uno de los tres conjuntos de datos {0, 0, 14, 14}, {0, 6, 8, 14} y {6, 6, 8, 8} tiene un medio de 7. Sus desviaciones estándar son 7, 5, y 1, respectivamente. El tercer sistema tiene una desviación estándar mucho más pequeña que los otros dos porque sus valores son todos cerca de 7. En un sentido flojo, la desviación estándar nos dice que hasta dónde del medio los puntos de referencias tienden a ser. Tendrá las mismas unidades que los puntos de referencias ellos mismos. Si, por ejemplo, el conjunto de datos {0, 6, 8, 14} representa las edades de cuatro hermanos en años, la desviación estándar es 5 años del .

    Mientras que otro ejemplo, el conjunto de datos {1000, 1006, 1008, 1014} puede representar las distancias viajaron por cuatro atletas en 3 minutos, medidos en metros. Tiene un medio de 1007 metros, y una desviación estándar de 5 metros del .

    La desviación estándar puede servir como medida de incertidumbre. En ciencia física por ejemplo, la desviación estándar divulgada de un grupo de las medidas repetidas debe dar la precisión de esas medidas. Al decidir a si las medidas convienen con una predicción teórica, la desviación estándar de esas medidas es de importancia crucial: si el medio de las medidas es demasiado lejano de la predicción (con la distancia medida en desviaciones estándar), después consideramos las medidas como contradicción de la predicción. Esto tiene sentido puesto que caen fuera de la gama de valores que se podrían razonablemente esperar para ocurrir si la predicción estaba correcta y la desviación estándar cuantificada apropiadamente. Ver el intervalo de la predicción.

    Ejemplos de la vida real

    El valor práctico de entender la desviación estándar de un sistema de valores consiste en la apreciación de cuánto variación allí es del " average" (medio).

    Tiempo
    Como ejemplo simple, considerar las temperaturas medias para las ciudades. Mientras que dos ciudades pueden cada uno tener una temperatura media del °F de 60, es provechoso entender que la gama para las ciudades cerca de la costa es más pequeña que para las ciudades interiores, que aclara que, mientras que el promedio es similar, la ocasión para la variación es mayor interior que cerca de la costa.

    Así pues, un promedio de 60 ocurre para una ciudad con colmos del °F 80 y puntos bajos del °F 40, y también ocurre para otra ciudad con colmos de 65 y puntos bajos de 55. La desviación estándar permite que reconozcamos que el promedio para la ciudad con la variación más amplia, y así una desviación de la mayor nivel, no ofrezcan tan confiable una predicción de la temperatura como la ciudad con la variación más pequeña y no bajen la desviación estándar.

    Deportes

    Otra manera de considerarlo es considerar a equipos de deportes. En fijado de categorías, habrá los equipos que clasifican alto en algunas cosas y mal en otros. Las ocasiones son, los equipos que llevan en las situaciones no demostrarán tal disparidad, sino serán bastante buenos en la mayoría de las categorías. Cuanto más baja es la desviación estándar de sus grados en cada categoría, el el más equilibrado y constante puede ser que sean. Así pues, un equipo que es constantemente malo en la mayoría de las categorías tendrá una desviación estándar baja. Un equipo que es constantemente bueno en la mayoría de las categorías también tendrá una desviación estándar baja. Un equipo con una desviación de la mayor nivel pudo ser el tipo de equipo que anota mucho (ofensa fuerte) pero también concede mucho (defensa débil), o, viceversa, que pudo tener una ofensa pobre pero compensa siendo difícil anotar a en-equipos con una desviación de la mayor nivel será más imprevisible.

    Intentando predecir qué equipos, en cualquier día dado, ganen, puede incluir la mirada de las desviaciones estándar del vario " del equipo; stats" grados, en los cuales las anomalías pueden emparejar fuerzas contra debilidades para intentar entender qué factores pueden prevalecer como indicadores más fuertes de resultados que anotan eventual.

    En competir con, un conductor se mide el tiempo en regazos sucesivos. Un conductor con una desviación estándar baja de los tiempos de regazo es más constante que un conductor con una desviación de la mayor nivel. Esta información se puede utilizar para ayudar a entender donde las oportunidades se pudieron encontrar para reducir tiempos de regazo.

    Finanzas
    En finanzas, la desviación estándar es una representación del riesgo asociado a una seguridad dada (acción, enlaces, característica, etc.), o el riesgo de una lista de seguridades. El riesgo es un factor importante en la determinación de cómo manejar eficientemente una lista de inversiones porque determina la variación en vueltas en el activo y/o la lista y da a inversionistas una base matemática para las decisiones de inversión. El concepto total de riesgo es que como aumenta, la vuelta prevista en el activo aumentará como resultado del premio de riesgo ganado - es decir los inversionistas deben contar con un rendimiento más alto de un capital invertido cuando la inversión dicha lleva un de alto nivel del riesgo.

    Por ejemplo, usted tiene una opción entre dos acción: Almacenar A vuelve históricamente el 5% con una desviación estándar de el 10%, mientras que la acción B vuelve el 6% y lleva una desviación estándar de el 20%. En base de riesgo y de vuelta, un inversionista puede decidir que la acción A es la mejor opción, porque el punto de porcentaje adicional de la acción b de la vuelta generado (un 20% adicional en términos del dólar) no está digno de doble el grado de riesgo asociado a A. común B común es probable faltar la inversión inicial más a menudo que A bajo mismas circunstancias, y volverá solamente un punto de porcentaje más en promedio. En este ejemplo, almacenar A tiene el potencial para ganar el 10% más que la vuelta prevista, pero es igualmente probable ganar el 10% menos que la vuelta prevista.

    El cálculo de la vuelta media (o del medio aritmético) de una seguridad sobre un número dado de períodos generará una vuelta prevista en el activo. Para cada período, restando la vuelta prevista de los resultados de vuelta reales en la variación. Ajustar la variación en cada período para encontrar el efecto del resultado en el riesgo total del activo. Cuanto más grande es la variación en un período, mayor el riesgo que la seguridad lleva. Tomar el promedio de las variaciones ajustadas da lugar a la medida de las unidades totales de riesgo asociadas al activo. Encontrar la raíz cuadrada de esta variación dará lugar a la desviación estándar de la herramienta de la inversión en la pregunta. Utilizar esta medida, combinada con la vuelta media en la seguridad, como base para comparar seguridades.

    Interpretación geométrica

    Para ganar algunas penetraciones geométricas, comenzaremos con una población de tres valores, x 1, x 2, x 3. Esto define un P del punto = (el x 1, el x 2, el x 3) en el R 3. Considerar la línea L = {(el r, el r, el r ): r en el R }. Éste es el " diagonal" principal; el pasar con el origen. Si nuestros tres valores dados fueran todos igual, después la desviación estándar sería cero y el P mentiría en el L . No es tan desrazonable asumir que la desviación estándar está relacionada con la distancia P a el L . Y ése es de hecho el caso. La mudanza ortogonal desde el P a la línea L, uno golpea el punto: R del

    l = (\ overline {x}, \, \ overline {x} del overline {x})

    de quién coordenadas son el medio de los valores comenzamos con. Una poca álgebra demuestra que la distancia entre el P y el R (cuál es igual que la distancia entre el P y la línea L ) es dada por σ√ 3 . Una fórmula análoga (con 3 substituidos por el N ) es también válida para una población de valores del N ; entonces tenemos que trabajar en el N del del R .

    Reglas para los datos normalmente distribuidos

    En la práctica, uno asume a menudo que los datos son aproximadamente de una población normalmente distribuida . Esto es justificada con frecuencia por el teorema de límite central clásico, que dice que las sumas de muchos independiente, las variables al azar idéntico-distribuidas tiende hacia el de distribución normal como límite. Si se justifica esa asunción, después los cerca de 68% de los valores están dentro de 1 desviación estándar del medio, los cerca de 95% de los valores están dentro de dos desviaciones estándar y de mentira del cerca de 99.7% dentro de 3 desviaciones estándar. Se sabe esto como la regla 68-95-99.7 del, o la regla empírica

    Los intervalos de confianza son como sigue:

    Desigualdad de Chebyshev

    La desigualdad de Chebyshev prueba que en cualquier conjunto de datos, casi todos los valores serán más cercanos al valor medio, donde el significado del " cerca de " es especificado por la desviación estándar. La desigualdad de Chebyshev exige eso para (casi) todas las distribuciones al azar, no apenas normal unos, nosotros tiene los límites más débiles siguientes: el

    por lo menos el 50% del de los valores está dentro de 1.41 desviaciones estándar del medio. El
    por lo menos el 75% de los valores está dentro de 2 desviaciones estándar del medio. El
    por lo menos el 89% de los valores está dentro de 3 desviaciones estándar del medio. El
    por lo menos el 94% de los valores está dentro de 4 desviaciones estándar del medio. El
    por lo menos el 96% de los valores está dentro de 5 desviaciones estándar del medio. El
    por lo menos el 97% de los valores está dentro de 6 desviaciones estándar del medio. El
    por lo menos el 98% de los valores está dentro de 7 desviaciones estándar del medio.

    Y en general:

    l por lo menos (1 − 1 × 100% del k 2) de los valores están dentro de desviaciones estándar del k del medio.

    Relación entre la desviación estándar y el medio

    La desviación mala y estándar de un sistema de datos se divulga generalmente junta. En cierto sentido, la desviación estándar es un " natural" medida de la dispersión estadística si el centro de los datos se mide sobre el medio. Esto es porque la desviación estándar del medio es más pequeña que de cualquier otro punto. La declaración exacta es la siguiente: suponer el x 1,…, el n del del x son números verdaderos y definen la función: \ sigma del

    l (r) = \ raíz cuadrada {\ frac {1} {N-1} \ ^N del sum_ {i=1} (x_i - r)^2}

    Usar el cálculo, o simplemente por el que termina el cuadrado, es posible demostrar que el σ ( r ) tiene un mínimo único en el medio: = \ overline {x} del r del

    l . \,

    (Esto se puede también hacer con álgebra bastante simple solamente, desde σ 2 ( r ) se compara a un polinomio cuadrático).

    El coeficiente de variación de una muestra es el cociente de la desviación estándar al medio. Es un número sin dimensiones que se puede utilizar para comparar la cantidad de variación entre las poblaciones con diversos medios.

    Métodos rápidos del cálculo

    (Perceptiblemente para funcionar la desviación estándar) una manera levemente más rápida de computar la desviación estándar de población es dada por la fórmula siguiente (aunque las consideraciones se deben hacer para el error Round-off, el desbordamiento aritmético, y las condiciones del desbordamiento de capacidad inferior aritmético ):

    \ sigma \ = \ raíz cuadrado {\ dejado (\ frac {1} {N} \ ^N del sum_ {i=1} \ derecho) - \ overline {x} ^2} = \ raíz cuadrado {\ dejado (\ frac {1} {N} \ ^N del sum_ {i=1} \ derecho) - \ ido (\ frac {1} {N} \ ^N del sum_ {i=1} \ derecho) ^2} = \ frac {1} {- \ dejado (\ ^N del sum_ {i=1} \ derecho)} \ raíz cuadrada {N \ ^N dejado (\ del sum_ {i=1} \ derecho) de N^2}

    o

    \ sigma= \ frac {1} {s_0} \ raíz cuadrada {s_0s_2-s_1^2}

    donde la energía suma el s 0, el s 1, s 2 se define cerca del

    l \ ^N del s_j= \ del sum_ {k=1} {x_k^j}.

    Semejantemente para la desviación estándar de muestra:

    s = \ raíz cuadrado {\ frac {\ ^N del sum_ {i=1} - N \ overline {x} ^2} {N-1} \}.

    O de sumas corrientes:

    s = \ raíz cuadrada {\ frac {- \ dejado (\ ^N del sum_ {i=1} {x_i} \ derecho) del ^N de N \ del sum_ {i=1} ^2} {N (N-1)}}.

    El considera también los algoritmos para la variación calculadora .

    Ver también

    style=" del
    Algoritmos para la variación calculadora
    una desigualdad en los parámetros de la localización y de la escala
    Desigualdad de Chebyshev
    Intervalo de confianza
    Cumulante
    Desviación (estadísticas)
    Desviación estándar geométrica
    Curtosis
    Error absoluto malo
    malo
    Desviación estándar reunida
    Cuenta cruda
    Media cuadrada de la raíz
    Tamaño de muestra
    Saturación (teoría) del color
    Oblicuidad
    Error estándar
    Cuenta estándar
    Volatilidad
    Método de Yamartino para la desviación estándar calculadora de la dirección de viento
  • .

  • Zenithic
  • Edmond François Valentin About
    Random links:Hokkaido Railway Company | Poseidon que ahoga el sistema de detección | Es una vergüenza sobre rayo | Jarry (metro de Montreal) | Partido Republicano (Guam)

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">