En las estadísticas descriptivas, un boxplot (también conocido como diagrama de la caja-y-barba del o el diagrama o la carta de la palmatoria del ) es una manera conveniente gráficamente de representar los grupos de datos numéricos con sus resúmenes (la observación más pequeña del cinco-número, una cuartila más baja (Q1), el mediano, la cuartila superior (Q3), y la observación más grande). Un boxplot también indica que qué observaciones, eventualmente, se pudieron considerar los afloramientos el boxplot fue inventado en 1977 por el americano Juan Tukey del estadístico.

Boxplots puede demostrar visualmente diversos tipos de las poblaciones, sin la fabricación de ningunas asunciones de la distribución estadística subyacente. Los espaciamientos entre las diversas partes de la ayuda de la caja indican la variación, oblicuidad e identifican afloramientos que Boxplots se puede dibujar u horizontalmente o verticalmente.

Construcción

Para un conjunto de datos, uno construye un diagrama horizontal de la caja de la manera siguiente:
Calcular la primera cuartila (x_ {.25} ), el mediano (x_ {.50} ) y la tercera cuartila (x_ {.75} )
Calcular la gama intercuartil (IQR) restando la primera cuartila de la tercera cuartila.25} )
Construir una caja sobre la línea de número limitada a la izquierda por la primera cuartila (x_ {.25} ) y a la derecha por la tercera cuartila (x_ {. La caja puede ser tan alta como una tiene gusto, aunque los boxplots razonablemente proporciónados sean acostumbrados.
Indicar donde el punto medio miente dentro de la caja con la presencia de un símbolo o de una línea que divide la caja en el valor mediano.
El valor medio de los datos se puede también etiquetar con un punto.
Cualquier observación de los datos que mienta más que el \ el scriptstyle 1.5 \ cdot \ mathrm {IQR} más bajo que la primera cuartila o el \ el scriptstyle 1.5 \ cdot \ mathrm {IQR} más arriba que la tercera cuartila se considera un afloramiento . Indicar donde está el valor más pequeño que no es un afloramiento al lado de una marca o de un " tic vertical; whisker", y conectar la barba con la caja vía una linea horizontal. Asimismo, indicar donde está el valor más grande que no es un afloramiento al lado de un " whisker", y conectar esa barba con la caja vía otra linea horizontal.
Indicar los afloramientos por los puntos abiertos y cerrados. " Extreme" los afloramientos, o los que mienten más de tres veces el IQR a los left and right de las primeras y terceras cuartilas, respectivamente, son indicados por la presencia de un punto abierto. " Mild" los afloramientos - es decir, esas observaciones que mientan más de 1.5 veces el IQR de la primera y tercera cuartila pero no son también afloramientos extremos son indicados por la presencia de un punto cerrado.
Agregar una etiqueta apropiada a la línea de número y titular el boxplot.
Un boxplot se puede construir de una manera similar verticalmente en comparación con horizontalmente simplemente intercambiando el " bottom" para el " left" y " top" para el " right" en la descripción antedicha.

Ejemplo

Una versión del plain-text pudo parecer esto:

+-----+-+ o * |-------| + | |---| +-----+-+ +---+---+---+---+---+---+---+---+---+---+ línea de número 0 1 2 3 4 5 6 7 8 9 10

Para este conjunto de datos :
la observación non- más pequeña del afloramiento = 5 (" izquierdo; whisker")
bajar (la primera) cuartila (Q1, el x_ {.25} ) = 7
mediano (segunda cuartila) (Med, x_ {.5
(tercera) cuartila superior (Q3, x_ {.75} ) = 9
la observación más grande del no-afloramiento = 10
Gama intercuartil, \ mathrm {IQR} = Q3-Q1 = 2
el valor 3.5 es un " mild" Afloramiento, entre el \ el scriptstyle 1.5 \ cdot \ mathrm {IQR} y el \ el scriptstyle 3 \ cdot \ mathrm {IQR} debajo de Q1
el valor 0.5 es un " extreme" Afloramiento, más que el \ el scriptstyle 3 \ cdot \ mathrm {IQR} debajo de Q1
los datos son sesgado al izquierdo ( negativamente sesgados)

Las lineas horizontales (el " whiskers") ampliar a lo más a 1.5 veces la anchura de la caja (la gama intercuartil ) de cualquier o ambos extremos de la caja. Deben terminar en un valor observado, así conectando todos los valores fuera de la caja que no son más de 1.5 veces la anchura de la caja lejos de la caja. Tres veces la anchura de la caja marca el límite entre el " mild" y " extreme" afloramientos. En este boxplot, " mild" y " extreme" los afloramientos son distinguidos por los puntos cerrados y abiertos, respectivamente.

Hay puestas en práctica alternativas de este detalle del diagrama de la caja en varios paquetes de programas informáticos, tales como las barbas que extienden a lo más (o más extremo) porcentajes 5th y 95th. Tales acercamientos no se ajustan a la definición de de Tukey, con su énfasis en el punto medio particularmente y los métodos de cuenta generalmente y ellos tienden a producir el " outliers" para todos los conjuntos de datos más en gran parte de diez, no importa qué la forma de la distribución.

Visualización

El boxplot es un acercamiento gráfico rápido para examinar uno o más sistemas de datos. Boxplots puede parecer más primitivo que un histograma o la función de densidad de probabilidad (pdf) pero tienen algunas ventajas. Además de espacio del ahorro en el papel, los boxplots son más rápidos generar a mano. Los histogramas y las funciones de densidad de probabilidad requieren las asunciones de la distribución estadística . Esta asunción puede ser una barrera importante porque las técnicas binning pueden influenciar pesadamente el histograma y los cálculos incorrectos de la variación afectarán pesadamente a la función de densidad de probabilidad.

Porque la mirada de una distribución estadística es más intuitiva que mirando un boxplot, comparar el boxplot contra la función de densidad de probabilidad (histograma teórico) para una distribución del normal N (0,1σ2) puede ser una herramienta útil para entender el boxplot (cuadro 2).

Ver también


análisis de datos exploratorio

.

  • Zenithic
  • Congotronics
    Random links:Vengador oscuro | Wisconsin y ferrocarril meridional | Sacudir las hojas | X: Más allá de la frontera | Dirección general para la sociedad de la información y los medios (Comisión Europea)

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">