En las estadísticas, la regresión linear es un método de la regresión que modela la relación entre un Y, i , i de la variable dependiente del del X de las variables independientes = 1,…, el p, y un ε al azar del término. El modelo se puede escribir como = \ beta_0 del de X_p del beta_p donde está la intercepción el (" constant" el término), el s es los parámetros respectivos de variables independientes, y es el número de parámetros que se estimarán en la regresión linear. La regresión linear se puede poner en contraste con la regresión no linear . Este método se llama " linear" porque la relación de la respuesta (la variable dependiente ) a las variables independientes se asume para ser una función linear de los parámetros. Está a menudo pensó erróneamente que la razón la técnica está llamada " regression" linear; está eso el gráfico del = \ beta_ {0} del es una línea recta o ese es una función linear de las variables del X . Pero si es el modelo (por ejemplo) = \ alfa del de la gamma x^2 el problema sigue siendo uno de regresión linear del, es decir, linear en y respectivamente, aunque el gráfico en por sí mismo no es una línea recta. Es decir se puede considerar una función linear de los parámetros ( y ), aunque no es una función linear de . Ambos de Legendre y del gauss aplicados el método al problema de determinar, de observaciones astronómicas, las órbitas de cuerpos sobre el sol. El Euler había trabajado en el mismo problema (1748) sin éxito. El gauss publicó otro desarrollo de la teoría de m3inimos cuadr3aticos en 1821, incluyendo una versión del teorema Gauss-De Markov . Un sombrero, , sobre variable denota que se ha estimado la variable o el parámetro, por ejemplo, , estimaba los valores del β del vector del parámetro. El modelo de regresión linear se puede escribir en la notación de la vector-matriz como El ε del término es el " del modelo; term" del error ; (un nombre incorrecto solamente un uso estándar) y representa la variación unpredicted o inexplicada en la variable de la respuesta; convencionalmente se llama el “error” si es realmente un error de medida o no, y se asume para ser independiente del . Para la regresión linear simple, donde hay solamente un solo variable explicativo y dos parámetros, la ecuación antedicha reduce a: l Una formulación equivalente que demuestra explícitamente la regresión linear mientras que un modelo de la expectativa condicional se puede dar como con la distribución condicional y dado el x es idéntico a la distribución del término del error. ¡ ¡ ¡ considera también: los m3inimos cuadr3aticos El análisis de los m3inimos cuadr3aticos fue desarrollado por el Carl Friedrich Gauss en el 1820s. Este método utiliza el gauss siguiente - asunciones de Markov : Una regresión linear con coeficientes del p y la regresión interceptan β0 y los puntos de referencias del n (tamaño de muestra), con el permite la construcción de los vectores siguientes y la matriz con errores estándar asociados: o, de la notación de la vector-matriz arriba, Cada punto de referencias se puede dar como el , de donde el t sigue la distribución T del estudiante con grados de El % donde Los % de La suma de la regresión del SSR de los cuadrados se da cerca (también comúnmente llamado RSS): donde La suma del error del ESS de los cuadrados se da cerca: La suma total de TSS del de los cuadrados se da cerca El coeficiente de Pearson de la regresión, ² de R entonces se da como Los diagramas siguientes se pueden construir para probar la validez de las asunciones: Un diagrama normal de la probabilidad de las residuales de probar normalidad. Los puntos deben mentir a lo largo de una línea recta. No debe haber ninguÌn patrón sensible a los datos en todos sino el primer diagrama. usar el intervalo de confianza para cada uno de los parámetros, cargó los m3inimos cuadr3aticos, que es una generalización del método de m3inimos cuadr3aticos cuál al usar la notación de matriz pura permanece, como antes, y el vector de coeficientes polinómicos es Un anfitrión de acercamientos alternativos al cómputo de los parámetros de la regresión se incluye en la categoría conocida como regresión robusta . Una técnica reduce al mínimo el error absoluto malo, o una cierta otra función de las residuales, en vez de error medio cuadrático como en la regresión linear. La regresión robusta es mucho más de cómputo intensiva que la regresión linear y es algo más difícil de ejecutar también. Mientras que las estimaciones de los m3inimos cuadr3aticos no son muy sensibles a romper la normalidad de la asunción de los errores, ésta no es verdad cuando la variación o el medio de la distribución de error no se limita, o cuando un analista que puede identificar afloramientos es inasequible. En la cultura de Stata, la regresión robusta del significa la regresión linear con las estimaciones de error estándar Huber-Blancas. Esto relaja la asunción Homoscedasticity para las estimaciones de la variación solamente; los calculadores son estimaciones todavía ordinarias de los m3inimos cuadr3aticos (OLS). Una línea de tendencia del representa una tendencia, el movimiento de largo plazo en datos de la serie de tiempo después de que se hayan explicado otros componentes. Dice si un conjunto de datos particular (decir el GDP, los precios del petróleo o los precios de las acciones) ha aumentado o ha disminuido durante el periodo de tiempo. Una línea de tendencia se podría dibujar simplemente por el ojo a través de un sistema de puntos de referencias, pero más correctamente su posición y cuesta se calcula usar técnicas estadísticas como la regresión linear . Las líneas de tendencia son típicamente líneas rectas, aunque algunas variaciones utilicen polinomios de un grado más alto dependiendo del grado de curvatura deseado en la línea. Las líneas de tendencia se utilizan a veces en analytics del negocio para demostrar cambios en datos en un cierto plazo. Esto tiene la ventaja de ser simple. Las líneas de tendencia son de uso frecuente sostener que una acción o un acontecimiento particular (tal como entrenamiento, o una campaña publicitaria) causó cambios observados en un punto a tiempo. Esto es una técnica simple, y no requiere un grupo de control, un diseño experimental, o una técnica sofisticada del análisis. Sin embargo, sufre de una carencia de la validez científica en caso de que otros cambios potenciales puedan afectar a los datos. Observaciones históricas
La forma más temprana de regresión linear era el método de los m3inimos cuadr3aticos, que fue publicado por el Legendre en 1805, y por el gauss en 1809. El término “m3inimos cuadr3aticos” es del término de Legendre, carrés de los moindres del . Sin embargo, el gauss demandó que él había sabido el método desde 1795. Notación y convención de nombramiento
En la notación abajo:
un vector de variables se denota usar una flecha en negrita sobre el vector, tal como
las matrices se denotan usar una fuente en negrita, tal como X
un vector de los parámetros (" constants") está un en negrita β sin subíndice Un vector del β de los matriz-tiempos del X se escribe como Xβ . La variable dependiente, Y en la regresión convencionalmente se llama el " Respuesta variable. " Las variables independientes (en forma del vector) se llaman las variables explicativas o los regressors. Otros términos incluyen el " variables exógenas, " " variables de entrada, " y " variables" del calculador;. El modelo de regresión linear
Tipos de regresión linear
Hay muchos diversos acercamientos a solucionar el problema de la regresión, es decir, determinando las estimaciones convenientes para los parámetros. ¡técnicas populares son los m3inimos cuadr3aticos y la regresión robusta . --> Análisis de los m3inimos cuadr3aticos
El i
El i del ε de los errores al azar es sin correlación (éste es más débil que una asunción de la independencia de probabilidad ).
El i del ε de los errores al azar es el homoscedástico, es decir, todos tienen la misma variación . (Véase también el teorema Gauss-De Markov ). Estas asunciones implican que las estimaciones de los m3inimos cuadr3aticos de los parámetros son óptimas en cierto sentido.
Determinación del modelo de los m3inimos cuadr3aticos
Los valores antedichos se han corregido una vez, el modelo se deben comprobar para saber si hay dos diversas cosas: Si las asunciones de m3inimos cuadr3aticos están satisfechas y Comprobación de las asunciones modelo
Las asunciones modelo son comprobadas calculando las residuales y trazándolas. Se calculan las residuales como sigue:
Comprobación de la validez modelo
La validez del modelo se puede comprobar usar métodos siguientes uces de los: Modificaciones del análisis de los m3inimos cuadr3aticos
Hay las varias maneras diferentes en incluyendo las cuales el análisis de los m3inimos cuadr3aticos se puede modificar
el del
guarnición polinómica, que implica el caber de un polinomio a los datos dados. Guarnición polinómica
Un ajuste polinómico es un tipo específico de regresión múltiple. El modelo de regresión simple (un polinomio de primer orden) se puede extender a órdenes más altas. El y_i del
Regresión robusta
Usos de la regresión linear
La línea de tendencia el del de
para las líneas de tendencia según lo utilizado en el análisis técnico, considera las líneas de tendencia (análisis técnico) Ejemplos
La regresión linear es ampliamente utilizada en biológico, del comportamiento y ciencias sociales describir relaciones entre las variables. Alinea como una de las herramientas más importantes usadas en estas disciplinas. Medicina
Como un ejemplo, la evidencia temprana que se relacionaba el consumo de tabaco con la mortalidad y la morbosidad vino de los estudios que empleaban la regresión. Los investigadores incluyen generalmente varias variables en su análisis de regresión en un esfuerzo para quitar los factores que pudieron producir las correlaciones falsas por el ejemplo del tabaquismo, los investigadores pudieron incluir estado socioeconómico además de fumar para asegurarse de que ninguÌn efecto observado de fumar en mortalidad no es debido a un cierto efecto de la educación o de la renta. Sin embargo, nunca es posible incluir todas las variables posibles de la confusión en un estudio que emplea la regresión. Para el ejemplo que fumaba, un gene hipotético pudo aumentar mortalidad y también hacer a gente fumar más. Por esta razón, el los ensayos controlados seleccionados al azar se considera ser más digno de confianza que un análisis de regresión. Finanzas
La regresión linear es la base del modelo de tasación de activo fijo, y del concepto de usar el beta para analizar y cuantificar el riesgo sistemático de una inversión. Esto viene directo del coeficiente beta del modelo de regresión linear que se relaciona el rendimiento del capital invertido con la vuelta en todos los activos aventurados.
Random links: Edward VIII del Reino Unido | Duluth, Georgia | ISO 3166-2: BG | Bruno el bandido | Arturo Lewis (economista)