Los m3inimos cuadr3aticos lineares son una técnica matemática de la optimización para encontrar una solución aproximada para un sistema de las ecuaciones lineares que no tenga ninguna solución exacta. Esto sucede generalmente si el número de ecuaciones ( m ) es más grande que el número de las variables ( n ). (Véase también la regresión linear .)
En términos matemáticos, queremos encontrar un de la solución para el " equation"
del mathbf {x}
donde está un el A sabido m - por la matriz n (generalmente con el m > el n ), el x es un desconocido n - el vector dimensional del parámetro, y el b es un sabido m - vector dimensional de la medida. Más exacto, queremos reducir al mínimo la norma euclidiana ajustada del residual del A &minus de x de ; b, es decir, la cantidad
donde el i del denota el i - componente del th del del A del vector x . Por lo tanto el " conocido; " de los m3inimos cuadr3aticos;. Usar el hecho de que la norma ajustada del v sea el v v T, donde los soportes del v T para el transportan del v, reescribir la expresión como ^T del El b T ( de dos términos medios del A x ) y ( del A x ) el b de T son igual y el mínimo se encuentra en el cero del derivado con respecto al x, ¡Por lo tanto el es una solución del Observar que esto corresponde a un sistema de las ecuaciones lineares . El A del A T de la matriz en el lado izquierdo es un n - por la matriz cuadrada del n, que es inversible si el A tiene fila completa de la columna (es decir, si la fila A es el n ). En ese caso, la solución del sistema de ecuaciones lineares es única y dada cerca ¡ El ^ del se llama el pseudoinverse A . No podemos utilizar la matriz verdadera inverso A (es decir, ), porque no existe pues el A no es una matriz cuadrada ( n del ≠ del m ). Si el ATA de la matriz tiene fila completa y bien-se condiciona, las ecuaciones normales pueden ser solucionadas directo usando el ATA de la descomposición de Cholesky = el RTR, dando: donde está una matriz el R triangular superior. Un más método numéricamente estable más lento pero, que todavía trabaja si el A no es fila completa, puede ser obtenido computando el de la descomposición QR A = Q R . Uno puede entonces solucionar el donde está el Q una matriz ortogonal y el R es una matriz triangular superior. Una tercera alternativa es utilizar la descomposición (SVD) del valor singular. Si el es la descomposición del valor singular del A, después el pseudoinverse del A de la matriz es V Σ+ U*, tan El método de m3inimos cuadr3aticos linear se puede utilizar para encontrar un para afinar el R del → del R n de la función que los mejores ajustes un sistema de datos dado (véase el método general de los m3inimos cuadr3aticos ). Está extensamente y pensó erróneamente que el linear de la palabra en la regresión linear del término refiere a linear o afina la naturaleza de la función cabida. Por ejemplo = de la gamma x^2 todavía está un modelo de regresión linear, porque el lado derecho es una combinación linear del α, del β, y del γ de los parámetros; por otra parte, las estimaciones de los m3inimos cuadr3aticos de esos parámetros son lineares en el vector del observado y - valores. En este caso es útil pensar en el x 2 como nueva variable independiente, formado modificando el variable original x . Sin embargo, es convención para llamar esto un ajuste cuadrático o un ajuste del polinomio 2nd-order. Escribimos la función linear que intentamos encontrar como 1 por el x T de la matriz del n (así que el x es realmente un vector de la columna, ve también la transformación linear ). El sistema de datos consiste en el m (  del n ; + tuples ( x 1,…, n Entonces, del A del x &asymp de ; b rinde el x de la función que buscamos. Otra desventaja del perito de m3inimos cuadr3aticos es el hecho de que intenta reducir al mínimo la norma del error de medida, del A x &minus de ; b . En muchos casos, uno está verdad interesado en la obtención de pequeño error en el x, e., un pequeño valor del parámetro del . Sin embargo, puesto que el x es desconocido, esta cantidad no puede ser reducida al mínimo directo. Si una probabilidad anterior en el x se sabe, después un Bayes que el perito se puede utilizar para reducir al mínimo el error medio cuadrático, . El método de m3inimos cuadr3aticos es a menudo aplicado cuando no se sabe ninguÌn anterior., Sin embargo, mejores peritos se pueden construir asombrosamente, un efecto conocido como fenómeno de Stein. Por ejemplo, si el error de medida es el gausiano, se saben varios peritos que el domina, o superan, la técnica de los m3inimos cuadr3aticos; el más conocido de éstos es el perito de James-Stein. Podemos entonces formar el A de la matriz: el y el y entonces el Así pues, la ecuación normal es el .
Cómputo
donde está la transposición Σ+ de Σ con cada entrada diferente a cero substituida por su recíproco. Este método es lo más de cómputo posible el intensivo, pero es particularmente útil si el A de la matriz es muy ill-conditioned (es decir si su número de la condición multiplicado por el error Round-off relativo de la máquina es apreciable grande). En ese caso, incluyendo los valores singulares más pequeños de la inversión agrega simplemente ruido numérico a la solución. Esto se puede curar usar el acercamiento truncado de SVD, donante de una respuesta más estable y más exacta, explícitamente fijando a cero todos los valores singulares debajo de cierto umbral y tan no haciendo caso de ellos, antes de calcular el pseudoinverse. Usos
Limitaciones
¡El acercamiento de los m3inimos cuadr3aticos confía en el cálculo del pseudo . Pseudo lo contrario se garantiza para existir para cualquie lleno-alinea la matriz . Sin embargo, el de la matriz es en algunos casos el Ill-conditioned; esto ocurre cuando las medidas marginal se relacionan solamente con los parámetros estimados. En estos casos, la estimación de los m3inimos cuadr3aticos amplifica el ruido de la medida, y puede ser grueso inexacta. Esto puede ocurrir incluso cuando pseudo lo contrario sí mismo se puede calcular exactamente numéricamente. Las varias técnicas de la regularización se pueden aplicar en tales casos, el más común cuyo se llama la regularización de Tikhonov. Si la información adicional sobre los parámetros se sabe, por ejemplo, una gama de valores posibles del x, después las técnicas del punto de silla se pueden también utilizar para aumentar la estabilidad de la solución. Ejemplo
Considerar los puntos (0, 3), (2, 3), (4, 4), (− 1, 2). Buscamos una solución del x del α de la forma + β = el y, es decir, el Ver también
Valoración de los m3inimos cuadr3aticos de los coeficientes de regresión linear
El alisar y diferenciación numéricos
Regularización de Tikhonov
Perito de James-Stein Random links: Filosofía de la ciencia | Venda de jazz | El Ministerio de Finanzas de la República Popular de China | Burgazada | Facturaciones de Lem