l para los significados alternos considera el perceptrón (desambiguación) . El perceptrón es un tipo de la red de los nervios artificial inventada en el 1957 en el laboratorio aeronáutico de Cornell por el Frank Rosenblatt . Puede ser visto como la clase más simple de la red de los nervios del feedforward: un clasificador linear .
donde está un vector de pesos y del es el producto de punto (que computa una suma cargada). es el “diagonal”, un término constante que no dependa de ninguÌn valor de la entrada.
El valor del (0 o 1) se utiliza para clasificar como caso positivo o negativo, en el caso de un problema binario de la clasificación. El diagonal se puede pensar en como compensación de la función de la activación, o el donante la neurona de la salida de un " base" nivel de actividad. Si es negativo, después la combinación cargada de entradas debe producir un valor positivo mayor que para empujar la neurona del clasificador sobre los 0 umbrales. Espacial, el diagonal altera la posición (sin embargo no la orientación) del límite de la decisión.
Puesto que las entradas se alimentan directo a la unidad de salida vía las conexiones cargadas, el perceptrón se puede considerar la clase más simple de red de los nervios del feed-forward.
Los pesos son actualizados después de cada entrada según la regla de la actualización abajo: ¡
Por lo tanto, el aprendizaje se modela como el vector del peso que es actualizado después de una iteración, que ocurrirá solamente si la salida es diferente del de la salida. Todavía en vista de una sola neurona pero de intentar incorporar iteraciones múltiples, dejarnos primero definen más variables:
el
denota el vector de la entrada para la iteración del yo-th
denota el vector del peso para la iteración del yo-th
denota la salida para la iteración del yo-th
= \ {del denota un sistema del entrenamiento de iteraciones de
¡y_i:
para las iteraciones positivas
para la negativa unas. --> Cada iteración el vector del peso es como sigue
Sin embargo, si el sistema del entrenamiento no es el linear separable, el algoritmo en línea antedicho no se garantiza para converger.
El -perceptron fomenta utilizó una capa del proceso previo de pesos al azar fijos, con las unidades de salida thresholded. Esto permitió al perceptrón clasificar patrones análogos, proyectándolos en un espacio binario . De hecho, para un espacio de la proyección de la dimensión suficientemente alta, los patrones pueden llegar a ser linear separables.
Como ejemplo, considerar el caso de tener que clasificar datos en dos clases. Aquí está un pequeño tal conjunto de datos, consistiendo en dos puntos que vienen a partir de dos distribuciones gausianas .
Un clasificador linear puede separar solamente cosas con un hiperplano, así que no es posible clasificar perfectamente todos los ejemplos. Por una parte, podemos proyectar los datos en una gran cantidad de dimensiones. En este caso una matriz al azar fue utilizada para proyectar los datos linear a un espacio dimensional 1000; entonces cada punto de referencias resultante fue transformado con la función hiperbólica de la tangente. Un clasificador linear puede entonces separar los datos, según las indicaciones de la tercera figura. No obstante los datos pueden sin embargo no ser totalmente separables en este espacio, en el cual el algoritmo del perceptrón no convergería. En el ejemplo demostrado, la pendiente más escarpada estocástica del gradiente fue utilizada para adaptar los parámetros.
Además, agregando capas no lineares entre la entrada y la salida, una puede separar todos los datos y de hecho, con bastantes datos del entrenamiento, modela cualquier función bien definida a la precisión arbitraria. Este modelo es una generalización conocida como perceptrón de múltiples capas .
Debe ser tenido presente, sin embargo, que el mejor clasificador no es necesario el que clasifica todos los datos del entrenamiento perfectamente. De hecho, si teníamos el constreñimiento anterior que los datos vienen de distribuciones gausianas de la equi-variante, la separación linear en el espacio de la entrada es óptima.
Otros algoritmos del entrenamiento para los clasificadores lineares son posibles: ver, e., la máquina del vector de la ayuda y la regresión logística .
Más recientemente, el interés en el algoritmo de aprendizaje del perceptrón ha aumentado otra vez después de que Freund y Schapire (1998) presentaran una formulación votada del algoritmo original (que logra el margen grande) y sugirieran que uno puede aplicar el truco del núcleo a él. El núcleo-perceptrón no sólo puede manejar datos nonlinearly separables pero puede también ir más allá de vectores y clasificar los casos que tienen una representación emparentada (e. árboles, gráficos o secuencias).
| Random links: | Statite | Meansville, Georgia | Bosque de Białowieża | Grupo de estudio de las matemáticas de la escuela | Monumento de la bandera nacional (la Argentina) |