La visión de computadora del es la ciencia y la tecnología de las máquinas que ven. Como disciplina científica, la visión de computadora se refiere a la teoría para los sistemas artificiales del edificio que obtienen la información de imágenes. Los datos de imagen pueden tomar muchas formas, tales como una secuencia video, visiónes desde cámaras múltiples, o datos multidimensionales de un explorador médico.
Como disciplina tecnológica, la visión de computadora intenta aplicar las teorías y los modelos de la visión de computadora a la construcción de los sistemas de visión de computadora . Los ejemplos de usos de los sistemas de visión de computadora incluyen los sistemas para:
Procesos que controlan (e. una robusteza industrial o un vehículo autónomo ).
Detección de acontecimientos (e. para la vigilancia visual o la gente que cuenta ).
Información de organización (e. para las bases de datos de indexación de direcciones de imágenes y de secuencias de la imagen).
Modelado de los objetos o de los ambientes (e. inspección industrial, análisis de imagen médico o modelado topográfico).
Interacción (e. como la entrada a un dispositivo para la interacción ordenadora-persona ).
La visión de computadora se puede también describir como un complemento (pero no no necesario el contrario) de la visión biológica. En la visión biológica, la opinión visual de seres humanos y los varios animales se estudian, dando por resultado modelos de cómo estos sistemas funcionan en términos de procesos fisiológicos. La visión de computadora, por una parte, estudia y describe el sistema artificial de la visión que se ejecuta en software y/o soporte físico. El intercambio interdisciplinario entre la visión biológica y de computadora ha probado cada vez más fructuoso para ambos campos.
los Secundario-dominios de la visión de computadora incluyen la reconstrucción de la escena, la detección del acontecimiento, el seguimiento, el reconocimiento de objeto, aprendiendo, el restauración el poner en un índice, del ego-movimiento y de imagen.
La física es otro campo que se relaciona fuerte con la visión de computadora. Las partes significativas de visión de computadora se ocupan de los métodos que requieren una comprensión cuidadosa del proceso en el cual la radiación electromágnetica, típicamente en la gama visible o infrarroja, es reflejada por las superficies de objetos y finalmente medida por el sensor de la imagen para presentar los datos de imagen. Este proceso se basa en la óptica y la física de estado sólido . Sensores más sofisticados de la imagen incluso requieren a mecánicos de quántum proporcionar una comprensión completa del proceso de la formación de la imagen. También, los varios problemas de la medida en la física se pueden abordar usar la visión de computadora, por ejemplo movimiento en líquidos. Por lo tanto, la visión de computadora se puede también considerar como extensión de la física.
Un tercer campo que desempeña un papel importante es la neurobiología, específicamente el estudio del sistema biológico de la visión. Durante el siglo pasado, ha habido un estudio extenso de ojos, de neuronas, y de las estructuras del cerebro dedicadas al proceso de estímulos visuales en seres humanos y varios animales. Esto ha llevado a un grueso, con todo complicado, descripción de cómo " real" los sistemas de la visión funcionan para solucionar tareas relacionadas cierta visión. Estos resultados han llevado a un subcampo dentro de la visión de computadora donde los sistemas artificiales se diseñan para mímico el proceso y el comportamiento de sistemas biológicos, en diversos niveles de complejidad. También, algunos de los métodos aprender-basados desarrollados dentro de la visión de computadora tienen su fondo en biología.
Otro más campo relacionado con la visión de computadora es el tratamiento de señales . Muchos métodos para procesar de las señales uno-variables, señales típicamente temporales, se pueden ampliar de una manera natural al proceso de señales dos-variables o de señales multivariables en la visión de computadora. Sin embargo, debido a la naturaleza específica de imágenes hay muchos métodos desarrollados dentro de la visión de computadora que no tienen ninguna contraparte en el proceso de señales uno-variables. Un carácter distinto de estos métodos es el hecho de que son no lineares que, junto con la multi-dimensionalidad de la señal, define un subcampo en el tratamiento de señales como parte de visión de computadora.
Al lado de las opiniónes antedichas sobre la visión de computadora, muchos de los asuntos de investigación relacionados se pueden también estudiar desde un punto de vista puramente matemático. Por ejemplo, muchos métodos en la visión de computadora se basan en las estadísticas, la optimización o la geometría . Finalmente, dedican a las partes significativas del campo al aspecto de la puesta en práctica de la visión de computadora; cómo los métodos existentes se pueden observar en varias combinaciones de software y de soporte físico, o cómo estos métodos se pueden modificar para ganar velocidad de proceso sin perder demasiado funcionamiento.
Los campos, más estrechamente vinculados a la visión de computadora, son el tratamiento de la imagen, el análisis de imagen, la visión de la robusteza y la visión por ordenador . Hay un traslapo significativo en términos de qué técnicas y usos cubren. Esto implica que las técnicas básicas que se utilizan y se desarrollan en estos campos son más o menos idénticas, algo que se puede interpretar como allí es solamente un campo con diversos nombres. Por una parte, aparece ser necesario para que los grupos de investigación, los diarios científicos, las conferencias y las compañías presenten o se pongan como perteneciendo específicamente a una de estos campos y, por lo tanto, varias caracterizaciones que distinguen cada uno de los campos de las otras se han presentado.
Las caracterizaciones siguientes aparecen relevantes pero no se deben tomar según lo aceptado universal. El tratamiento de la imagen y el análisis de imagen tienden a centrarse en las 2.as imágenes, cómo transformar una imagen a otra, e., por operaciones pixel-sabias tales como realce del contraste, operaciones locales tales como extracción del borde o retiro del ruido, o transformaciones geométricas tales como rotación de la imagen. Esta caracterización implica que el tratamiento de la imagen/análisis ni requiere asunciones ni produce interpretaciones sobre el contenido de la imagen. La visión de computadora tiende a centrarse en la escena 3D proyectada sobre una o varia imágenes, e., cómo reconstruir la estructura o la otra información sobre la escena 3D a partir de una o varia imágenes. La visión de computadora confía a menudo en más o asunciones menos complejas sobre la escena representada en una imagen. La visión por ordenador tiende a centrarse en usos, principalmente en la industria, e., las robustezas autónomas y los sistemas basados visión para la inspección o la medida basada visión. Esto implica que las tecnologías de los sensores de la imagen y la teoría de control están integradas a menudo con el proceso de los datos de imagen para controlar una robusteza y que el proceso en tiempo real está acentuado por medio de puestas en práctica eficientes en soporte físico y software.
Hay también un campo llamado la proyección de imagen que se centran sobre todo en el proceso de producir imágenes, pero a veces también se ocupa del proceso y del análisis de imágenes. Por ejemplo, la proyección de imagen médica contiene porciones de trabajo sobre el análisis de los datos de imagen en usos médicos. Finalmente, el reconocimiento de patrón es un campo que utiliza varios métodos para extraer la información de las señales basadas generalmente principalmente en acercamientos estadísticos. Dedican a las partes significativas de este campo a aplicar estos métodos a los datos de imagen. ¡Una consecuencia de esta situación es que usted puede trabajar en un laboratorio relacionado con uno de estos campos, aplicar métodos de un segundo campo para solucionar un problema en un tercer campo y presentar el resultado en una conferencia relacionada con un cuarto campo!
Uno de los campos más prominentes del uso es visión de computadora médica o tratamiento de la imagen médico. Esta área es caracterizada por la extracción de la información de datos de imagen con el fin de hacer una diagnosis médica de un paciente. Generalmente, los datos de imagen están bajo la forma de imágenes de la microscopia, imágenes de la radiografía, imágenes de la angiografía, imágenes ultrasónicas, e imágenes de la tomografía. Un ejemplo de la información que se puede extraer de tales datos de imagen es detección de la arteriosclerasis de los tumores o de otros cambios malignos. Puede también ser medidas de las dimensiones del órgano, del flujo de sangre, del etc. Esta área de aplicación también apoya la investigación médica proporcionando la nueva información, e., sobre la estructura del cerebro, o sobre la calidad de tratamientos médicos.
Una segunda área de aplicación en la visión de computadora está en industria. Aquí, la información se extrae con el fin de apoyar un proceso de fabricación. Un ejemplo es el control de calidad donde los detalles o los productos finales se están examinando automáticamente para encontrar defectos. Otro ejemplo es medida de la posición y de la orientación de los detalles que se cogerán por un brazo de la robusteza.
Los usos militares son probablemente una de las áreas más grandes para la visión de computadora. Los ejemplos obvios son detección de soldados enemigos o vehículos y la dirección del misil. Sistemas más avanzados para la dirección del misil envían el misil a un área algo que una blanco específica, y se hace la selección de la blanco cuando el misil alcanza el área basada en datos de imagen localmente adquiridos. Conceptos militares modernos, tales como " awareness" del campo de batalla;, implicar que los varios sensores, incluyendo los sensores de la imagen, proporcionan un sistema rico de información sobre una escena del combate que se pueda utilizar para apoyar decisiones estratégicas. En este caso, el proceso automático de los datos se utiliza para reducir complejidad y para fundir la información de los sensores múltiples para aumentar confiabilidad.
Una de las áreas de una más nueva aplicación es los vehículos autónomos, que incluyen los vehículos cones base en tierra de los sumergibles (pequeñas robustezas con las ruedas, los coches o los carros), los vehículos aéreos, y los vehículos aéreos acobardados (UAV ). El nivel de autonomía se extiende de los vehículos (sin tripulación) completamente autónomos a los vehículos donde los sistemas basados de la visión de computadora apoyan a un conductor o a piloto en varias situaciones. Los vehículos completamente autónomos utilizan típicamente la visión de computadora para la navegación, es decir para saber donde está, o para producir un mapa de su ambiente (GOLPE ) y para detectar obstáculos. Puede también ser utilizado para detectar los acontecimientos específicos de cierta tarea, E., un UAV que busca los incendios forestales. Los ejemplos de los sistemas de apoyo son sistemas de alarma del obstáculo en coches, y sistemas para el aterrizaje autónomo de aviones. Varios fabricantes de coche han demostrado los sistemas para la conducción autónoma de los coches, pero esta tecnología todavía no ha alcanzado un nivel donde puede ser puesta en el mercado. Hay ejemplos amplios de los vehículos autónomos militares que se extienden de los misiles avanzados, a los UAVs para las misiones o la dirección renovadas del misil. La exploración de espacio se está haciendo ya con los vehículos autónomos usar la visión de computadora, E., exploración Rover de Marte de la NASA.
Otras áreas de aplicación incluyen:
Ayuda de la creación de los efectos visuales para el cine y la difusión, e., cámara de seguimiento (el matchmoving).
Cada uno de las áreas de aplicación descritas arriba emplea una gama de tareas de la visión de computadora; problemas más o menos bien definidos de la medida o problemas del proceso, que se pueden solucionar usar una variedad de métodos. Algunos ejemplos de las tareas típicas de la visión de computadora se presentan abajo.
El problema clásico en la visión de computadora, el tratamiento de la imagen y la visión por ordenador es el de determinar independientemente de si los datos de imagen contienen cierto objeto, característica, o actividad específica. Esta tarea se puede solucionar normalmente robusto y sin esfuerzo de un ser humano, pero todavía no se soluciona satisfactoriamente en la visión de computadora para el caso general: objetos arbitrarios en situaciones arbitrarias. Los métodos existentes para ocuparse de este problema pueden en el mejor de los casos solucionarlo solamente para los objetos específicos, tales como los carácteres impresos o manuscritos geométricos simples de objetos (e., poliedros), de los rostros humanos, o los vehículos, y en las situaciones específicas, descritas típicamente en términos de iluminación, fondo, y actitud bien definidos del objeto concerniente a la cámara.
Diversas variedades del problema del reconocimiento se describen en la literatura:
reconocimiento del del
: uno o varios especificados primero u objetos o clases de objeto aprendidos se puede reconocer, generalmente junto con sus 2.as posiciones en la imagen o las actitudes 3D en la escena.
Identificación del : Se reconoce un caso individual de un objeto. Ejemplos: identificación de la cara o de la huella digital de una persona específica, o identificación de un vehículo específico.
Detección del : los datos de imagen se explora para una condición específica. Ejemplos: detección de células o de tejidos anormales posibles en imágenes médicas o detección de un vehículo en un sistema automático del peaje de camino. La detección basada en cómputos relativamente simples y rápidos se utiliza a veces para encontrar regiones más pequeñas de datos de imagen interesantes que puedan ser analizados más a fondo más de cómputo exigiendo técnicas para producir una interpretación correcta.
Varias tareas especializadas basadas en el reconocimiento existen, por ejemplo:
el del del
Contenido-basó la recuperación de la imagen: que encuentra todas las imágenes en un sistema más grande de las imágenes que tienen un contenido específico. El contenido se puede especificar en maneras diferentes, por ejemplo en términos de pariente de la semejanza una imagen de la blanco (darme todas las imágenes similares a la imagen X), o en términos de criterios de búsqueda de alto nivel dados como entrada de texto (darme que todas las imágenes que contenga muchas casas, se tomen durante invierno, y no tener ninguÌn coche en ellas).
valoración de la actitud del : que estima la posición o la orientación de un objeto específico concerniente a la cámara. Un uso del ejemplo para esta técnica estaría asistiendo a un brazo de la robusteza en el recuperación de objetos de una banda transportadora en una planta de fabricación situación de .
reconocimiento de caracteres ópticos (u OCR) del : que identifica los carácteres en imágenes del texto impreso o manuscrito, generalmente con objeto de codificar el texto en un formato más favorable a corregir o a la indexación de direcciones (e.
Varias tareas se relacionan con la valoración del movimiento, en la cual una secuencia de la imagen se procesa para producir una estimación de la velocidad en cada puntos en la imagen o en la escena 3D. Los ejemplos de tales tareas son:
Egomotion del
: que determina el movimiento rígido 3D de la cámara.
de seguimiento del : que sigue los movimientos de objetos (e. vehículos o seres humanos).
Las una o (típicamente) más imágenes dadas de una escena, o un vídeo, reconstrucción de la escena tienen como objetivo el computar de un 3D modelo de la escena. En el caso más simple el modelo puede ser un sistema de los puntos 3D. Métodos más sofisticados producen un modelo superficial completo 3D.
La puntería de la restauración de imagen es el retiro del ruido (ruido del sensor, falta de definición de movimiento, etc. El acercamiento posible más simple para el retiro del ruido es varios tipos de filtros tales como filtros de paso bajo o filtros medianos. Métodos más sofisticados asumen un modelo de cómo las estructuras locales de la imagen parecen, un modelo que los distinga del ruido. Primero analizando los datos de imagen en términos de estructuras de la imagen del local, tales como líneas o bordes, y después controlar la filtración basó en la información local del paso del análisis, un mejor nivel de retiro del ruido generalmente se obtiene comparado a los acercamientos más simples.
La organización de un sistema de visión de computadora es alto dependiente de la aplicación. Algunos sistemas son los usos independientes que solucionan un problema específico de la medida o de la detección, mientras que otro constituye un subsistema de un diseño más grande que, por ejemplo, también contenga los subsistemas para el control de actuadores mecánicos, del planeamiento, de las bases de datos de la información, de los interfaces antropomecánicos, del etc. La puesta en práctica específica de un sistema de visión de computadora también depende encendido si su funcionalidad está especificada primero o si una cierta parte de ella puede ser docta o modificada durante la operación. Hay, sin embargo, las funciones típicas que se encuentran en muchos sistemas de visión de computadora.
adquisición de la imagen del del
: A que la imagen digital es producida por uno o vario el sensor que, además de los varios tipos de cámaras sensibles a la luz, incluye los sensores de la gama, los dispositivos de la tomografía, el radar, cámaras ultrasónicas, el etc. dependiendo del tipo de sensor, los datos de la imagen de imagen resultantes es una 2.a imagen ordinaria, un volumen 3D, o una secuencia de la imagen. Los valores del pixel corresponden típicamente a la intensidad de luz en una o varia vendas espectrales (las imágenes grises o las imágenes del color), pero se pueden también relacionar con las varias medidas físicas, tales como profundidad, absorción o reflexión de ondas acústicas o electromagnéticas, o el de resonancia magnética nuclear.
Proceso previo del : antes de que un método de la visión de computadora se pueda aplicar a los datos de imagen para extraer un cierto fragmento de información específico, es generalmente necesario procesar los datos para asegurar que satisface ciertas asunciones implicadas por el método. Los ejemplos son El volver a muestrear para asegurar que el sistema coordinado de la imagen está correcto.
Reducción del nivel de ruidos para asegurar que el ruido del sensor no introduce la información falsa.
Poner en contraste el realce para asegurar que la información relevante puede ser detectada.
representación del Escalar-espacio para realzar las estructuras de la imagen en las escalas localmente apropiadas.
Extracción de característica del : Las características de la imagen de en los varios niveles de complejidad se extraen de los datos de imagen. Los ejemplos típicos de tales características son Las líneas, afilan y los cantos .
El interés localizado señala tal como esquinas, gotas o puntos. características más complejas de se pueden relacionar con la textura, la forma o el movimiento. Detección del /segmentación : En un cierto punto en el proceso se toma una decisión sobre la cual los puntos de imagen o las regiones de la imagen son relevantes para la transformación posterior. Los ejemplos son La selección de un sistema específico de interés señala
Segmentación de una o regiones de la imagen múltiple que contienen un objeto específico del interés.
Proceso de alto nivel del : en este paso la entrada es típicamente un pequeño sistema de datos, por ejemplo un sistema de puntos o de una región de la imagen que se asuma para contener un objeto específico. El proceso restante trata de, por ejemplo: Verificación que los datos satisfacen asunciones modelo-basadas y específicas a la aplicación.
Valoración de parámetros específicos a la aplicación, tales como actitud del objeto o tamaño de objeto.
Clasificar un objeto detectado en diversas categorías.
clasificado alfabéticamente con respecto al apellido del primer autor
.
| Random links: | Gruney | Número ultrarreal | Venera 2 | David Hinchliffe (político australiano) | Arco de Oxford-Cambridge |