¡

La traducción automática del, referida a veces por la TA de las siglas, es un subcampo de la lingu5ística computacional que investiga el uso que los programas informáticos al traducen el texto o el discurso de a partir de un de lenguaje natural a otro. En su nivel básico, la TA realiza la substitución simple de palabras en una de lenguaje natural para las palabras en otra. Usar técnicas de la recopilación, traducciones más complejas se pueden intentar, teniendo en cuenta una mejor dirección de diferencias en la tipología lingüística, el reconocimiento de la frase, y la traducción de los idiomas así como el aislamiento de anomalías.

El software actual de la traducción automática permite a menudo el arreglo para requisitos particulares por el &mdash de la profesión del dominio o (tal como informes de tiempo ); mejorando salida limitando el alcance de substituciones permisibles. Esta técnica es particularmente eficaz en los dominios donde se utiliza la lengua formal o formulista. Sigue entonces que la traducción automática del gobierno y de documentos jurídicos produce más fácilmente salida usable que la conversación o menos texto estandardizado.

La calidad mejorada de la salida se puede también alcanzar por la intervención humana: por ejemplo, algunos sistemas pueden traducir más exactamente si el usuario tiene inequívoco identificado que las palabras en el texto sean nombres. Con la ayuda de estas técnicas, la TA ha probado útil como herramienta para asistir a traductores humanos, y puede incluso producir en algunos casos la salida que puede ser " usado; como is". Sin embargo, los sistemas actuales no pueden producir la salida de la misma calidad que un traductor humano, particularmente donde el texto ser lengua ocasional traducida de las aplicaciones.

Introducción

El proceso de traducción se puede indicar como: que descifra el significado del texto original ; y
  • Codificación Re- este significado en la lengua objetivo .

    Detrás de este procedimiento aparentemente de simple miente una operación cognoscitiva complejo . Para descifrar el significado del texto original en su totalidad, el traductor debe interpretar y analizar todas las características del texto, de un proceso que requiera el conocimiento profundizado de la gramática, semántica, sintaxis, de los idiomas etc., de la lengua orígen, tan bien como la cultura de sus altavoces. El traductor necesita el mismo conocimiento profundizado re-codificar el significado en la lengua objetivo .

    En esto miente el desafío en la traducción automática: cómo programar una computadora que " understand" un texto como persona hace, y ése " create" un nuevo texto en la lengua objetivo que " sounds" como si haya sido escrito por una persona.

    Este problema se puede abordar de un número de maneras.

    Acercamientos

    La traducción automática puede utilizar un método basado en las reglas lingüísticas, así que significa que las palabras serán traducidas en un &mdash lingüístico de la manera; las palabras (oral de discurso) más convenientes de la lengua objetivo substituirán los que está en la lengua orígen.

    Se discute a menudo que el éxito de la traducción automática requiere el problema de comprensión de lenguaje natural ser solucionado primero.

    Generalmente, los métodos basados en las reglas analizan un texto, creando generalmente una representación intermediaria, simbólica, de la cual el texto en la lengua objetivo se genera. Según la naturaleza de la representación intermediaria, un acercamiento se describe como la traducción automática interlingual o traducción automática de transferencia . Estos métodos requieren los léxicos extensos con el morfológico, sintáctico, e información semántica, y los sistemas de reglas grandes.

    Dado bastantes datos, los programas de la traducción automática trabajan a menudo bien bastante para un nativo de una lengua para conseguir el significado aproximado de qué es escrita por el otro nativo. La dificultad está consiguiendo bastantes datos de la clase correcta para apoyar el método particular. Por ejemplo, la recopilación multilingüe grande de los datos necesarios para que los métodos estadísticos trabajen no es necesaria para los métodos gramática-basados. Pero por otra parte, los métodos de la gramática necesitan a lingüista experto diseñar cuidadosamente la gramática que utilizan.

    Para traducir entre las idiomas estrechamente vinculadas, una técnica designada Bajo-transfiere la traducción automática puede ser utilizada.

    Diccionario-basado

    considera también: el Diccionario-basó el

    la traducción automática

    La traducción automática puede utilizar un método basado en entradas del diccionario, así que significa que lo hacen las palabras serán traducidas como diccionario - palabra por palabra, generalmente sin mucha correlación de significar entre él.

    Estadístico

    considera también:

    estadístico de la traducción automática

    Intentos estadísticos de la traducción automática para generar traducciones usar los métodos estadísticos basados en recopilaciones de texto bilingüe, tales como la recopilación canadiense de Hansard, el expediente inglés-francés del parlamento canadiense y EUROPARL, el expediente del Parlamento Europeo . Donde están disponibles tales recopilaciones, los resultados impresionantes se pueden alcanzar traduciendo los textos de una clase similar, pero tales recopilaciones siguen siendo muy raras. El primer software estadístico de la traducción automática era el CANDIDE IBM . Google utilizó el SYSTRAN por varios años, pero ha cambiado a un método estadístico de la traducción en octubre de 2007. Recientemente, mejoraron sus capacidades de la traducción mediante la entrada aproximadamente 200 mil millones palabras de los materiales de Naciones Unidas para entrenar a su sistema. La exactitud de la traducción ha mejorado.

    Example-based

    considera también:

    Example-based de la traducción automática

    El acercamiento Example-based de la traducción automática (EBMT) es caracterizado a menudo por su uso de una recopilación bilingüe como su base de conocimiento principal, en run-time. Es esencialmente una traducción por la analogía y puede ser visto como puesta en práctica del acercamiento del razonamiento basado en la casuística del aprendizaje de máquina .

    Interlingual

    considera también:

    interlingual de la traducción automática

    La traducción automática interlingual es un caso de los acercamientos basados en las reglas de la traducción automática. En este acercamiento, la lengua orígen, es decir el texto que se traducirá, se transforma en un interlingual, es decir representación de source-/target-language-independent. La lengua objetivo entonces se genera fuera de la interlingua .

    Temas importantes

    Desambiguación

    considera también:

    la desambiguación del sentido de palabra

    Preocupaciones de la desambiguación del sentido de palabra que encuentran una traducción conveniente cuando una palabra puede tener más de uno el significar. El problema primero fue suscitado en los años 50 por la Barra-Hillel de Yehoshua. Él precisó eso sin un " encyclopedia" universal;, una máquina nunca podría distinguir entre los dos significados de una palabra. Hay hoy acercamientos numerosos diseñados para superar este problema. Pueden ser divididos aproximadamente en " shallow" acercamientos y " deep" acercamientos.

    Los acercamientos bajos no asumen ningún conocimiento del texto. Aplican simplemente métodos estadísticos a las palabras que rodean la palabra ambigua. Los acercamientos profundos presumen un conocimiento comprensivo de la palabra. Hasta ahora, los acercamientos bajos han sido más acertados.

    Entidades nombradas

    Relacionado con el nombró el reconocimiento de la entidad en la extracción de información .

    Historia

    considera también: Historia la traducción automática La historia de la traducción automática comienza en los años 50, después de la Segunda Guerra Mundial . El experimento (1954) de Georgetown implicó la traducción completamente automática sobre de sesenta oraciones rusas en el inglés. El experimento era un gran éxito y llevado en una era de financiación substancial para la investigación de la traducción automática. Los autores demandaron que en el plazo de tres a cinco años, la traducción automática sería un problema solucionado.

    El progreso verdadero era mucho más lento, sin embargo, y después del informe de ALPAC (1966), que encontró que la investigación diez-año-larga no había podido satisfacer expectativas, el financiamiento fue reducido grandemente. El comenzar a el final de los '80, como energía de cómputo aumentó y llegó a ser menos costoso, más interés fue demostrado en los modelos estadísticos para la traducción automática .

    Usos

    Ahora hay muchos programas para traducir de lenguaje natural, varios del software de ellos el en línea, tal como el sistema de SYSTRAN que acciona ambos Google traduce y Babelfish de s de AltaVista '. Aunque ningún sistema proporcione el santo grial de " translation" completamente automático de la máquina de la alta calidad; (FAHQMT), muchos sistemas producen salida razonable.

    A pesar de sus limitaciones inherentes, los programas de la TA se utilizan en todo el mundo. El usuario institucional más grande es probablemente la Comisión Europea, que emplea una versión alto-modificada para requisitos particulares del sistema de TA comercial de SYSTRAN para traducir automáticamente un de gran capacidad de los bosquejos preliminares del documento para el uso interno.

    Las traducciones globales, una empresa de traducción del en el los E., han estado desarrollando los diccionarios especializados para la traducción automática de las ofertas para las compañías de las telecomunicaciones . Debido a alto - la naturaleza técnica de estos documentos, que son a menudo muy grandes en volumen, calidad de la traducción automática mejora dramáticamente en proporción con la recopilación de texto que se importa en los diccionarios.

    Una empresa de traducción danesa, Lingtech A/S, ha estado traduciendo solicitudes de patente de inglés al danés desde 1993, usar un sistema basado en las reglas propietario de la traducción automática, PaTrans, trabajando junto con la herramienta traducción-memoria-basada comercial del CAT de Trados .

    El español Periódico de Catalunya diario se traduce español al catalán con un sistema de TA.

    El Toggletext utiliza un sistema de transferencia (conocido como Kataku) para traducir entre el inglés y el indonesio.

    El Google ha demandado que los resultados prometedores fueron obtenidos usar un motor estadístico propietario de la traducción automática. El motor estadístico de la traducción usado en las herramientas de lengua de Google para el inglés inglés y chino árabe del <-> del <-> tiene una cuenta total de 0.4281 sobre la cuenta de BLEU-4 de IBM del subcampeón de 0.3954 (verano 2006) en las pruebas conducidas por el instituto nacional para los estándares y la tecnología. El Uwe Muegge ha ejecutado un Web site de la versión parcial de programa que utiliza un de lenguaje controlado conjuntamente con la herramienta de Google para producir las traducciones automáticas completamente automáticas, de alta calidad de sus Web site ingleses, alemanes, y franceses.

    Con el foco reciente en terrorismo, las fuentes militares en los Estados Unidos han estado invirtiendo cantidades de dinero significativas en la ingeniería de lenguaje natural. En-Q-Teléfono (un fondo del del capital de riesgo, financiado en gran parte por la área de inteligencia de los E., para estimular nuevas tecnologías a través de empresarios del sector privado) sacó a colación a compañías como el tejedor de la lengua. La comunidad militar está actual interesada en la traducción y el proceso de idiomas como el árabe, el Pashto, y el Dari . La oficina de la tecnología de la tratamiento de la información en el DARPA recibe programas como las MAREAS y el traductor de Babylon. La fuerza aérea de los E. ha concedido un contrato $1 millones para desarrollar una tecnología de la traducción de lengua.

    Evaluación

    considera también: Evaluación la traducción automática Hay varios medios para evaluar el funcionamiento de los sistemas de la traducción automática. El viejo es el uso de jueces humanos de determinar la calidad de una traducción. Más recientes, los medios automatizados de la evaluación incluyen el BLEU, NIST y el METEORITO .

    Confiando exclusivamente en la traducción automática no hace caso que la comunicación en la lengua humana es el contexto - encajado, y que toma a ser humano para comprender adecuado el contexto del texto original. Incluso las traducciones puramente humano-generadas son error propenso. Por lo tanto, para asegurarse de que una traducción producida por máquina esté de calidad publicable y útil a un ser humano, debe ser repasado y ser corregido por un ser humano.

    Tiene, sin embargo, afirmado que que en ciertos usos, e. descripciones de producto escritas en un de lenguaje controlado, Diccionario-basó un el sistema de la traducción automática tiene, en un ambiente de producción, resultados perfectos producidos de la traducción que no requieren ninguna intervención humana.

    Ver también

    Inteligencia artificial
    Comparación de los usos de la traducción automática
    Lingu5ística computacional
    Traducción de ayuda de computadora
    de lenguaje natural controlado
    Historia de la traducción automática
    Tecnología de lengua humana
    Lista de laboratorios de investigación para la traducción automática
    Traducción
    Traductor universal
    Wiktionary: Traducciones
  • .

  • Zenithic
  • Averys Gore, Vermont
    Random links:Pionero 2 | Vilasrao Deshmukh | EnergyMech | James Gillespie | Diccionario del anagrama

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">