El tejedor de la lengua del es un Los Ángeles, California - la compañía basada que fue fundada en 2002 por caballero y Daniel Marcu de s Kevin de la Universidad de California del Sur el ', para comercializar un acercamiento estadístico al automático |traducción de lengua y proceso de lenguaje natural - ahora conocidos global como software estadístico de la traducción automática (SMTS).

El software basado en las estadísticas de la traducción del tejedor de la lengua es un caso de un avance reciente en la traducción automatizada. Mientras que la tecnología anterior de la traducción automática confió en las colecciones de reglas lingüísticas para analizar la oración de la fuente, y después traza la estructura sintáctica y semántica en la lengua objetivo, el tejedor de la lengua utiliza técnicas estadísticas de la criptografía, aplicando los algoritmos del aprendizaje de máquina que adquieren automáticamente los modelos estadísticos de las colecciones existentes del paralelo de traducciones humanas. Estos modelos son más probables ser hasta la fecha, apropiados e idiomáticos, porque se aprenden directo de traducciones verdaderas. El software puede también ser modificado para requisitos particulares rápidamente a cualquier tema o labrar y hacer una traducción completa de texto previamente no visto.

La TA estadística era una vez apropiada pensado solamente para las idiomas con mismo granes cantidades de datos preidos-traduc. Sin embargo, con nuevos avances en SMT, el tejedor de la lengua ha podido también crear los sistemas de la traducción para las idiomas cantidades más pequeñas de datos paralelos. Además, con el arreglo para requisitos particulares, SMT puede también " learn" para traducir exactamente alto - el material técnico.

El producto primario del tejedor de la lengua es su software de la traducción. Ofrecen actual 24 idiomas bidireccionales par-estas incluyen inglés a y desde chino francés, italiano, danés, griego, español, alemán, holandés, portugués, sueco, ruso, checo, rumano, polaco, árabe, persa, simplificado y tradicional, coreano, e Hindi. Varias parejas de lenguas no-Inglesas están también disponibles, por ejemplo Árabe-Español, Árabe-Francés, Español-Francés y franc3es-alem3an.

Las parejas de lenguas actuales todas utilizan la TA estadística frase-basada. Sin embargo, la compañía también está trabajando en el sintaxis - TA estadística basada para que ciertas parejas de lenguas mejoren la calidad total de la traducción.

El tejedor de la lengua puede también crear (las parejas de lenguas modificadas para requisitos particulares del específico del dominio) para las compañías particulares. Utilizan a cliente que existe, datos preidos-traduc al " train" un nuevo sistema de la traducción que entiende estadístico cómo traducir que datos de la información de clientes tan los nuevos se pueden traslated en una cantidad de tiempo más corta y corregir según lo necesitado antes de la publicación.

Así como su software primario de la traducción, el tejedor de la lengua tiene varios otros productos disponibles. Su herramienta de alineación es un generador de la memoria de traducción . Esto permite que los usuarios incorporen documentos previamente traducidos, y los alinea en el nivel de segmento, produciendo un archivo de la memoria de traducción. La compañía también tiene Customizer, una herramienta del arreglo para requisitos particulares. Este producto permite que los usuarios fine-tune el sistema de la traducción usar las pequeñas cantidades (hasta 2 millones de palabras) de datos preidos-traduc en un tema del específico. Esta herramienta permite mejoras incrementales en un cierto plazo y da a usuarios más control del proceso.

Ver también

El Google traduce

.

  • Zenithic
  • Mengen, Germany
    Random links:Universidad real de médicos | Proyecto de la presa de Narmada | Mentos | Efecto de ondulación | Atlixco, Puebla

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">