La codificación profética linear ( LPC ) del es una herramienta usada sobre todo en el tratamiento de señales audio y el proceso de discurso para representar el sobre espectral de una señal de Digitaces del discurso en forma comprimida, usar la información de un modelo profético linear . Es una de las técnicas más de gran alcance del análisis de discurso, y uno de los métodos más útiles para codificar discurso de la buena calidad a un índice binario bajo y proporciona estimaciones extremadamente exactas de los parámetros del discurso.

Descripción

considera también: modelo del Fuente-filtro la producción de discurso

El comienzo del LPC con la asunción que una señal de discurso es producida por un zumbador en el extremo de un tubo (sonidos expresados), con silbar agregado ocasional y hacer estallar suena (los sonidos explosivos Sibilants y ). Aunque al parecer sea crudo, este modelo sea realmente una aproximación cercana a la realidad de la producción de discurso. La glotis (el espacio entre las cuerdas vocales) produce el zumbido, que es caracterizado por su intensidad (intensidad) y la frecuencia (echada). La zona vocal (la garganta y la boca) forma el tubo, que es caracterizado por sus resonancias, que se llaman los armónicos . Los silbidos y los estallidos son generados por la acción de la lengüeta, de los labios y de la garganta durante sibilants y plosives.

El LPC analiza la señal de discurso estimando los armónicos, quitando sus efectos de la señal de discurso, y estimando la intensidad y la frecuencia del zumbido restante. El proceso de quitar los armónicos se llama filtración inversa, y la señal restante después de la substracción de la señal modelada filtrada se llama el residuo.

Los números que describen la intensidad y la frecuencia del zumbido, de los armónicos, y de la señal del residuo, se pueden almacenar o transmitir en alguna parte. El LPC sintetiza la señal de discurso invirtiendo el proceso: utilizar los parámetros del zumbido y el residuo para crear una señal de la fuente, utilizar los armónicos para crear un filtro (que represente el tubo), y funcionar con la fuente a través del filtro, dando por resultado discurso.

Porque las señales de discurso varían con tiempo, este proceso se hace en los pedazos cortos de la señal de discurso, que se llaman los marcos; generalmente 30 a 50 secuencias por segundo pronunciar discurso inteligible con la buena compresión.

Historia temprana del LPC

Según el Roberto M. gris de la Universidad de Stanford, las primeras ideas que llevan al LPC comenzado en 1966 en que el S. Itakura de NTT describieron un acercamiento a la discriminación automática del fonema que implicó el primer acercamiento de la toda probabilidad a la codificación de discurso. En 1967, el Burg de Juan contorneó el acercamiento máximo de la entropía . En 1969 Itakura y Saito introdujeron la correlación parcial, la cañada Culler de mayo propuso la codificación en tiempo real del discurso, y el B. Atal presentó a codificador del discurso del LPC en la reunión anual de la sociedad acústica de América . En el tiempo real 1971 el LPC usar el hardware de 16 bits del LPC fue demostrado por el Philco-Ford ; cuatro unidades fueron vendidas.

En el 1972 Bob Kahn ARPA, con Jim Forgie (laboratorio, LL de Lincoln) y Dave Walden (tecnologías del BBN), comenzó los primeros progresos en el discurso packetized, que llevaría eventual a la voz sobre tecnología del IP . En 1973, según historia informal del laboratorio de Lincoln, el primer tiempo real 2400 bit/s LPC fueron ejecutados por Ed Hofstetter. En 1974 la primera comunicación de discurso de dos vías en tiempo real del paquete del LPC era realizada sobre el ARPANET en 3500 bit/s entre Culler-Harrison y los laboratorios de Lincoln. En 1976 la primera conferencia del LPC ocurrió sobre el ARPANET usar el protocolo de la voz de la red, entre Culler-Harrison, ISI, SRI, y LL en 3500 bit/s. Y finalmente en 1978, el y otros de Vishwanath del BBN desarrolló el algoritmo de tipo variable del primer LPC.

Representaciones del coeficiente del LPC

El LPC se utiliza con frecuencia para transmitir la información espectral del sobre, y mientras que tal él tiene que ser tolerante para los errores de la transmisión. La transmisión de los coeficientes del filtro (véase la predicción linear para la definición de coeficientes) es directo indeseable, puesto que son muy sensibles a los errores. Es decir un error muy pequeño puede torcer el espectro entero, o peor, un pequeño error pudo hacer el filtro de la predicción inestable.

Hay más representaciones avanzadas tales como cocientes (LAR) del área del registro, línea los coeficientes de reflexión espectrales de la descomposición y de los pares (LSP) . De éstos, especialmente la descomposición de LSP ha ganado renombre, puesto que asegura la estabilidad del calculador, y los errores espectrales son locales para las pequeñas desviaciones del coeficiente.

Usos

El LPC se utiliza generalmente para el análisis de discurso y el resynthesis. Es utilizado como forma de compresión de la voz por las compañías telefónicas, por ejemplo en el estándar del G/M . También se utiliza para la radio segura, donde la voz debe ser convertido a digital cifrado y enviado sobre un canal estrecho de la voz, un ejemplo temprano de esto es Navajo del gobierno de los E.

La síntesis del LPC se puede utilizar para construir los codificadores vocales donde los instrumentos musicales se utilizan como señal de la excitación al filtro de tiempo variable estimado del discurso de un cantante. Esto es algo popular en la música electrónica . El Paul Lansky hizo el bien conocido Notjustmoreidlechatter del pedazo de la música de computadora usar la codificación profética linear. Un 10th-order LPC fue utilizado en los años 80 populares que el habla y que deletrea el juguete educativo de .

La ROM de la forma de onda en digital muestra-basó los sintetizadores de la música del que hecho por el Yamaha Corporation es comprimido usar algoritmo del LPC.

utilizan a los calculadores de 0 de to-32nd LPC de la orden en codificador-decodificador del audio FLAC .

  • Zenithic
  • J. L. Tarr
    Random links:Airavata | El municipio de Leidy, Pennsylvania | Cuarteto No. 1 (Bartók) de la secuencia | Ferrocarril de Glenroy, Melbourne | Lo más favorablemente posible de la feria

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">