La opinión de discurso del refiere a los procesos por los cuales los seres humanos pueden interpretar y entender los sonidos usados en lengua. El estudio de la opinión de discurso se liga de cerca a los campos de la fonética y de la fonología en la lingüística y la psicología cognoscitiva y la opinión en psicología . La investigación en la opinión de discurso intenta entender cómo los oyentes humanos reconocen sonidos de discurso y utilizan esta información para entender lengua hablada. La investigación del discurso tiene usos en los sistemas informáticos del edificio que pueden reconocer discurso, así como la mejora del reconocimiento de discurso para los oyentes de la audiencia y lengua-deteriorado.

Fundamentos de la opinión de discurso

El proceso de percibir discurso comienza en el nivel de la señal de sonido y del proceso de la audición. (Para una descripción completa del proceso de la audición ver la audiencia .) Después de procesar la señal auditiva inicial, los sonidos de discurso se procesan más a fondo para extraer señales acústicas y la información fonética. Esta información del discurso se puede entonces utilizar para los procesos de la lengua de alto nivel, tales como reconocimiento de palabra.

Señales acústicas

La señal de sonido de discurso contiene un número de señales acústicas que se utilicen en la opinión de discurso. Las señales distinguen los sonidos de discurso que pertenecen a las categorías fonéticas de diverso . Por ejemplo, una de las señales estudiadas del discurso es el tiempo de inicio de la voz o VOT. VOT es una señal primaria que señala la diferencia entre las consonantes de parada expresadas y sordas, tales como " b" y " p". Otras señales distinguen los sonidos que se producen en diversos lugares de la articulación o las maneras de la articulación . El sistema del discurso debe también combinar estas señales para determinar la categoría de un sonido de discurso específico. Esto se piensa a menudo en en términos de representaciones abstractas de los fonemas . Estas representaciones se pueden entonces combinar para el uso en el reconocimiento de palabra y otros procesos de la lengua.

No es fácil identificar qué oyentes acústicos de las señales ser sensible al percibir un sonido de discurso particular: el

l en el primer vistazo, la solución al problema de cómo percibimos discurso parece engañoso simple. Si uno podría identificar los estiramientos de la forma de onda acústica que corresponden a las unidades de opinión, después la trayectoria del sonido al significado estaría clara. Sin embargo, esta correspondencia o el trazado ha probado extremadamente difícil encontrar, incluso después unos cuarenta y cinco años de investigación sobre el problema.

Si un aspecto específico de la forma de onda acústica indicara una unidad lingüística, una serie de pruebas usar los sintetizadores de discurso sería suficiente determinar tal señal o señales. Sin embargo, hay dos obstáculos significativos: El aspecto acústico del

uno de la señal de discurso puede contar diversas dimensiones lingüístico relevantes. Por ejemplo, la duración de una vocal en inglés puede indicar independientemente de si la vocal está tensionada, o si está en una sílaba cerrada por haber expresado o una consonante sorda, y en algunos casos (como inglés americano /ɛ/ y /æ/ ) puede distinguir la identidad de vocales. Algunos expertos incluso sostienen que la duración puede ayudar en la distinción de qué se llama tradicionalmente brevemente y las vocales largas en inglés.

  • Una unidad lingüística se puede contar por varias características acústicas. Por ejemplo en un experimento clásico, el Alvin Liberman (1957) demostró a eso las transiciones del armónico del inicio de /d/ diferenciar dependiendo de la vocal siguiente (véase el cuadro 1) pero todas se interpretan como el fonema /d/ por los oyentes.

    Linearidades y el problema de la segmentación

    Aunque los oyentes perciban discurso como corriente de unidades discretas (los fonemas, silabean, y las palabras ), esta linearidad es difícil ser considerado en la señal de discurso física (véase el cuadro 2 para un ejemplo). Los sonidos de discurso no siguen terminantemente uno otro, algo, ellos se traslapan. Un sonido de discurso es influenciado por los que preceden y los que siguen. Esta influencia se puede incluso ejercer en una distancia de dos o más segmentos (y a través de sílaba y los palabra-límites) o, los valores de VOT que marcan el límite entre las paradas expresadas y sordas son diferentes para labial, las paradas y ellos alveolares y velares cambiar de puesto bajo tensión o dependiendo de la posición dentro de una sílaba.
    la variación del

    bido al discurso de diferenciación condiciona. El factor importante de uno que causa la variación es tarifa de diferenciación del discurso. Muchos contrastes del fonema son constituidos por las características temporales (cortas contra vocales largas o las consonantes, los affricates contra fricativas, las paradas contra los deslizamientos, expresados contra paradas sordas, el etc.) y son afectados ciertamente por los cambios en tempo de discurso. (véase el cuadro 3 para una ilustración de esto). El dialecto y el acento extranjero causan la variación también.

  • Constancia y normalización perceptivas

    Dado la carencia de la invariación, es notable que los oyentes perciben las vocales y las consonantes producidas bajo diversas condiciones y por diversos altavoces como categorías constantes. Se ha propuesto que esto está alcanzada por medio del proceso perceptivo de la normalización en el cual los oyentes filtran hacia fuera el ruido (es decir variación) para llegar la categoría subyacente. las diferencias del Vocal-zona-tamaño dan lugar a la variación de la armónico-frecuencia a través de altavoces; por lo tanto un oyente tiene que ajustar su sistema perceptivo a las características acústicas de un altavoz particular. Esto puede ser lograda considerando los cocientes de armónicos algo que sus valores absolutos. Este proceso se ha llamado normalización de la zona vocal (véase el cuadro 3 para un ejemplo). Semejantemente, creen a los oyentes ajustar la opinión de la duración al tempo actual del discurso que están escuchando - esto se ha referido como normalización de la tarifa del discurso.

    Independientemente de si ocurre la normalización realmente y cuál es su naturaleza exacta es una cuestión de controversia teórica (véase las teorías abajo). La constancia perceptiva es un específico del fenómeno no a la opinión de discurso solamente; existe en otros tipos de opinión también.

    Opinión categórica

    considera también:

    categórico de la opinión

    La opinión categórica está implicada en procesos de la diferenciación perceptiva. Percibimos sonidos de discurso categórico, es decir, somos más probables notar el de las diferencias entre las categorías de (fonemas) que dentro de categorías de . El espacio perceptivo entre las categorías por lo tanto se comba, los centros de las categorías (o los “prototipos ") que trabajan como un tamiz o como los imanes para los sonidos de discurso entrantes.

    Consideremos una serie continua artificial entre una parada bilabial sorda y expresada donde cada nuevo paso diferencia el preceder en la cantidad VOT . El primer sonido es un pre-expresado , es decir tiene un VOT negativo. Entonces, aumentando el VOT, conseguimos a un punto donde está cero, es decir la parada es un unaspirated llano sordo . Gradualmente, agregando la misma cantidad de VOT a la vez, alcanzamos el punto donde está un bilabial la parada sordo fuerte aspirado . (Tal serie continua fue utilizada en un experimento por el Lisker y el Abramson en 1970. Una prueba de la identificación de la dos-alternativa (o clasificación) rendirá una función discontinua de la clasificación (véase la curva roja en el cuadro 4).

    Si probamos la capacidad de discriminar entre dos sonidos con la variación de VOT valoramos pero tener una distancia constante de VOT de uno a (el ms 20 por ejemplo), oyentes es probable realizarse en el nivel de la ocasión si ambos sonidos caen dentro de la misma categoría y en el nivel del nearly-100% si cada sonido cae en una diversa categoría (véase la curva azul de la discriminación en el cuadro 4).

    La conclusión a hacer de la identificación y de la prueba de la discriminación es que los oyentes tendrán diversa sensibilidad al mismo aumento relativo en VOT dependiendo de independientemente de si el límite entre las categorías fue cruzado. El ajuste perceptivo similar se atestigua para otras señales acústicas también.

    Influencias de arriba hacia abajo en la opinión de discurso

    El proceso de la opinión de discurso no es necesario unidireccional. Es decir, los procesos de la lengua de alto nivel conectaron con la morfología, sintaxis, o la semántica puede obrar recíprocamente con procesos básicos de la opinión de discurso para ayudar en el reconocimiento de los sonidos de discurso. Puede ser el caso que no es necesario y quizá incluso no posible que el oyente reconozca fonemas antes de reconocer unidades más altas, como palabras por ejemplo. Después de obtener por lo menos un fragmento de información fundamental sobre la estructura del fonema de la entidad percibida de la señal acústica, los oyentes pueden compensar desaparecidos o fonemas ruido-enmascarados usar su conocimiento de la lengua hablada.

    En un experimento clásico, Richard M. Warren (1970) substituyó un fonema de una palabra por a toser-como sonido. Sus temas restauraron el sonido de discurso que falta perceptivamente sin ninguna dificultad y por otra parte, no podían identificar exactamente que el fonema había sido disturbado. Otro experimento básico compara el reconocimiento de las palabras naturalmente habladas presentadas en una oración (o por lo menos una frase) y de las mismas palabras presentadas en el aislamiento. La exactitud de la opinión cae generalmente en las 3ultimas condiciones. Garnes y el enlace (1976) también utilizaron oraciones del portador al investigar la influencia del conocimiento semántico en la opinión. Crearon series de palabras que diferenciaban en un fonema (bahía/día/gay, por ejemplo). La calidad del primer fonema cambió a lo largo de una serie continua. Todos estos estímulos fueron puestos en diversas oraciones que tuvieron sentido con una de las palabras solamente. Los oyentes tenían una tendencia a juzgar las palabras ambiguas (cuando el primer segmento estaba en el límite entre las categorías) según el significado de la oración entera.

    Asuntos de investigación

    Opinión de discurso infantil

    Los niños comienzan el proceso de la adquisición de lengua pudiendo detectar diferencias muy pequeñas entre los sonidos de discurso. Pueden discriminar todos los contrastes posibles del discurso (fonemas). Gradualmente, como los exponen a su lengua materna, su opinión llega a ser específica a una lengua, es decir aprenden cómo no hacer caso de las diferencias dentro de las categorías del fonema de la lengua (las diferencias que bien pueden ser contrastivas en otras idiomas - por ejemplo, ingleses distinguen dos categorías que expresan de las consonantes de parada, mientras que el tailandés tiene tres categorías ; los niños deben aprender qué diferencias son distintivas en sus aplicaciones de lengua materna, y cuáles no son). Mientras que los niños aprenden cómo clasificar sonidos de discurso entrantes en las categorías, no haciendo caso de diferencias inaplicables y reforzando los contrastivos, su opinión se convierte en el categórico. Los niños aprenden poner en contraste diversos fonemas de la vocal de su lengua materna por aproximadamente 6 meses de la edad. Los contrastes consonantal nativos se adquieren por 11 o 12 meses de la edad. Algunos investigadores han propuesto que los niños pueden poder aprender las categorías sanas de su lengua materna con escuchar pasivo, usar un llamado de proceso de aprendizaje estadístico. Otros incluso demandan que ciertas categorías sanas son naturales, es decir, genético-están especificadas (véase la discusión sobre el natural contra la distinción categórica adquirida ).

    Si presentan los bebés de un día con la voz de su madre que habla normalmente, anormalmente (en monótono), y la voz de un extranjero, reaccionan solamente a la voz de su madre que habla normalmente. Cuando se juega un sonido humano y no humano, los bebés dan vuelta a su cabeza solamente a la fuente de sonido humano. Se ha sugerido que el aprendizaje auditivo comienza ya en el período prenatal.

    ¿Cómo los investigadores saben si los niños pueden distinguir entre los sonidos de discurso? Una de las técnicas usadas para examinar cómo los niños perciben discurso, además de cabeza-da vuelta a procedimiento mencionado anteriormente, está midiendo su tarifa que aspira. En tal experimento, un bebé está aspirando una entrerrosca especial mientras que está presentado con los sonidos. Primero, se establece la tarifa que aspira normal del bebé. Entonces un estímulo se juega en varias ocasiones. Cuando el bebé oye el estímulo por primera vez la tarifa que aspira aumenta pero como el bebé hace habituated al estímulo las disminuciones de la tarifa que aspiran y nivela apagado. Entonces, un nuevo estímulo se juega al bebé. Si el bebé percibe el estímulo nuevamente introducido como diferente del estímulo del fondo la tarifa que aspira demostrará un aumento.

    Best (1995) propuso que un modelo perceptivo de la asimilación que describe asimilación en las diferentes lenguas posible de la categoría modele y que prediga sus consecuencias. Flege (1995) formuló un discurso que aprendía el modelo que combina varias hipótesis sobre la adquisición del discurso de la segundo-lengua (L2) y que predice, en palabras simples, que un sonido L2 que no sea demasiado similar a una nativo-lengua (L1) sonido será más fácil de adquirir que un sonido L2 que es relativamente similar a un sonido L1 (porque será percibido como más obviamente `diferente' por el principiante).

    Opinión de discurso en el deterioro de la lengua o de oído

    La investigación en cómo la gente con el deterioro de la lengua o de oído percibe discurso no sólo se piensa para descubrir tratamientos posibles. Puede proporcionar la penetración en qué principios son la base de la opinión de discurso no-deteriorada. Dos campos de investigación pueden servir como ejemplo:
    oyentes del

    con afasia. la afasia de afecta a la expresión y a la recepción de la lengua. Ambos dos tipos mas comunes, y afasia, opinión de Broca de Wernike de discurso del affecto hasta cierto punto. La afasia de Broca causa las dificultades moderadas para la comprensión de idiomas. El efecto de la afasia de Wernike en la comprensión es mucho más severo. Se conviene en, ese los aphasics sufre de déficits perceptivos. No pueden generalmente distinguir completamente el lugar de la articulación y de expresar. En cuanto a otras características, las dificultades varían. Todavía no se ha probado si las habilidades bajas de la discurso-opinión están afectadas en víctimas de la afasia o si sus dificultades son causadas por la debilitación de alto nivel solamente.

    Ruido

    Uno de los problemas básicos en el estudio del discurso es cómo ocuparse del ruido en la señal de discurso. Esto es demostrada por la dificultad que los sistemas del reconocimiento de discurso de la computadora tienen con el reconocimiento de discurso humano. Estos programas pueden hacer bien en el reconocimiento de discurso cuando se han entrenado en la voz de un altavoz específico, y bajo condiciones reservadas. Sin embargo, estos sistemas hacen a menudo mal en situaciones que escuchan más realistas donde están capaces los seres humanos de entender discurso sin dificultad.

    Métodos de la investigación

    Los métodos usados en la investigación de la opinión de discurso se pueden dividir áspero en tres grupos: métodos del comportamiento, de cómputo, y, más recientemente, neurofisiológicos. Los experimentos del comportamiento se basan en un papel activo de un participante, es decir los temas se presentan con los estímulos y se piden tomar decisiones conscientes sobre ellas. Esto puede tomar la forma de una prueba de la identificación, de una prueba de la discriminación, de grado de la semejanza, de etc. Estos tipos de experimentos ayudan a proporcionar una descripción básica de cómo los oyentes perciben y categorizan sonidos de discurso.

    El modelado de cómputo también se ha utilizado para simular cómo el discurso se puede procesar por el cerebro para producir los comportamientos se observan que. Los modelos de ordenador se han utilizado para tratar varias preguntas en la opinión de discurso, incluyendo cómo se procesa la señal de sonido sí mismo de extraer las señales acústicas usadas en discurso, así como cómo la información del discurso se utiliza para los procesos de alto nivel, tales como reconocimiento de palabra.

    Los métodos neurofisiológicos confían en utilizar la información que proviene procesos (pre-attentative) directos y no no necesario conscientes más. Los temas se presentan con los estímulos del discurso en diversos tipos de tareas y las respuestas del cerebro se miden. El cerebro sí mismo puede ser más sensible que aparece estar con respuestas del comportamiento. Por ejemplo, el tema no puede demostrar sensibilidad a la diferencia entre dos sonidos de discurso en una prueba de la discriminación, pero las respuestas del cerebro pueden revelar sensibilidad a estas diferencias. Sin la necesidad de tomar una parte activa en la prueba, incluso los niños pueden ser probados; esta característica es crucial en la investigación en procesos de adquisición. La posibilidad para observar procesos auditivos bajos independiente las de alto nivel permite abordar ediciones teóricas de muchos años por ejemplo independientemente de si las pandillas de los seres humanos un módulo especializado para percibir discurso o independientemente de si una cierta invariación acústica compleja (véase la carencia de la invariación arriba) es la base del reconocimiento de un sonido de discurso.

    Teorías

    La investigación en la opinión de discurso (SP) ha explicado de ninguna manera cada aspecto de los procesos implicados. Mucho qué se ha dicho sobre el SP es una cuestión de teoría. Varias teorías se han ideado para desarrollar algunas ediciones antedichas y de las otras confusas. No todos dan explicaciones satisfactorias de todos los problemas, no obstante la investigación que inspiraron ha rendido muchos datos útiles.

    Teoría del motor del SP

    Algo del trabajo más temprano del estudio de cómo los seres humanos perciben sonidos de discurso fue conducido por el Alvin Liberman y sus colegas en los laboratorios de Haskins. Usar un sintetizador de discurso, construyeron los sonidos de discurso de los cuales varió en el lugar de la articulación a lo largo de una serie continua /b ɑ/ a /d ɑ/ a /g ɑ/ . Pidieron los oyentes identificar qué sonido oyeron y discriminar entre dos diversos sonidos. Los resultados del experimento demostraron que los oyentes agruparon sonidos en categorías discretas, aunque los sonidos que eran audiencia variaban continuamente. De acuerdo con estos resultados, propusieron la noción de la opinión categórica como mecanismo por el cual los seres humanos pueden identificar sonidos de discurso.

    Una investigación más reciente usar diversas tareas y metodologías sugiere que los oyentes estén alto - sensible a las diferencias acústicas dentro de una sola categoría fonética, contrariamente a una cuenta categórica terminante de la opinión de discurso.

    Para proporcionar una cuenta teórica de los datos categóricos de la opinión, Liberman y los colegas resolvieron la teoría del motor de la opinión de discurso, donde “la codificación articulatoria complicada fue asumida para ser descifrada en la opinión del discurso por los mismos procesos que están implicados en la producción” e incluso más adelante a los gestos articulatorios previstos, así " la representación de los nervios de la elocución que determina la producción del altavoz es el objeto distal el perceives" del lister; Demandando que los gestos articulatorios reales que producen diversos sonidos de discurso son ellos mismos las unidades de opinión de discurso, la teoría puentea el problema de la carencia de la invariación .

    modelo Borroso-lógico del SP

    La teoría lógica borrosa de la opinión de discurso desarrollada por Massaro propone que la gente recuerda sonidos de discurso en un de probabilidad, o calificado, manera. Sugiere que la gente recuerde descripciones de las unidades perceptivas de lengua, llamado los prototipos. Dentro de cada prototipo las varias características pueden combinar. Sin embargo, las características no son apenas binarias (verdad o falso), hay un valor borroso que corresponde a cómo es probablemente que un sonido pertenece a una categoría particular del discurso. Así, al percibir una señal de discurso nuestra decisión sobre lo que oímos realmente se basa en la calidad relativa del fósforo entre la información del estímulo y los valores de prototipos particulares. La decisión final se basa en las características o las fuentes de información múltiples, incluso información visual (ésta explica el efecto de McGurk). Los modelos de ordenador de la teoría lógica borrosa se han utilizado para demostrar que las predicciones de la teoría de cómo se categorizan los sonidos de discurso corresponden al comportamiento de oyentes humanos.

    Señales acústicas y características distintivas

    considera también:

    las señales acústicas y de las características distintivas

    Además de las ofertas de la teoría del motor y del realismo directo sobre la relación entre las características fonológicas y los gestos articulatorios, el Kenneth N. Stevens propuso otra clase de relación: entre las características fonológicas y las características auditivas. Según esta visión, los oyentes están examinando la señal entrante para las señales acústicas supuestas que son acontecimientos particulares en la información que lleva del espectro sobre los gestos que los produjeron. Puesto que estos gestos son limitados por las capacidades órganos articuladores de los seres humanos los' y los oyentes son sensibles a sus correlativos auditivos, la carencia de la invariación no existe simplemente en este modelo. Las características acústicas de las señales constituyen la base para establecer las características distintivas. Los paquetes de ellas especifican únicamente los segmentos fonéticos (fonemas, sílabas, palabras).

    Teoría del modelo

    Los modelos del modelo de la opinión de discurso diferencian de las cuatro teorías mencionadas sobre cuáles suponen que no hay conexión entre la palabra y el transmisor-reconocimiento y que la variación a través de transmisores es ruido del `' que se filtrará hacia fuera.

    Los oyentes modelo-basados de la demanda de los acercamientos almacenan la información para la palabra así como transmisor-reconocimiento. Según esta teoría, los casos particulares de los sonidos de discurso se almacenan en la memoria de un oyente. En curso de opinión de discurso, los casos recordados e. de una sílaba almacenada en la memoria del oyente se comparan con el estímulo entrante para poder categorizar el estímulo. Semejantemente, al reconocer a un transmisor, todos los rastros de memoria de elocuciones producidas por ese transmisor se activan y la identidad del transmisor es resuelta. Apoyando esta teoría ser varios experimentos divulgados por Johnson.

  • Zenithic
  • José Antonio Camacho
    Random links:STS-3 | Desierto de Namib | Bosque del Estado de Humboldt-Toiyabe | Antonio Meillet | Submarino ruso K-496 Borisoglebsk

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">