En la lingüística, una recopilación (recopilaciones plurales del del ) o la recopilación de texto del es un sistema grande y estructurado de textos (ahora almacenado generalmente electrónicamente y procesado). Ella se utiliza para hacer el análisis estadístico, comprobando ocurrencias o validando reglas lingüísticas en un universo específico.

Una recopilación puede contener los textos en datos monolingu!es (la recopilación monolingüe del ) o del texto en las idiomas múltiples (recopilación multilingüe del ). Las recopilaciones multilingües que se han dado formato especialmente para la comparación side-by-side se llaman las recopilaciones paralelas alineadas .

Para hacer las recopilaciones más útiles para hacer la investigación lingüística, se sujetan a menudo a un proceso conocido como anotación . Un ejemplo de anotar una recopilación es parte del discurso que marca con etiqueta, o el Posición-que marca con etiqueta, en el cual la información sobre la parte del discurso de cada palabra (verbo, sustantivo, adjetivo, etc.) se agrega a la recopilación bajo la forma de etiquetas del . Otro ejemplo está indicando la forma (baja) del lema de cada palabra. Cuando la lengua de la recopilación no es una lengua de funcionamiento de los investigadores que la utilizan, el interlineal que lustra se utiliza para hacer al bilingüe de la anotación.

Las recopilaciones son la base de conocimiento principal en la lingüística de recopilación . El análisis y el proceso de varios tipos de recopilaciones son también el tema de mucho trabajo en la lingu5ística computacional, el reconocimiento de discurso y la traducción automática, donde están de uso frecuente crear los modelos de Markov ocultados para propósitos Posición-que marcan con etiqueta y los otros. Las recopilaciones y las listas de frecuencia que derivó de ellas son útiles para la enseñanza de idiomas .

Recopilaciones arqueológicas

Las recopilaciones de texto también se utilizan en el estudio de los documentos históricos por ejemplo en tentativas a las escrituras antiguas de la descifración, o en la beca bíblica . Algunas recopilaciones arqueológicas pueden ser de tal duración corta que proporcionan una foto a tiempo. Una de las recopilaciones más cortas a tiempo, puede ser los textos de las letras de Amarna de 15-30 años ( 1350 A. La recopilación del de una ciudad antigua, (por ejemplo el " Kültepe Texts" de Turquía), puede pasar con una serie de recopilaciones, determinada por su sitio del hallazgo fecha.

Algunas recopilaciones de texto notables

Lengua inglesa:
Recopilación nacional americana
Banco del inglés
Recopilación nacional británica
Recopilación de Brown
Recopilación del inglés de Oxford
Recopilación escocesa de los textos y del discurso
Lenguas Graecae (griego clásico) del tesoro
Proyecto Neo-Asirio de la recopilación de texto
El Amarna letra, (para el Akkadian, el egipcio, el Sumerogram 's, el etc.) Otras idiomas:
Recopilación nacional croata
Del del persa recopilación hoy
Recopilación de Hamshahri que una recopilación persa contemporánea para el IR investiga
Recopilación de Bijankhan que una recopilación persa contemporánea para el NLP investiga

Ver también

concordancia
Lingüística de recopilación
Consorcio de los datos lingüísticos
Proceso de lenguaje natural
Juego de herramientas de lenguaje natural
Alineación del texto paralelo
Motores de la búsqueda: tienen acceso al " corpus" de la tela;.
Memoria de traducción
Treebank
Texto ruidoso

.

  • Zenithic
  • Coatdyke railway station
    Random links:1628 en ciencia | Zladko Vladcik | Estudios medio-orientales | Charles Howard, 11mo duque de Norfolk | Torpedo de Hurra

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">