En la lingüística, una recopilación (recopilaciones plurales del del ) o la recopilación de texto del es un sistema grande y estructurado de textos (ahora almacenado generalmente electrónicamente y procesado). Ella se utiliza para hacer el análisis estadístico, comprobando ocurrencias o validando reglas lingüísticas en un universo específico.
Una recopilación puede contener los textos en datos monolingu!es (la recopilación monolingüe del ) o del texto en las idiomas múltiples (recopilación multilingüe del ). Las recopilaciones multilingües que se han dado formato especialmente para la comparación side-by-side se llaman las recopilaciones paralelas alineadas .
Para hacer las recopilaciones más útiles para hacer la investigación lingüística, se sujetan a menudo a un proceso conocido como anotación . Un ejemplo de anotar una recopilación es parte del discurso que marca con etiqueta, o el Posición-que marca con etiqueta, en el cual la información sobre la parte del discurso de cada palabra (verbo, sustantivo, adjetivo, etc.) se agrega a la recopilación bajo la forma de etiquetas del . Otro ejemplo está indicando la forma (baja) del lema de cada palabra. Cuando la lengua de la recopilación no es una lengua de funcionamiento de los investigadores que la utilizan, el interlineal que lustra se utiliza para hacer al bilingüe de la anotación.
Las recopilaciones son la base de conocimiento principal en la lingüística de recopilación . El análisis y el proceso de varios tipos de recopilaciones son también el tema de mucho trabajo en la lingu5ística computacional, el reconocimiento de discurso y la traducción automática, donde están de uso frecuente crear los modelos de Markov ocultados para propósitos Posición-que marcan con etiqueta y los otros. Las recopilaciones y las listas de frecuencia que derivó de ellas son útiles para la enseñanza de idiomas .
Las recopilaciones de texto también se utilizan en el estudio de los documentos históricos por ejemplo en tentativas a las escrituras antiguas de la descifración, o en la beca bíblica . Algunas recopilaciones arqueológicas pueden ser de tal duración corta que proporcionan una foto a tiempo. Una de las recopilaciones más cortas a tiempo, puede ser los textos de las letras de Amarna de 15-30 años ( 1350 A. La recopilación del de una ciudad antigua, (por ejemplo el " Kültepe Texts" de Turquía), puede pasar con una serie de recopilaciones, determinada por su sitio del hallazgo fecha.
.
| Random links: | 1628 en ciencia | Zladko Vladcik | Estudios medio-orientales | Charles Howard, 11mo duque de Norfolk | Torpedo de Hurra |