El (IR) de recuperación de la información es la ciencia de la búsqueda para la información en documentos, de la búsqueda para los documentos ellos mismos, de la búsqueda para los meta datos que describen documentos, o de la búsqueda dentro de las bases de datos si las bases de datos independientes emparentadas o las bases de datos conectadas de Hypertextually tales como el World Wide Web . Hay una confusión común, sin embargo, entre la recuperación de datos, la investigación documental, la recuperación de recuperación de la información, y del texto, y cada uno de éstos tiene sus propios cuerpos de la literatura, de la teoría, de la praxis y de las tecnologías. El IR es el interdisciplinario, basado en el de informática, las matemáticas, la ciencia de biblioteca, las ciencias de la información, la psicología cognoscitiva, la lingüística, las estadísticas y la física .
Los sistemas automatizados del IR se utilizan para reducir la sobrecarga de información . Muchas universidades y bibliotecas públicas utilizan sistemas del IR para proporcionar el acceso a los libros, a los diarios, y a otros documentos. Los motores de la búsqueda del Web tal como Google, búsqueda de Yahoo o búsqueda viva (antes búsqueda MSN) son los usos más visibles del IR.
Historia
La idea de usar las computadoras para buscar para los fragmentos de información relevantes fue popularizada en un del artículo
como podemos pensar por el Vannevar Bush en 1945. Las primeras puestas en práctica de sistemas de recuperación de
la información fueron introducidas en los años 50 y los años 60. Antes de 1990 varias diversas
técnicas había sido demostrado para realizarse bien en las pequeñas recopilaciones de texto (vario mil documentos). con énfasis sobre sistemas de punto de la visualización y de la multi-referencia.
Finales de los 90: La puesta en práctica del
Search Engine del Web de muchas características encontró antes solamente en sistemas experimentales del IR
Descripción
Un proceso de recuperación de la información comienza cuando un usuario incorpora una pregunta en el sistema. Las preguntas son declaraciones formales de las necesidades de información, por ejemplo secuencias de búsqueda en motores de la búsqueda de la tela. En de recuperación de la información una pregunta no identifica únicamente un solo objeto en la colección. En lugar, varios objetos pueden emparejar la pregunta, quizás con diversos grados de la importancia .
Un objeto es una entidad que mantiene o almacena la información una base de datos. Las preguntas de usuario se emparejan a los objetos almacenados en la base de datos. Dependiendo del uso los objetos de datos pueden ser, por ejemplo, documentos de texto, imágenes o vídeos. Los documentos ellos mismos no son mantenidos ni se almacenan a menudo directo el sistema del IR, sino en lugar de otro son representados en el sistema por los sustitutos del documento.
La mayoría de los sistemas del IR computan una cuenta numérica en como de bien cada objeto en el fósforo de la base de datos la pregunta, y alinean los objetos según este valor. Los objetos superiores de la graduación entonces se demuestran al usuario. El proceso puede entonces ser iterado si el usuario desea refinar la pregunta.
considera también:
la precisión y de memoria
Varias diversas medidas para evaluar el funcionamiento de sistemas de recuperación de la información se han propuesto. Las medidas requieren una colección de documentos y de una pregunta. Todas las acciones comunes descritas aquí asumen una noción de la verdad de tierra de la importancia: cada documento se sabe para ser relevante o irrelevante a una pregunta particular. En la práctica las preguntas pueden ser Enfermo-presentados y puede haber diversas cortinas de la importancia.
Precisión
La precisión es la fracción de los documentos recuperados que son el relevante a la necesidad de información de usuario.