El de los motores de la búsqueda del Web del proporciona un interfaz para buscar para la información sobre el World Wide Web . La información puede consistir en Web pages, imágenes y otros tipos de archivos.

Algunos buscan los motores también minan los datos disponibles en groupes informativos, bases de datos, o los directorios abiertos . Desemejante de los directorios del Web, que son mantenidos por los redactores humanos, los motores de la búsqueda funcionan algorítmico o son una mezcla de entrada algorítmica y humana.

Historia de los motores populares de la búsqueda del Web

La primera herramienta usada para buscar en el Internet era archie . El nombre representa " archive" sin el " vee". Fue creado en 1990 por el Alan Emtage, estudiante en la universidad de McGill en Montreal. El programa transfirió los listados del directorio de todos los archivos situados en los sitios públicos del Anonymous FTP (File Transfer Protocol ), creando una base de datos investigable de los nombres del archivo; sin embargo, el archie no puso en un índice el contenido de estos archivos.

La subida del Gopher (creado en 1991 por la marca McCahill en la universidad de Minnesota ) llevó a dos nuevos programas de la búsqueda, Veronica y Jughead . Como el archie, buscaron los nombres del archivo y los títulos almacenados en Gopher ponen en un índice sistemas. El Veronica (ndex y-ancho riented ery del I N O del odent- del R del montaje del E V a los rchives omputerized A C) proporcionó una búsqueda de palabra clave de la mayoría de los títulos del menú del Gopher en los listados enteros del Gopher. El Jughead ( ierarchy niversal D del nd del A del xcavation del E H del opher de G del U de los onzy del J isplay) era una herramienta para obtener la información del menú de los servidores específicos del Gopher. Mientras que el nombre del " del Search Engine; " del archie ; no era una referencia a la serie del cómic del archie, " " del Veronica ; y " " del Jughead ; son los carácteres en la serie, así refiriéndose a su precursor.

Google

Alrededor 2001, el Search Engine de Google se levantó a la prominencia. Su éxito fue basado en parte en el concepto de renombre y de PageRank del acoplamiento. El número de otros Web site y Web pages que liguen a una página dada se toma en la consideración con PageRank, en la premisa que las páginas buenas o deseables se ligan más que otros. El PageRank de ligar las páginas y el número de acoplamientos en estas páginas contribuyen al PageRank de la página ligada. Esto permite para que Google pida sus resultados por cuántos Web site ligan a cada uno la página encontrada. El interfaz utilizador minimalista de Google es muy popular entre los usuarios, y ha frezado desde entonces a un número de imitadores.

Google y la mayoría de los otros motores de la tela utilizan no sólo PageRank pero más de 150 criterios para determinar importancia. El " del algoritmo; remembers" donde ha estado y pone en un índice el número de reticulaciones y relaciona éstos en las agrupaciones. PageRank se basa en el análisis de la citación que fue desarrollado en los años 50 por Eugene Garfield en la Universidad de Pensilvania. Los fundadores de Google citan el trabajo de Garfield en su papel original. De esta manera encuentran a las comunidades virtuales de Web pages. La tecnología de la búsqueda de Teoma utiliza un acercamiento de comunidades en su algoritmo de la graduación. El instituto de investigación del NEC ha trabajado en tecnología similar. El análisis de acoplamiento del Web primero fue desarrollado por Jon Kleinberg y su equipo mientras que trabajaba en el proyecto LISTO en el centro de investigación de Almaden de IBM. Google es actual el Search Engine más popular del Web.

Yahoo! Búsqueda

Los dos fundadores de Yahoo!, David Filo y Jerry Yang, candidatos del Ph. en la ingeniería eléctrica en la Universidad de Stanford, comenzaron su guía en un acoplado del campus en febrero de 1994 como manera de no perder de vista sus intereses personales en el Internet. Después de poco tiempo pasaban más tiempo en sus listas home-brewed de acoplamientos preferidos que en sus disertaciones doctorales. Eventual, las listas de Jerry y de David llegaron a ser demasiado largas y poco manejables, y las rompieron hacia fuera en categorías. Cuando las categorías llegaron a ser demasiado llenas, desarrollaron subcategorías… y el concepto de la base detrás de Yahoo! nació. En 2002, Yahoo! Inktomi adquirido y en 2003, Yahoo! insinuación adquirida, que poseyó AlltheWeb y AltaVista. A pesar de la posesión de su propio Search Engine, Yahoo! guardado inicialmente usar Google para proveer de sus usuarios búsqueda resulta en su Web site principal Yahoo. Sin embargo, en 2004, Yahoo! puso en marcha su propio Search Engine basado en las tecnologías combinadas de sus adquisiciones y de proporcionar un servicio que dio superioridad al Search Engine del Web sobre el directorio.

Microsoft

El Search Engine principal más reciente es la búsqueda MSN (desarrollado en la búsqueda viva ), poseída por el Microsoft, que confió previamente en otros para sus listados del Search Engine. En 2004, debuted una versión beta de sus propios resultados, accionada por su propia correa eslabonada de Web (llamada Msnbot ). A principios de 2005, comenzó a demostrar sus propios resultados vivos, y dejó de usar resultados Inktomi, ahora poseído por el Yahoo! . En 2006, Microsoft emigró a una nueva plataforma de la búsqueda - búsqueda viva, retirando el " MSN Search" nombre en el proceso.

Baidu

El Baidu fue puesto en marcha en 2000 y es el Search Engine chino principal, proporcionando un índice sobre de 740 millones de Web pages, 80 millones de imágenes, y 10 millones de archivos de las multimedias. Su interfaz es muy similar al Google 'S.

Desafíos hechos frente por los motores de la búsqueda de Web


El Web está creciendo mucho más rápidamente que cualquier Search Engine de la presente-tecnología puede poner en un índice posiblemente (véase la tela distribuida de arrastre).
Un Web page debe ser vuelto a clasificar cada vez que se cambia.
La búsqueda del Web pregunta uno puede hacer se limita actual a la búsqueda para las palabras claves, que pueden dar lugar a muchos mecanografían I y el tipo positivos del error de II, especialmente usar la búsqueda de la entero-página del defecto. Mejores resultados pudieron ser alcanzados usando una opción de la búsqueda de la proximidad con un buscar-soporte a los fósforos del límite dentro de un párrafo o la frase, algo que palabras al azar que emparejaban dispersó a través de las páginas grandes. Otra alternativa está utilizando a operadores humanos para hacer la investigación para los usuarios “orgánicos” del Search Engine.
Los sitios dinámicamente generados pueden ser lentos o difíciles de poner en un índice, o pueden dar lugar a resultados excesivos, quizás generando 500 veces más Web pages que promedio. Ejemplo: para un Web page dinámico que cambia contento basado en entradas insertó de una base de datos, un Search Engine pudo ser pedido para poner en un índice 50.000 los Web pages estáticos para 50.000 diversos valores de parámetro pasajeros a ese Web page dinámico. La indexación de direcciones es numerosa en los Web pages dinámicos, ellos se puede también demostrar por el pensamiento lógico: si un parámetro-valor genera 1 Web page puesto en un índice, 10 generan 10, y 1.000 parámetro-valores generan 1. También, algunos Web site de la diccionario-página se ponen en un índice usar las páginas dinámicas: por ejemplo, la búsqueda para página-cuenta de los URL que contienen variaciones del " dictionary.*" y observar los página-totales divulgados por los motores de la búsqueda, quizás superior a 50.
Muchos Web site dinámicamente generados no son indexables por los motores de la búsqueda; este fenómeno se conoce como la tela invisible . Algunos motores de la búsqueda se especializan en contenido dinámico de arrastre en la tela invisible que es contraseña protegida o requieren impresos ser rellenados.
Importancia: un motor no puede encontrar a veces lo que está buscando la persona. Puede dar una lista de sitios indeseados, inaplicables, Spam electrónico, o el Hacer estallar-sube .
Algunos motores de la búsqueda no alinean resultados por importancia, sino por la cantidad de dinero pagada por Web site para aparecer en los resultados.
El uso de muchos Web site trampea para asegurarse que están enumerados más arriba en resultados de la búsqueda, para las palabras claves numerosas. Esto puede llevar a los resultados del Search Engine que son contaminados con las páginas del linkspam o del cebo-y-interruptor que contienen poco o nada de información sobre las frases que emparejan. Los Web pages genuino relevantes son listas posteriores empujadas de los resultados de la llanura. Por ejemplo, muchos spammeres crean los Web site que contienen secuencias al azar de palabras claves del alto-tráfico, con las faltas de ortografía para atraer a menudo una graduación más alta en un Search Engine.
El contenido seguro recibido en URL HTTPS plantea un desafío para las correas eslabonadas que no puede hojear el contenido por razones técnicas ni lo pondrá en un índice por razones de la aislamiento.

Cómo los motores de la búsqueda del Web funcionan

Un Search Engine funciona, en el de la orden siguiente
  • de arrastre del Web
  • de la indexación de direcciones que busca

    Los motores de la búsqueda del Web funcionan almacenando la información sobre una gran cantidad de Web pages que recuperen del WWW sí mismo. Estas páginas son recuperadas por un &mdash de la correa eslabonada de Web (a veces también conocido como araña); un web browser automatizado que sigue cada acoplamiento él considera. Las exclusiones se pueden hacer por el uso Robots. El contenido de cada página entonces se analiza para determinar cómo debe ser puesto en un índice (por ejemplo, las palabras se extraen de los títulos, de los títulos, o de los campos especiales llamados las etiquetas de la meta). Los datos sobre Web pages se almacenan en una base de datos de índice para el uso en preguntas posteriores. Algunos buscan los motores, tales como Google, todo o una parte del almacén de la página de la fuente (designada un escondrijo ) así como la información sobre los Web pages, mientras que otros, tales como AltaVista, almacenan cada palabra de cada página que encuentran. Esta página depositada lleva a cabo siempre el texto real de la búsqueda puesto que es la que fue puesto en un índice realmente, así que puede ser muy útil cuando el contenido de la página actual se ha puesto al día y los términos de la búsqueda están no más en ella. Este problema se pudo considerar para ser una forma suave de Linkrot, y la dirección de Google de ella aumenta la utilidad en las expectativas satisfying del usuario que los términos de la búsqueda estarán en el Web page vuelto. Esto satisface el principio de menos asombro puesto que el usuario espera normalmente que los términos de la búsqueda estén en las páginas vueltas. La importancia creciente de la búsqueda hace estas páginas depositadas muy útiles, incluso más allá del hecho de que pueden contener los datos que pueden no más estar disponibles a otra parte.

    Cuando un usuario entra una pregunta en un Search Engine (típicamente usando las palabras claves, el motor examina su índice y provee de un listado de Web pages mejor-que emparejan según sus criterios, generalmente un resumen corto que contiene el título y a veces las piezas del documento del texto. La mayoría de los motores de la búsqueda apoyan el uso de los operadores boleanos Y, O y no especificar más lejos la pregunta de la búsqueda. Algunos motores de la búsqueda proporcionan una característica avanzada llamada la búsqueda de la proximidad que permite que los usuarios definan la distancia entre las palabras claves.

    La utilidad de un Search Engine depende de la importancia del resultado determinado del que da detrás. Mientras que puede haber millones de Web pages que incluyan una palabra o una frase particular, algunas páginas pueden ser más relevantes, populares, o autoritarias que otras. La mayoría de los motores de la búsqueda emplean métodos a la fila los resultados para proporcionar el " best" resultados primero. Cómo un Search Engine decide a qué páginas son los mejores fósforos, y a qué orden deben ser demostrados los resultados adentro, varía extensamente a partir de un motor a otro. Los métodos también cambian en un cierto plazo mientras que el uso del Internet cambia y las nuevas técnicas se desarrollan. La mayoría de los motores de la búsqueda del Web son empresas comerciales apoyadas por el que hace publicidad del rédito de y, consecuentemente, algunos emplean la práctica polémica de permitir que los publicistas paguen el dinero para tener sus listados alinearon más arriba en resultados de la búsqueda. Ésos buscan los motores que no aceptan el dinero para sus resultados del Search Engine hacen el dinero funcionando con anuncios relacionados búsqueda junto a los resultados regulares del Search Engine. Los motores de la búsqueda hacen el dinero que alguien chasca cada vez encendido uno de estos anuncios.

    A las empresas privadas funciona con a la gran mayoría de motores de la búsqueda que usan algoritmos propietarios y bases de datos cerradas, aunque el algún es fuente abierta.

    motores Geospatially-permitidos de la búsqueda del Web

    considera también:

    local de la búsqueda (Internet) Un realce reciente a la tecnología del Search Engine es la adición de Geocoding y de Geoparsing al proceso de los documentos injeridos que son puestos en un índice, para permitir la búsqueda dentro de un lugar especificado (o de la región). Geoparsing intenta emparejar cualesquiera las referencias encontradas a las localizaciones y a los lugares a un marco de Geospatial de la referencia, tal como una dirección de calle, localizaciones del diccionario geográfico, o a un área (tal como un límite poligonal para un municipio). Con este proceso geoparsing, las latitudes y las longitudes se asignan a los lugares encontrados, y estas latitudes y longitudes son puestos en un índice para la pregunta espacial posterior y la recuperación. Esto puede realzar el proceso de la búsqueda enormemente permitiendo que un usuario busque para los documentos dentro de un grado dado del mapa, o inversamente, trazar la localización de los documentos que emparejan una palabra clave dada para analizar la incidencia y el que arracima, o cualquier combinación de los dos. ¡Ver la lista de los motores de la búsqueda por ejemplos de las compañías que ofrecen este feature.desarrollado este tipo de tecnología es MetaCarta, que hace su tecnología de la búsqueda también disponible pues un servicio de Web XML para permitir la integración profunda en usos existentes. -->

    Búsqueda social del Web

    considera también:

    social de la búsqueda Los motores sociales de la búsqueda son un tipo del Search Engine vertical encontrado en muchos Web site.

    Ver también

    style=" del
    Lista de los motores de la búsqueda
    Búsqueda federada
    Índice invertido
    Motor de Metasearch
    Búsqueda orgánica
    Hijacking de la página
    Comercialización del Search Engine
    La búsqueda orientó la arquitectura
    Índice (Search Engine)
    Spamdexing
    Búsqueda vertical
    Search Engine video
    Indexación de direcciones del Web
    Pregunta de la búsqueda del Web
  • .

  • Zenithic
  • Axel Keller
    Random links:El municipio de Spring Hill, Pennsylvania | Lucy Aikin | Vincent Jackson | Convenciones de la dirección de Ontario CCF/NDP | Organización Democratic de la unidad nacional

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">