Categoría:Motores de Búsqueda

De Libro de Mercadeo y Posicionamiento web



Un buscador es un programa desarrollado específicamente para ofrecer listas de documentos que coinciden con los términos de búsqueda insertados.

Lo esencial de los motores: son sistemas de creación de índices que permiten el acceso a la información presente en la Web mediante el análisis automático de los documentos . Desarrollan todas sus funciones de forma automática y cubren una parte muy considerable de la Web. Los índices de los motores proporcionan acceso a los documentos por todas y cada una de las palabras principales de los mismos y no solamente mediante su asignación a una categoría. Actualmente constituyen la forma privilegiada por los usuarios de buscar información en la Web.

Tomado de: Lluís Codina. Artículo F910. Características básicas de buscadores y directorios [en línea]. En Cristòfol Rovira; Lluís Codina (dir.). Máster en Buscadores. Barcelona: Área de Ciencias de la Documentación. Departamento de Comunicación Audiovisual. Universidad Pompeu Fabra, 2009. http://www.masterenbuscadores.com [Consulta: 17 noviembre 2009]

En la actualidad sus índices se actualizan diariamente, y hasta cada hora o minuto en el caso de sitios web de cambio frecuente como cnn.com

Cualquier Buscador se basa en 3 partes principales:

1. Robots (arañas) buscadores: Son las que recorren el web en busca de páginas, actualizaciones e información, son enviadas por: a. Solicitud de escaneo b. Siguiendo los links de un sitio a otro Google usa 4 robots que tienen capacidad de recorrer 100 páginas por segundo generando cerca de 100kb de información por segundo.

       Los términos Crawler (tractor) y Spider (araña) se usan como sinónimos, otros sinónimos también usados del término Web Crawlers son:

Ants (hormigas), automatic indexers (indizadores o indexadores automáticos), bots (robots), worms (gusanos) o Web spider (arañas de Internet), Web robot (Robot web), o Web scutter (Escrutinador web) http://en.wikipedia.org/wiki/Web_crawler

2. Índice: Son las bases de datos con toda la información recopilada

3. Programas del buscador: Todos los programas que procesan la información de búsqueda y ofrecen los resultados.


Hay que reconocer que todos los motores de búsqueda tienen serias limitaciones técnicas para reflejar a exactitud el contenido dinámico de la web (http://eprints.rclis.org/4620/1/isu_preprint.pdf ), con Google Cafeine se hace un gran adelanto en la indexación rápida, pero aún así quedaran muchos documentos extensos y de valor sin ser indexados por lo menos por algún tiempo. Por ejemplo muchas bases de datos con información que es accesada a través de buscadores internos (por ejemplo el proyecto E-lis http://eprints.rclis.org/) y que finalmente el spider de Google, Yahoo! O cualquier otro no es capaz de llenar las fórmulas de búsqueda para indexarlos. A esto se le llama la web Invisible, dos expertos: Sherman and Price (Sherman, C.; Price, G. (2001): The Invisible Web: Uncovering Information Sources Search Engines Can't See. Medford, NJ: Information Today) dicen que ésta corresponde a “páginas, archivos o cualquier otro tipo de información autoritativa en la web que para efectos prácticos los buscadores no pueden indexar por sus limitaciones técnicas, o no la indexarán por que deliberadamente se ha elegido bloquear los buscadores”… Esto me recuerda el caso Murdock que dicha empresa mayorista de noticias está pensando bloquear el acceso de Google a sus noticias.


NOTA: La información de ésta categoría es básica, pues en Internet hay bastante información dispobible de éstos temas.

Artículos en la categoría "Motores de Búsqueda"

Las siguientes 6 páginas pertenecen a esta categoría, de un total de 6.

-

B

G

M

Herramientas personales