sábado, 17 de marzo de 2007

TIPOS DE BUSCADORES

TIPO DE BUSCADORES


Al realizar la búsqueda con la frese Tipos de buscadores e ingresarla en la caja de búsqueda obtuve los siguientes resultados.

En http://www.google.com/ encontré cerca de 1 220 000 enlaces donde se ofrecía diversidad de información relacionada con los tipos de buscadores. Conforme se avanza en la búsqueda los enlaces proporcionan varios temas con la información solicitada.
Las fuentes que proporcionan esta información provienen de diversos sectores, unos con datos más detallados que otros.

En http://www.yahoo.com/ (directorio) hay cerca de 350 000 enlaces relacionados con la frase Tipos de buscadores, en la caja de búsqueda.
Varios de los temas de las fuentes que proporcionaban la información requerida por no decir, la mayoría se encontraban en google.

En http://www.dogpile.com/ (metabuscador), la información solicitada era mínima, con respecto a los dos anteriores. Pues allí se ofrece al colocar la frase tipos de buscadores aparecen apenas 64 enlaces, los cuales ya se encuentran en http://www.google.com/ y en http://www.yahoo.com/.

Considero que la calidad del contenido en los tres buscadores es buena, porque la información es similar en ellas. Lo que varía es el número de opciones que proporcionan cada uno.

Realizando una comparación entre los tres buscadores la posición sería la siguiente:
http://www.google.com/ tendría un 10

http://www.yahoo.com/ lo ubicaría un 8

http://www.dogpile.com/ tendría un 6

Por los tanto, el buscador con mayores resultados a mi criterio es http://www.google.com/. Esto porque de acuerdo a las diferencias que existen entre los tres buscadores cada uno tiene, por así decirlo, características específicas, por ejemplo en www.hipertexto.info/documentos/tipos_buscador.htm se explica los siguiente (un extracto):
Los metabuscadores también permiten buscar en varios buscadores al mismo tiempo, no almacenan las descripciones de páginas en sus bases de datos, sino que contienen los registros de los motores de búsqueda y la información sobre ellos, adecuando su expresión a los diferentes motores para remitir la consulta a los motores. Una vez que reciben la respuesta, la remiten al usuario no directamente, sino tras realizar un filtrado de los resultados.

Los directorios son listas de recursos organizados por categorías temáticas que se estructuran jerárquicamente en un árbol de materias que permite visualizar los recursos descendiendo desde los temas más generales situados en las ramas superiores, a los temas más específicos situados en las ramas inferiores.

La diferencia fundamental entre un índice y un motor de búsqueda es que mientras los índices mantienen su base de datos “manualmente”, utilizando para la inclusión de las direcciones a sus empleados o a los propios internautas que dan de alta sus páginas, los motores de búsqueda emplean para ello un robot de búsqueda

2: LA MEJOR LECTURA

Creo que esta es la mejor lectura que se ofrece en los tres buscadores. La seleccioné luego de leer varios enlaces sobre el tema. En la lectura se especifica y se hace un resumen en el que se indica qué son los buscadores y en qué se diferencian cada uno de ellos. Fue complicado copiar todo lo que contenía la página, pude copiar solo los textos más no los cuadros que allí se mostraba. Por ello a continuación escribo la dirección electrónica. www.hipertexto.info/documentos/tipos_buscador.htm.

Los multibuscadores se limitan a colocar en una página web una lista con los buscadores más comunes y con una ventana de texto para poder enviar la cadena de búsqueda introducida por el usuario a cada uno de ellos. También pueden enviar la cadena de búsqueda a una serie de motores de búsqueda e índices temáticos previamente definidos. Una vez realizada la consulta a los buscadores prefijados, el multibuscador devolverá la información de todos los enlaces encontrados. Con la utilización de multibuscadores, el usuario se evita tener que ir de buscador en buscador hasta encontrar la información deseada. El usuario elige los buscadores que quiere utilizar y desde allí realiza su consulta que ofrecerá las respuestas buscador por buscador. La única ventaja es la posibilidad de consultar un gran número de buscadores partiendo de una única página. La exhaustividad primará sobre la precisión, ya que el usuario encontrará un gran número de enlaces y muchas páginas repetidas. Un buen ejemplo de multibuscador es el ofrecido por CyberJournalist: http://cyberjournalist.ourtoolbar.com/xpi



Los metabuscadores también permiten buscar en varios buscadores al mismo tiempo. Los metabuscadores no almacenan las descripciones de páginas en sus bases de datos, sino que contienen los registros de los motores de búsqueda y la información sobre ellos, adecuando su expresión a los diferentes motores para remitir la consulta a los motores. Una vez que reciben la respuesta, la remiten al usuario no directamente, sino tras realizar un filtrado de los resultados. Este filtrado consiste en eliminar y depurar los enlaces repetidos y en ordenar los enlaces. Además, sólo aparecerá un número limitado de enlaces, los que se consideren más importantes. Los más repetidos ocuparán los primeros puestos ya que el metabuscador considerará que son los más relevantes por estar dados de alta en mayor número de buscadores. Se trata de herramientas muy útiles, el único problema es que, por lo general, no permiten realizar búsquedas tan avanzadas como en un motor de búsqueda, con lo que las consultas tienen que ser generales y no se puede buscar en profundidad. http://www.uc3m.es/uc3m/gral/IT/1metabuscadores.htm


Un metabuscador es un verdadero programa que pueden actuar bien integrado en la propia WWW como el caso de MetaCrawler o Buscopio, o bien como un programa autónomo, como Copernic, una pequeña herramienta de software que se instala en el ordenador y permite hacer búsquedas en varios buscadores a la vez. Existen incluso metabuscadores especializados en determinadas materias: noticias, bibliotecas, diccionarios, blogs, software, etc; otros que permiten búsquedas multilingües, e incluso algunos permiten personalizar las búsquedas con los buscadores elegidos



Directorios o índices temáticos
Los directorios son listas de recursos organizados por categorías temáticas que se estructuran jerárquicamente en un árbol de materias que permite visualizar los recursos descendiendo desde los temas más generales situados en las ramas superiores, a los temas más específicos situados en las ramas inferiores. Las categorías ofrecen una lista de enlaces a las páginas que aparecen referenciadas en el buscador. Cada enlace también ofrece una breve descripción de su contenido. Así pues, los directorios o índices se estructuran por temas o categorías principales que, a su vez, contienen otras subcategorías, y así sucesivamente hasta que al final se ofrecen enlaces directos a otras páginas o recursos de Internet.


El índice o Directorio permite acceder a los recursos referenciados por medio de 2 sistemas:
navegando a través de la estructura de las categorías temáticas
buscando por palabras clave sobre el conjunto de referencias del buscador o sobre una categoría concreta
Los índices o Directorios se componen de 2 partes:
Una base de datos que contiene las páginas de los sitios registrados
Una estructura jerárquica que facilita la consulta a la base de datos
Sin embargo, la formación de un directorio presenta graves problemas ya que sólo listan una pequeña parte de los documentos existentes y no suelen estar actualizados. Además, la clasificación y categorización requieren una intervención manual y en muchos casos, debido a la heterogeneidad de los temas tratados, algunas páginas presentan problemas de categorización ya que los índices suelen mantener su base de datos de forma manual.
La inclusión en un directorio puede hacerse mediante registro del autor o editor de la página, definiendo las palabras clave con las que se quiera identificarlo u optimizando el propio diseño de la página a través de metadatos para que pueda ser indexada de forma automática.
Motores de búsqueda
La diferencia fundamental entre un índice y un motor de búsqueda es que mientras los índices mantienen su base de datos “manualmente”, utilizando para la inclusión de las direcciones a sus empleados o a los propios internautas que dan de alta sus páginas, los motores de búsqueda emplean para ello un robot de búsqueda. Estos robots no son otra cosa que potentes programas que se dedican a recorrer la Web automáticamente recopilando e indizando todo el texto que encuentran, formando así enormes bases de datos en las que luego los internautas hacen sus búsquedas mediante la inclusión de palabras clave. Los robots recorren los distintos servidores de forma recursiva, a través de los enlaces que proporcionan las páginas que allí se encuentran, descendiendo como si de un árbol se tratara a través de las distintas ramas de cada servidor. Luego, periódicamente, visitarán de nuevo las páginas para comprobar si ha habido incorporaciones o si las páginas siguen activas, de modo que su base de datos se mantenga siempre actualizada. Además, estas actualizaciones se realizarán de forma “inteligente”, visitando con más asiduidad aquellos servidores que cambien más a menudo, como por ejemplo los de los servicios de noticias.
Y esa es la principal ventaja de los motores de búsqueda frente a los índices temáticos: la gran cantidad de información que recogen y la mayor actualización de sus bases de datos. Además, estos robots permiten a los creadores de las páginas web la inclusión de “metatags” o etiquetas en lenguaje HTML (entre las cuales pueden incluirse metadatos normalizados tipo Dublin Core) para resumir los contenidos de sus páginas y para incluir las palabras claves que las definan. Mediante los metadatos y las etiquetas, los motores de búsqueda podrán indizar las páginas web de forma correcta.
Por el contrario, la ventaja de los Directorios frente a los motores radica en la mayor precisión y un menor ruido, aunque son menos exhaustivos que los motores de búsqueda, ya que se obtienen menos resultados.
Los motores de búsqueda no son otra cosa que enormes bases de datos generadas como resultado de la indexación automática de documentos que han sido analizados previamente en la Web. Recogen documentos en formato HTML y otro tipo de recursos. Esta tarea la lleva a cabo un programa denominado crawler (robot) que rastrea la red explorando todos los servidores, o limitándose a ciertos servidores siguiendo un criterio temático, geográfico o idiomático.
La posterior recuperación se lleva a cabo gracias a la gestión de esta enorme base de datos que permite diferentes tipos de consulta y ordena los resultados por relevancia, dependiendo de la estrategia de consulta. Los motores son más exhaustivos en cuanto al volumen de páginas, pero son menos precisos ya que no interviene la indexación humana.

No hay comentarios: