Construir una Búsqueda en Internet

Busqueda en internet

Para terminar con nuestro artículo sobre los buscadores de Internet, veremos como se construye una búsqueda en Internet gracias al índice mencionado anteriormente. Hacer una búsqueda por un índice conlleva que un usuario construya una petición y la envíe por medio de un motor de búsqueda. La petición puede ser muy simple, siendo una sola palabra la encargada de hacer la revisión por el índice para poner en marcha la búsqueda. Hacer una petición más compleja requiere el uso de ciertos mecanismos que permiten definir y extender los términos de la búsqueda. Para ser más exactos, este mecanismo es realizado con operadores booleanos.

Para dar una explicación rápida de lo que el término booleano significa en el mundo de los ordenadores, podemos verlo como una forma de apuntar o “mapear” cosas en bits o bytes. Lo bueno de esto, es que una vez que se comprenden las operaciones básicas en los ordenadores, el sistema es muy simple. Otra formad de entenderlo, es que el ordenador haga ciertas cosas que parece que requieren la acción de una persona, pero que se hacen de forma automática.   Los más populares que se pueden ver en el artículo actual son los siguientes:

  • AND – Todos los términos unidos con un “AND” deben aparecer en las páginas y documentos. Algunos buscadores de Internet sustituyen el operador “+” por la palabra AND para realizar la operación que tiene asignada.
  • OR – Al menos uno de los términos que se han juntado por medio del operador “OR” deben aparecer en las páginas y documentos.
  • NOT – El término o términos que siguen al operador “NOT” no deben aparecer en las páginas y documentos. Algunos buscadores de Internet sustituyen el operador “-“  por la palabra “NOT”.
  • FOLLOWED BY – Uno de los términos debe ser directamente seguido por el otro.
  • NEAR – Uno de los términos deben estar dentro de un número especificado de palabras del otro.
  • Entre comillas – Las palabras entre comillas son tratadas como una frase, y esa frase debe ser encontrar dentro del documento o archivo.

Las búsquedas definidas por los operadores booleanos son búsquedas literales, lo cual significa que el buscador revisa las palabras o frases exactamente como son insertadas al hacer la búsqueda. Esto puede ser un problema cuando las palabras de búsqueda tienen varios significados. Si por ejemplo usamos la palabra satélite, se puede referir a los satélites espaciales, a una estación satélite y otros significados.

Si estás interesado solo en un significado, puede que no quieras ver páginas que muestren todos los demás significados. Puedes construir una búsqueda literal que trate de eliminar significados no deseados, pero es más cómodo que el propio buscador ayude en esta tarea. Uno de las áreas de los buscadores de Internet es la búsqueda basada en concepto. Esto incluye usar  análisis de estadísticas de la página que contengan palabras o frases que estás buscando, para poder encontrar otras páginas en las que puedas estar interesados.

Por supuesto, la información almacenada de cada página es mayor para una búsqueda basada en concepto, y se requiere mucho más procesamiento en cada búsqueda. Aun así, muchos grupos están trabajando para mejorar ambos resultados y el rendimiento de este tipo de buscadores de Internet. Otros se han movido a otras áreas de investigación, como es el caso de las peticiones basadas en el lenguaje natural.

La ideas detrás de estas peticiones es que puedes teclear una pregunta de la misma manera que le preguntarías a una persona que está a tu lado – se debe seguir hacer un seguimiento de los operadores booleanos o estructuras de peticiones complejas. De todos modos, los sistemas existentes en la actualidad solo funcionan con peticiones simples, aunque la competencia es fuerte, y este sistema está mejorando muy rápidamente, por lo que en poco tiempo veremos avances en este campo.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

El periodo de verificación de reCAPTCHA ha caducado. Por favor, recarga la página.