¡El Content Curator conquista la Galia!

Gracias al fantástico trabajo de adaptación y traducción de Hugo Zunzarren, director técnico en IdInteligencia, se ha publicado este martes en el Portail de l’Intelligence économique, una adaptación del artículo que publiqué en este blog con el título Comparativa Buscadores: tradicionales, semánticos y marcadores sociales” bajo el título “Etude comparative web sémantique : Google Vs Bing“:

Así que parece que después de todo, el trabajo de este joven blogger que os escribe (tan sólo llevo 3 meses recien cumplidos en este nuevo reto profesional) empieza a ser reconocido, tal como os comentaba en “Los 140 perfiles más influyentes de Biblogtecarios y mi Klout” y no sólo eso, sino que gracias a la colaboración inestimable de excelentes profesionales (¡gracias Hugo!) mi trabajo empieza a traspasar fronteras, no sólo en visitas a mi blog sino en la publicación de mis artículos por portales de reconocido prestigio en el pais vecino… por lo que…, ¡hoy me siento cual Julio Cesar conquistando la Galia de Asterix y compañía! ;-)

ranking-buscadores

Comparativa Buscadores: tradicionales, semánticos y marcadores sociales.

Como ya os comenté en el post “Aplicaciones web: mortalidad, calidad y copias de seguridad“, esta semana termina un curso online que estoy haciendo sobre Gestión de la información en la web 2.0 [5ª Edición]

Uno de lo últimos ejercicios prácticos que hemos hecho ha sido realizar una búsqueda más o menos específica utilizando diversos medios y estudiar cuáles han sido los resultados, usando al menos dos buscadores tradicionales, dos aplicaciones de marcado/catalogación social y dos buscadores semánticos.

Se trataba de definir el grado de relevancia de los primeros 10 resultados obtenidos, realizando una búsqueda en las diferentes herramientas, anotando los resultados en una tabla y realizando un comentario sobre los resultados obtenidos, tanto sobre su número como sobre su calidad (es decir, su relevancia), tratando de justificarlos.

Os voy a presentar los resultados de “mi ejercicio” así como las conclusiones (personales) a las que he llegado tras analizar dichos resultados:

Para realizar este ejercicio, me he planteado la pregunta “¿Cuándo llega (o llegará) la Web 4.0 a Internet?”, y su variante ¿Cuándo llega (o llegará) la “Web 4.0″ a internet? (ya que el uso de comillas en la expresión “web 4.0” hace que la búsqueda sea mucho más afinada, pues de esta forma los motores de búsqueda buscarán frases completas). Y los buscadores utilizados han sido: Google y Bing como buscadores tradicionales,  Delicious y Digg como aplicaciones de marcado/catalogación social y Hakia y Kngine como buscadores semánticos.

A continuación podéis ver la tabla de resultados que obtuve con esta pregunta:


No os voy a poner aquí mi análisis y conclusiones de los resultados obtenidos para cada una de las herramientas empleadas, sería un post demasiado largo, por lo que él que esté interesado, puede consultarlas aquí:

Comparativa Buscadores; resultados y conclusiones – Víctor V. Valera

Aunque si voy a añadir para terminar, una reflexión general sobre el resultado de la práctica:

  • Es bastante evidente que los buscadores semánticos, al menos de momento, no funcionan correctamente, al menos no como entendemos que debería ser una búsqueda semántica: es decir, no sólo deberían hacer que las palabras clave de nuestra búsqueda aparezcan (como los buscadores tradicionales) , sino que además deberían de buscar el significado (semántica) de dichas palabras clave en un contexto.  Parece claro que la Web Semántica aún está en fase embrionaria, muchas páginas web aún no cuentan con los metadatos y ontologías necesarias para que este tipo de buscadores funcionen correctamente

  • Pero, ¿y cuando lo harán? Como ya comenté en mi post “Google y la Web Semántica o Web 3.0”, parece bastante lejano el día en el que estos buscadores puedan funcionar a pleno rendimiento, debido en parte, a que el cambio hacía la Web Semántica, de momento, está propiciado, principalmente, por grandes empresas y en sectores muy reducidos y exclusivos como administraciones públicas, instituciones educativas, bibliotecas… por lo que la generalización de la Web 3.0 en todo el entramado de internet, está aún lejana en el horizonte y por tanto el funcionamiento y rendimiento de estos buscadores semánticos no será optimo hasta que dicho concepto se haya generalizado en toda la W3C. Pero de lo que no cabe ninguna duda es que al final acabará ocurriendo como se ha llegado a imponer la Web 2.0.
  • No parece que tanto las aplicaciones de marcado y catalogación social como los buscadores semánticos y tradicionales vayan a inquietar al gigante de la gran G,  al menos en un futuro cercano.


  • Además Google se ha posicionado (muy a nuestro pesar, de los profesionales de la información quiero decir) por encima de las herramientas y catálogos especializados en cada materia, ya que la mayoría de los usuarios de internet, lectores, etc. recurre antes a Google que a un bibliotecario o documentalista… y no creo que esa tendencia vaya a cambiar en el futuro próximo, lamentablemente, aunque si que es algo que debemos de tratar de cambiar nosotros mismos (si no, ¿quién lo hará?), porque como bien dijo Neil Gaiman: “Google puede devolverte 100.000 respuestas, un bibliotecario la correcta”.
 

Google y la Web Semántica o Web 3.0


Según nos comenta Luis Urdampilleta en su artículo “Las Bibliotecas y la Web 3.0”, “en la Web 3.0 o Web del Conocimiento, referenciada técnicamente como Web Semántica, no interesará dónde se encuentren almacenados los datos, ya sea, en una Biblioteca física o en una virtual, en una e-Editorial, en una e-Librería o incluso en una e-Tienda, en la estática página Web de un autor anónimo o en un repositorio de contenidos físicos y/o digitales”.

Y nos sigue diciendo que “lo importante será que los datos recuperados proporcionen información y… ¡generen conocimiento!, sin importar su geolocalización (o georreferenciación), el software, ni el hardware utilizado por el usuario”. Para ello, “los motores de búsqueda deberán interpretar lo que el usuario quiere”, es decir, el resultado de una búsqueda deberá proporcionar “conocimiento relevante”, en contraposición a lo que sucede actualmente, que sólo nos proporcionan información pertinente.

En este sentido, Google ha publicado en estos días su próxima evolución de su motor de búsqueda, en lo que se ha venido a llamar Google se prepara para pensar como un humano“: este sistema analiza el significado de las palabras y su funcionamiento y se acercará más al concepto “de cómo entienden el mundo las personas”, según ha explicado Amit Singhal, ejecutivo de Google.

Además, desde hace un par de meses, Google integra Google+ en sus resultados de búsqueda, en los cuales, en vez de ofrecer miles de resultados que provenían de cualquier página web, pretende mostrar los resultados compartidos por los contactos de la red social con lo que pretende acercarse más aún si cabe a la “relevancia social” que muy bien ha expuesto Enrique Dans en su artículo La coevolución de la relevancia y lo social”, aunque haya mucha gente que no le gusten que Google y otras empresas de internet controlen tanto nuestros datos personales proporcionando en sus experiencias web datos falsos (Clara M. Chu: “No me gusta que Google y Facebook controlen  tanto”).

Desde luego que este cambio hacia la Web Semántica no será fácil de llevar a cabo, sobre todo porque creo que será promovido principalmente por determinadas empresas (como en el caso que acabo de citar de Google) por motivos estrictamente económicos, en sectores muy concretos como las administraciones, instituciones educativas, bibliotecas… por lo que la generalización de la Web Semántica aún tardará mucho por llegar a todos los ámbitos de la vida “en línea”, aunque no me cabe ninguna duda de que al final se acabará imponiendo, al igual que lo ha hecho la Web 2.0, aunque para hacerlo a nivel universal le haya costado más tiempo del deseado.

El futuro de la Web 3.0 se orientará a solucionar problemas de interactividad y compatibilidad para lograr la interoperabilidad e integración entre las nuevas tecnologías emergentes y los dispositivos que las soportan.

Además, la información proporcionada a cada usuario por la Web Semántica será personalizada (“acercamiento social” de los datos) y le aportara no sólo información pertinente (como ya sucede en la actualidad), sino que a través del uso sofisticado de metadatos”, que serán “procesados e interpretados” por los motores de búsqueda, luego de una adecuada “indización”, al tener capacidades para “interpretar”, operarán en forma “inteligente” aportado resultados adecuados, pertinentes y relevantes  (tanto temáticamente como socialmente)… ¡generando conocimiento!