
Para acabar con el molesto problema de los links erróneos, un grupo de investigadores de la UNED ha desarrollado un sencillo sistema basado en seguir la pista que este contenido deja en la web. Según los investigadores, la nueva herramienta permite recuperar hasta el 81% de los enlaces obsoletos.
Algunos estudios calculan que el 67% de las direcciones de Internet se convierten en erróneas tras un período de cuatro años de vida. En algunas ocasiones, el enlace es incorrecto porque la página ha desaparecido y, en otros casos, porque la información ha sido movida de sitio. Investigadores de la UNED han desarrollado un sistema que hace la función de un ‘detective privado’ para encontrar las pistas de ese contenido y seguir así su rastro.
“Estas pistas consisten en referencias y enlaces obsoletos en motores de búsqueda, librerías digitales, servicios web y redes sociales”, explica Juan Martínez-Romo, investigador del grupo de procesamiento de lenguaje natural y recuperación de Información de la UNED y autor principal del proyecto.
Recabadas las pistas, el sistema al que se ha denominado Detective Brooklynk elabora dinámicamente una estrategia para encontrar la página desaparecida o una equivalente de la forma más eficiente, es decir, consumiendo los mínimos recursos y el menor tiempo. De este modo, insertando el link erróneo, el programa devuelve al usuario una lista de enlaces en los que puede estar la información que busca, ya sea de la misma página o bien de otras que lo hayan recogido.
Para comprobar la efectividad de la herramienta, cuyo desarrollo se ha publicado en la revista Information Processing and Management los investigadores seleccionaron aleatoriamente un conjunto de páginas con enlaces rotos e intentaron recuperar su contenido. “Con el sistema que hemos desarrollado, conseguimos recuperar el 81% de los links erróneos”, asegura Martínez-Romo.
Los motores de búsqueda penalizan
El problema de los enlaces obsoletos es una de las asignaturas pendientes de Internet, y perjudica tanto a usuarios como a creadores. “Es evidente que, de cara a un internauta, encontrar este tipo de problemas dificulta y entorpece sus búsquedas, pero, además, esto repercute en una perdida de fiabilidad y prestigio para el dueño de la página”, comenta el investigador.
A estas molestias se suma el hecho de que los motores de búsqueda penalizan a las páginas a la hora de mostrarlas en la lista de resultados. En los últimos años, han aparecido algoritmos que proponen la modificación del PageRank (algoritmo de ranking utilizado por los motores de búsqueda) para que tenga en cuenta esa clase de errores.
El sistema desarrollado por la UNED evitaría esta penalización, explica el responsable del proyecto. A la espera de su versión definitiva, es un prototipo que utiliza parte de las estrategias presentadas en el artículo.
---------------------------------
Referencia bibliográfica:
Juan Martínez-Romo, Lourdes Araujo. “Updating broken web links: An automatic recommendation system”. Information Processing and Management, 48 (2012) DOI: 10.1016/j.ipm.2011.03.006
Más de un centenar de alumnos, desde 3º de ESO hasta universitarios, procedentes de todas las provincias de Castilla y León, además de Asturias y País Vasco, participan mañana en la semifinal regional de ASTI Robotics Challenge, el principal reto de robótica educativa del país, que celebra este año su décimo aniversario. El encuentro está impulsado ...
El Palacio de Zurbano acogió el pasado 26 de febrero una nueva edición de INFRABIM, el encuentro organizado por el Colegio de Ingenieros Técnicos de Obras Públicas de Madrid(CITOP Madrid)y ZIGURAT Institute of Technology, con la cesión del espacio por parte del Ministerio de Transportes y Movilidad Sostenible. La jornada registró un elevado nivel ...
El centro tecnológico Eurecat y la startup catalana BioEclosion presentan en el Mobile World Congress el desarrollo de una nueva plataforma portátil que actúa como un laboratorio de bolsillo con capacidad analítica para realizar diagnósticos in vitro y que permite obtener resultados en aproximadamente 10 minutos.
El nuevo dispositivo, que se puede ...
En un contexto marcado por la evolución de los costes energéticos y un entorno regulatorio cada vez más exigente, las organizaciones buscan soluciones eficientes que no impliquen interrupciones significativas, ni inversiones elevadas. En este escenario, el mantenimiento emerge como una herramienta estratégica, pudiendo llegar a reducir el consumo energético más de un 15% sin necesidad de ...
El Aula Magna de la Escuela de Ingenierías Industriales de Valladolid acogerá, el próximo miércoles 4 de marzo a las 18:00, la presentación del libro “La huella de Federico Cantero Villamil en la sociedad e industria de Castilla y León (1874-1946)”, obra que documenta la extraordinaria trayectoria del ingeniero Federico Cantero Villamill, y que aspira a propiciar nuevas investigaciones históricas de ...
En cumplimiento de la Ley de Servicios de la Sociedad de la Información y de Comercio Electrónico (LSSI) y en adecuación con la Directiva Europea 2009/136/CE, le informamos de la utilización de cookies en la presente web con el fin de facilitar y mejorar la navegación a los usuarios.
Una cookie es un fichero que se descarga en su ordenador al acceder a determinadas páginas web. Las cookies permiten a una página web, entre otras cosas, almacenar y recuperar información sobre los hábitos de navegación de un usuario o de su equipo y, dependiendo de la información que contengan y de la forma en que utilice su equipo, pueden utilizarse para reconocer al usuario.
Puede usted permitir, bloquear o eliminar las cookies instaladas en su equipo mediante la configuración de las opciones del navegador instalado en su ordenador.
Usted, una vez informado sobre la Política de Cookies, puede aceptar la utilización de las mismas por parte de esta web. Sin embargo, puede cambiar la configuración de cookies en cualquier momento, configurando su navegador para aceptar, o no, las cookies que recibe o para que el navegador le avise cuando un servidor quiera guardar una cookie.
Le informamos que en el caso de bloquear o no aceptar la instalación de cookies, es posible que ciertos servicios no estén disponibles sin la utilización de éstas o que no pueda acceder a determinados servicios ni tampoco aprovechar por completo todo lo que nuestras web le ofrece. Además del uso de cookies propias, permitimos a terceros establecer cookies y acceder a ellas en su ordenador.
Le agradecemos que consienta la aceptación de cookies, esto nos ayuda a obtener datos más precisos que nos permiten mejorar el contenido, así como mejorar la usabilidad de la web.
En caso de que este sitio web prestara algún tipo de servicio especial en el que determine unas previsiones específicas diferentes a éstas en lo relativo a la protección de datos personales y la utilización de cookies, prevalecerán las normas particulares indicadas para ese servicio en particular sobre las presentes.
Al acceder a este sitio web por primera vez verá una ventana donde se le informa de la utilización de las cookies, y donde puede consultar la presente "Política de cookies". Si usted acepta expresamente la utilización de cookies, continúa navegando o hace clic en algún link se entenderá que usted ha consentido nuestra política de cookies y por tanto la instalación de las mismas en su equipo o dispositivo.
Es posible que actualicemos la Política de Cookies de este sitio web, por ello le recomendamos revisar esta política cada vez que acceda al mismo con el objetivo de estar adecuadamente informado sobre cómo y para qué usamos las cookies. La Política de Cookies se actualizó por última vez el 02 de Septiembre de 2013.