NOTICIAS: Mejora en la recuperación de noticias y en el acceso a información financiera: recuperación de textos sobre bases documentales de agencias de noticias

Este proyecto de investigación está enfocado a proporcionar servicios avanzados de acceso a información sobre documentos textuales que figuran en bases documentales de agencias de noticias. Un mismo evento o noticia suele cubrirse por fuentes muy distintas. La presencia de múltiples documentos informando sobre la misma temática provoca que los mecanismos y sistemas habituales de búsqueda proporcionen mucha información redundante. Esto se debe a que los modelos "estado del arte" de recuperación de información tienden a primar la relevancia de los textos para la consulta del usuario, dejando de lado aspectos importantes como la diversidad.

A mayores de la redundancia existente entre noticias de distintas o de la misma fuente existe el problema de la localización de la información relevante dentro de un documento. Los usuarios tienen que revisar de modo exhaustivo los contenidos de los textos para satisfacer sus necesidades de información. Sin embargo, en muchos casos la información requerida por el usuario es un pequeño extracto de la noticia y el proceso que tuvo que llevar a cabo para conseguirlo innecesariamente tedioso.

Objetivos

  • Profundizar en la investigación de modelos y técnicas de recuperación de información aplicadas a noticias textuales, dando lugar a un sistema avanzado de acceso a la información que trabaje sobre las bases documentales de noticias
  • Diseñar sistemas de búsqueda avanzados, capaces de recuperar pasajes dentro de las noticias, detectar la novedad con respecto a otros textos, construir resúmenes e identificar temas secundarios.