COATI: Búsqueda avanzada multilingüe en blogs para la recuperación de opinión y tendencias en los ámbitos empresarial y de la administración pública

El incremento exponencial de los sitios web ha provocado que cada vez sea más complicado para empresas y administraciones públicas realizar un seguimiento efectivo del impacto de sus productos, políticas, y actividades; conocer la opinión pública o anticiparse a las tendencias que surgen en la red. Con la aparición y el aumento de blogs y redes sociales aparecieron nuevos fenómenos: las opiniones y las tendencias en diferentes formatos e idiomas, constituyendo nuevos retos tecnológicos en el ámbito de la recuperación de la información.

La minería de opiniones es una tecnología novedosa y emergente necesaria en la sociedad globalizada de la web 2.0. Es una disciplina reciente, resultado del cruce entre la recuperación de información, la lingüística computacional y la inteligencia artificial, que trabaja no sólo con la información presente en un documento sino también con las opiniones que recoge.

El proyecto COATI Opinion Mining desarrolla una plataforma de recuperación de opiniones y tendencias en blogs especializados a partir de la cual empresas y administraciones públicas podrán conseguir, de forma precisa, información relevante sobre sus productos, proyectos y políticas.

Objetivos

  • Realización de un estudio técnico sobre los retos en el acceso y explotación de información en blogs, así como de colecciones de referencia de bitácoras y la problemática del crawling (diversidad de fuentes, formatos, frecuencias de actualización).
  • Orientación a perfiles: plataforma orientada a las características de los usuarios y sus necesidades complejas de información.
  • Multilingüismo: el usuario solo debe expresar su necesidad de opiniones y tendencias en su idioma. El sistema se encargará de buscar información en diferentes lenguas (gallego, español, portugués, francés e inglés) y de devolver resultados en diferentes idiomas mediante el uso del sistema de traducción automática Opentrad.
  • Orientación a resultados relevantes: se utilizarán técnicas de sumarización de textos para que la información sea lo más condensada posible y minimizar el tiempo necesario para su procesado.
  • Open source: la plataforma resultante se liberará siguiendo las recomendaciones europeas del grupo ISTAG, bajo licencia GPL de la Free Software Foundation para que pueda ser aprovechada para futuros desarrollos realizados por la comunidad.
  • Construcción de un prototipo de minería de opiniones multilingüe para su aplicación en el dominio periodístico, telefónico, de la televisión interactiva y en la administración pública.
Enlace a la página web del proyecto