ATRIO-USC: Análisis de textos y recuperación de información para minería de opiniones: recuperación de información y aprendizaje automático

Cada vez es mayor el número de consumidores que consultan la web para obtener información de productos antes de proceder a su adquisición. A la hora de determinar su decisión de compra, los clientes otorgan más relevancia al contenido generado por los usuarios que a las páginas de los fabricantes; por ejemplo, los blogs donde personas muy distintas expresan sus opiniones, críticas y experiencias sobre un producto y establecen comparaciones con otros similares. En este contexto, las herramientas de minería de opiniones se alzan como un instrumento valioso, pues permiten a los consumidores agregar y resumir opiniones, y a los fabricantes conocer las valoraciones de sus usuarios. Sin embargo, las herramientas de minería de opiniones existentes actualmente presentan dos grandes inconvenientes:

  1. aplican un conocimiento muy superficial de los textos, lo que conduce a análisis equivocados y/o confusos;
  2. su capacidad para gestionar textos en castellano es muy limitada o nula.

Este proyecto propone combinar la experiencia de los equipos participantes en recuperación de información, procesamiento de lenguaje natural y aprendizaje automático para desarrollar nuevas técnicas que permitan recuperar y caracterizar opiniones; extraer relaciones y comparaciones; combinar toda la información obtenida; y determinar el sentido de las opiniones vertidas con el español como lengua primaria de desarrollo. De esta manera, se promociona a la comunidad hispanohablante en el ámbito de la minería de opiniones y se contribuye a disminuir la brecha tecnológica existente entre el inglés y las demás lenguas.

Objetivos

  • Definir las tecnologías necesarias para ejecutar técnicas de minería de opiniones sobre opiniones expresadas en español.
  • Crear y compilar los recursos de apoyo adecuados para tareas de minería de opiniones sobre textos en español.
  • Diseñar e implementar métodos efectivos para localizar, obtener y representar información basada en opinión en lengua española.
  • Diseñar, implementar y evaluar técnicas eficaces de recuperación de la información para obtener fragmentos de opiniones sobre una temática determinada.
  • Diseñar, implementar y evaluar métodos para estimar la subjetividad de textos y su orientación y presentar resúmenes de opiniones a los usuarios.
  • Desarrollar una aplicación web que incorpore los métodos, recursos y técnicas descritos anteriormente, y que ofrezca opiniones sobre consultas o temáticas especificadas por el usuario.