Inteligencia Artificial para el análisis de información sobre riesgos para la salud en Internet
El avance de la Inteligencia Artificial (IA) ha planteado nuevos retos y desafíos en el ámbito de la información en línea al facilitar la creación y difusión de contenido falso y desinformación. Esta problemática es especialmente crítica en temas relacionados con la salud debido a los posibles efectos perjudiciales que puede tener en la población.
Sin embargo, la IA no solo ha creado nuevos y complejos escenarios a los que enfrentarse, sino también ha traído consigo nuevas oportunidades y soluciones para combatir la desinformación. En esta investigación, hacemos uso de la IA para estudiar y analizar la información disponible en Internet acerca del radón, un gas radioactivo de origen natural clasificado como una de las principales causas de cáncer de pulmón.
En nuestra experimentación, ejecutamos un conjunto de 51 consultas relacionadas con el radón contra un gran corpus web (C4). Se trata de una versión colosal y depurada del corpus de rastreo web de Common Crawl. Indexamos el corpus y buscamos páginas web que se estima que son relevantes para nuestras necesidades de información. Utilizando tecnologías de IA, se extraen los pasajes de estas páginas web más relevantes para nuestras necesidades de información. Esto dio lugar a un recurso acerca de consultas sobre el radón que puede ser explotado de diferentes formas. Por ejemplo, se definieron una serie de guías de etiquetación de relevancia para estimar cuánta información valiosa se recuperaba. Los En esta ocasión, se analizaron 5.100 páginas web en función de su relevancia gracias a una serie de guías de etiquetación para estimar cuánta información valiosa se recuperaba. Los resultados iniciales demostraron la abundancia de información no relevante acerca del radón y la falta de resultados muy relevantes. Además, se ha desarrollado una metodología para medir en nivel de credibilidad de la información y detectar la desinformación presente en este conjunto de páginas que podría simular la web.
keywords: Health Misinformation
Publication: Congress
1701165438346
November 28, 2023
/research/publications/inteligencia-artificial-para-el-analisis-de-informacion-sobre-riesgos-para-la-salud-en-internet
El avance de la Inteligencia Artificial (IA) ha planteado nuevos retos y desafíos en el ámbito de la información en línea al facilitar la creación y difusión de contenido falso y desinformación. Esta problemática es especialmente crítica en temas relacionados con la salud debido a los posibles efectos perjudiciales que puede tener en la población.
Sin embargo, la IA no solo ha creado nuevos y complejos escenarios a los que enfrentarse, sino también ha traído consigo nuevas oportunidades y soluciones para combatir la desinformación. En esta investigación, hacemos uso de la IA para estudiar y analizar la información disponible en Internet acerca del radón, un gas radioactivo de origen natural clasificado como una de las principales causas de cáncer de pulmón.
En nuestra experimentación, ejecutamos un conjunto de 51 consultas relacionadas con el radón contra un gran corpus web (C4). Se trata de una versión colosal y depurada del corpus de rastreo web de Common Crawl. Indexamos el corpus y buscamos páginas web que se estima que son relevantes para nuestras necesidades de información. Utilizando tecnologías de IA, se extraen los pasajes de estas páginas web más relevantes para nuestras necesidades de información. Esto dio lugar a un recurso acerca de consultas sobre el radón que puede ser explotado de diferentes formas. Por ejemplo, se definieron una serie de guías de etiquetación de relevancia para estimar cuánta información valiosa se recuperaba. Los En esta ocasión, se analizaron 5.100 páginas web en función de su relevancia gracias a una serie de guías de etiquetación para estimar cuánta información valiosa se recuperaba. Los resultados iniciales demostraron la abundancia de información no relevante acerca del radón y la falta de resultados muy relevantes. Además, se ha desarrollado una metodología para medir en nivel de credibilidad de la información y detectar la desinformación presente en este conjunto de páginas que podría simular la web. - Noel Pascual Presa, Marcos Fernández-Pichel, David E. Losada, Berta García-Orosa, Paula Martínez Graña
publications_en