
Conferencia: 'Identificación de Autoría con Mecanismos de Rexeitamento en Condicións de Escaseza de Datos'
Atribuír a autoría a un texto é un problema complexo tanto para especialistas como para sistemas de IA. A dificultade provén de capturar sutís indicios estilísticos, de manexar textos de épocas ou linguas similares, de distinguir heterónimos dun único escritor e incluso de inferir o xénero do autor. Os enfoques tradicionais requiren extraer numerosos atributos—moitas veces a través de ferramentas lingüísticas especializadas—e dependen de grandes corpos de adestramento, unha dependencia que se amplifica ainda máis coa aprendizaxe profunda baseada en transformadores moderna. Os clasificadores clásicos tamén tendan a asignar cada documento a unha clase coñecida, mesmo cando non se asemelle a nada visto no adestramento, ainda que tales textos fora de escopo deberían ser rexeitados de forma fiable.
Propoñemos un método independente da lingua para a atribución de autoría que pode rexeitar mostras anómalas en configuracións desafiantes, logrando unha alta precisión en todos os conxuntos de datos probados. Ao avaliar o poder discriminativo de cada característica, o conxunto final de atributos pode ser reducidamente afianzado.
Sobre o relator
Joaquim Ferreira da Silva é Profesor Asistente de Informática no Departamento de Informática, Nova Escola de Ciencia e Tecnoloxía, Universidade Nova de Lisboa. Joaquim Silva conta cun doutoramento en Informática da Universidade Nova de Lisboa (2004). É un membro integrado do centro de investigación Nova Lincs, os seus intereses de investigación centrándose na Extracción de Información, Minería de Textos e Aprendizaxe Automática. Publica regularmente en eventos científicos nesas áreas como ICDM, PAKDD, IEEE eScience, IEEE BigData, ECML PKDD, ICCS, PROPOR, EPIA, e estivo implicado en varios proxectos, como ISTRION, VIP-ACCESS, PATRAS e WE-LEARN. Desde 2005, é copresidente de TeMA, unha sección da conferencia EPIA. Foi membro de varios Comités de Programa de conferencias, como EPIA, ICCS, ECML PKDD, PAKDD e MWE ACL workshop. Supervisou algúns traballos de tese, doutoramento e MsSc, e a súa actividade docente realizouse en cursos como Base de Datos, Minería de Textos, Lóxica Computacional, Aprendizaxe Automática, entre outros.
Evento presencial
/events/lecture-authorship-identification-with-rejection-mechanisms-under-data-scarce-conditions
events_gl