
Conferencia: 'Identificación de Autores con Mecanismos de Rechazo en Condiciones de Escasez de Datos'
Atribuir la autoría a un texto es un problema complejo tanto para especialistas como para sistemas de IA. La dificultad radica en capturar sutiles pistas estilísticas, lidiar con textos de épocas o lenguas similares, distinguir heterónimos de un solo escritor e incluso inferir el género del autor. Los enfoques tradicionales requieren extraer numerosos atributos—frecuentemente a través de herramientas lingüísticas especializadas—y dependen de grandes corpus de entrenamiento, una dependencia que se amplifica aún más con el aprendizaje profundo basado en transformadores modernos. Los clasificadores clásicos también tienden a asignar cada documento a una clase conocida, incluso cuando no se asemeja a nada visto en el entrenamiento, aunque tales textos fuera de alcance deberían ser rechazados de manera confiable.
Proponemos un método independiente del idioma para la atribución de autoría que puede rechazar muestras anómalas en configuraciones desafiantes, logrando alta precisión en todos los conjuntos de datos probados. Al evaluar el poder discriminatorio de cada característica, el conjunto final de atributos puede reducirse drásticamente.
Acerca del ponente
Joaquim Ferreira da Silva es Profesor Asistente de Ciencias de la Computación en el Departamento de Ciencias de la Computación, Nova School of Science and Technology, Universidade Nova de Lisboa. Joaquim Silva tiene un doctorado en Ciencias de la Computación de la Universidade Nova de Lisboa (2004). Es miembro integrado del centro de investigación Nova Lincs, sus intereses de investigación se centran en la Extracción de Información, Minería de Texto y Aprendizaje Automático. Publica regularmente en eventos científicos sobre esas áreas como ICDM, PAKDD, IEEE eScience, IEEE BigData, ECML PKDD, ICCS, PROPOR, EPIA, y ha estado involucrado en varios proyectos, como ISTRION, VIP-ACCESS, PATRAS y WE-LEARN. Desde 2005, ha sido co-presidente de TeMA, una sección de la conferencia EPIA. Ha sido miembro de algunos Comités de Programa de conferencias, como EPIA, ICCS, ECML PKDD, PAKDD y el taller MWE ACL. Ha supervisado algunas tesis de estudiantes, de doctorado y máster, y su actividad docente ha estado en cursos como Bases de Datos, Minería de Texto, Lógica Computacional, Aprendizaje Automático, entre otros.
Evento presencial
/events/lecture-authorship-identification-with-rejection-mechanisms-under-data-scarce-conditions
events_es