La Llei Paz Andrade i l’ús del portuguès per a la traducció automàtica al gallec
Per obtenir una traducció automàtica neuronal, estadística i basada en corpus de qualitat, calen grans volums de traduccions humanes entre les llengües implicades. Algunes llengües amb pocs recursos no tenen aquest volum de traduccions, però potser poden accedir als recursos de llengües germanes o de variants. Amb tot, és difícil desenvolupar motors de traducció automàtica que comptin amb el reconeixement oficial de les autoritats lingüístiques de la llengua amb menys recursos si hi ha controvèrsies sociolingüístiques en relació amb el seu parentiu, reforçades pels marcs jurídics. En aquest article, veurem com una llei que desembulla les controvertides relacions lingüístiques entre el gallec i el portuguès (la Llei Paz Andrade) facilita jurídicament el desenvolupament de sistemes de traducció automàtica neuronal (TAN) amb bons resultats per al gallec gràcies a l’ús de corpus en portuguès. Per acabar, basant-nos en aquesta experiència, proposem un mètode per desenvolupar sistemes de TAN que es puguin aplicar en el context d’altres llengües amb pocs recursos que tenen una relació estreta tot i que controvertida amb una llengua que disposa de més recursos.
keywords: machine translation,
Publication: Article
1677145179039
February 23, 2023
/research/publications/la-llei-paz-andrade-i-lus-del-portugues-per-a-la-traduccio-automatica-al-gallec
Per obtenir una traducció automàtica neuronal, estadística i basada en corpus de qualitat, calen grans volums de traduccions humanes entre les llengües implicades. Algunes llengües amb pocs recursos no tenen aquest volum de traduccions, però potser poden accedir als recursos de llengües germanes o de variants. Amb tot, és difícil desenvolupar motors de traducció automàtica que comptin amb el reconeixement oficial de les autoritats lingüístiques de la llengua amb menys recursos si hi ha controvèrsies sociolingüístiques en relació amb el seu parentiu, reforçades pels marcs jurídics. En aquest article, veurem com una llei que desembulla les controvertides relacions lingüístiques entre el gallec i el portuguès (la Llei Paz Andrade) facilita jurídicament el desenvolupament de sistemes de traducció automàtica neuronal (TAN) amb bons resultats per al gallec gràcies a l’ús de corpus en portuguès. Per acabar, basant-nos en aquesta experiència, proposem un mètode per desenvolupar sistemes de TAN que es puguin aplicar en el context d’altres llengües amb pocs recursos que tenen una relació estreta tot i que controvertida amb una llengua que disposa de més recursos. - Pichel, J.R., Iria de-Dios-Flores, Pablo Gamallo, Marco Neves
publications_en