Mostrar o rexistro simple do ítem
dc.contributor.author | Canosa Rodríguez, Xavier |
dc.contributor.author | Gamallo Otero, Pablo |
dc.contributor.author | Varela Barreiro, Francisco Xavier |
dc.contributor.author | Taboada González, José Ángel |
dc.contributor.author | Martínez Lema, Paulo |
dc.contributor.author | García González, Marcos |
dc.date.accessioned | 2020-03-26T12:19:36Z |
dc.date.available | 2020-03-26T12:19:36Z |
dc.date.issued | 2019-07-20 |
dc.identifier.citation | Canosa, X., Gamallo, P., Varela, X., Taboada, J. Ángel, Martínez Lema, P., & Garcia, M. (2019). Uma utilidade para o reconhecimento de topónimos em documentos medievais. Linguamática, 11(1), 3-15. https://doi.org/10.21814/lm.11.1.291 |
dc.identifier.issn | 1647-0818 |
dc.identifier.uri | http://hdl.handle.net/10347/20923 |
dc.description.abstract | Este artigo apresenta o método de construção duma ferramenta para a anotação de entidades geográficas mencionadas em textos medievais. A nova ferramenta foi desenvolvida a partir dos módulos de língua contemporânea do LinguaKit, pacote multilingue de ferramentas de PLN. Uma coleção de corpora anotados manualmente serviu de recurso para elaborar uma lista de topónimos medievais (gazetteers) e observar padrões para a melhora e implementação de novas regras de reconhecimento dos nomes de lugar. Depois da lista de entidades geográficas, os ativadores contextuais (triggers) foram o recurso determinante na melhora da abrangência. Para o produto final, fizeram-se também ajustes menores na procura de recolher os elementos mais comuns do léxico e os contextos gramaticais das entidades geográficas mencionadas. Ainda que muito trabalho fica por fazer na elaboração de listas para entidades não geográficas, na construção dum modelo de língua medieval e um lexicon específico, o novo módulo pode ser utilizado para anotar textos e mostra uma melhora significativa a respeito dos módulos previamente existentes |
dc.description.abstract | This paper describes a method to build a tool aimed at recognizing geographical named entities in medieval texts. The new tool has been developed using the corresponding modules for contemporary languages contained in LinguaKit, a suite of NLP tools. A collection of manually annotated corpora served as a resource to build a gazetteer of medieval toponyms and find patterns to improve and implement new rules for the recognition of place names. In addition to the gazetteer, a list of triggers was the most determinant factor to improve recall. Final adjustments considered the most frequent terms of the lexicon and grammatical contexts for geographical named entities. In the process of building a model of medieval language and a specific lexicon, the available tool can already be used to annotate texts and shows a significant improvement when compared with previous modules. However, most work remains to be done in terms of adding specific gazetteers for entities other than geographical |
dc.description.sponsorship | Este trabalho foi desenvolvido no marco da rede galega de investigacao TECANDALI, ED341DR2016/011, financiada pela Consellaría de Educación e Ordenación Universitaria da Xunta de Galicia, e do European Regional Development Fund (ERDF) |
dc.language.iso | por |
dc.publisher | Universidade do Minho |
dc.publisher | Universidade de Vigo |
dc.rights | Direitos de Autor (c) 2019 Autores. This work is licensed under a Creative Commons Attribution 4.0 International License |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ |
dc.subject | Entidades Geográficas Mencionadas |
dc.subject | Deteção de topónimos |
dc.subject | Reconhecimento de entidades mencionadas |
dc.subject | Georeferential entities |
dc.subject | Detection of toponyms |
dc.subject | Named entity recognition |
dc.title | Uma utilidade para o reconhecimento de topónimos em documentos medievais |
dc.title.alternative | A tool for toponym recognition in medieval documents |
dc.type | journal article |
dc.identifier.doi | 10.21814/lm.11.1.291 |
dc.relation.publisherversion | https://doi.org/10.21814/lm.11.1.291 |
dc.type.hasVersion | VoR |
dc.rights.accessRights | open access |
dc.contributor.affiliation | Universidade de Santiago de Compostela. Departamento de Electrónica e Computación |
dc.contributor.affiliation | Universidade de Santiago de Compostela. Departamento de Filoloxía Galega |
dc.contributor.affiliation | Universidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Información |
dc.contributor.affiliation | Universidade de Santiago de Compostela. Instituto da Lingua Galega (ILG) |
dc.description.peerreviewed | SI |
Ficheiros no ítem
Este ítem aparece na(s) seguinte(s) colección(s)
-
CiTIUS-Artigos [192]
-
EC-Artigos [176]
-
FG-Artigos [224]