Identificação e classificação de entidades mencionadas em galego
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10347/6130
Files in this item
Metadata
Title: | Identificação e classificação de entidades mencionadas em galego |
Author: | García González, Marcos Gayo, Iria González López, Isaac |
Affiliation: | Universidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Información Universidade de Santiago de Compostela. Departamento de Lingua e Literatura Española, Teoría da Literatura e Lingüística Xeral |
Subject: | Processamento da língua natural | Reconhecimento de entidades mencionadas | Galego | |
Date of Issue: | 2012 |
Publisher: | Universidade de Santiago de Compostela. Servizo de Publicacións e Intercambio Científico |
Citation: | GARCÍA, Marcos; GAYO, Iria; GONZÁLEZ LÓPEZ, Isaac: «Identificação e classificação de entidades mencionadas em galego», Estudos de Lingüística Galega, vol. 4 (2012). ISSN 1889-2566, pp. 13-25 |
Abstract: | A identificação e a classificação semântica automáti-cas de entidades mencionadas são tarefas de especial relevância para variadas aplicações do processamento da língua natural, tais como a tradução automática, a extracção de informação ou os sistemas de resposta a perguntas. O presente artigo descreve a adaptação e implementação de diversas ferramentas de código aberto para a identificação e classificação dos seguin-tes tipos de entidades em galego: (i) datas, (ii) nume-rais, (iii) quantidades e (iv) nomes próprios. A análise dos três primeiros tipos de entidades realiza-se com o software FreeLing através de máquinas de estados finitos. Para a identificação de nomes próprios com-param-se duas estratégias: (i) a utilização de máquinas de estados finitos e (ii) métodos de aprendizagem automática. Finalmente, a classificação semântica dos nomes próprios é realizada com um sistema baseado em regras e recursos obtidos automaticamente. O artigo mostra um conjunto de avaliações para cada um dos módulos apresentados, disponibilizados com licenças livres. |
URI: | http://hdl.handle.net/10347/6130 |
ISSN: | 1889-2566 |
Collections
-
- CiTIUS-Artigos [155]
- EL/004-Vol 4 (2012) [20]
- LETLLX-Artigos [309]