Resolución de correferencia de nombres de persona para extracción de información biográfica
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10347/17694
Files in this item
Metadata
Title: | Resolución de correferencia de nombres de persona para extracción de información biográfica |
Alternative Title: | Personal name coreference resolution for biographical information extraction |
Author: | García González, Marcos Gamallo Otero, Pablo |
Affiliation: | Universidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Información Universidade de Santiago de Compostela. Departamento de Lingua e Literatura Española, Teoría da Literatura e Lingüística Xeral |
Subject: | Correferencia de nombres de persona | Extracción de información | Personal name coreference | Information extraction | |
Date of Issue: | 2011 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) |
Citation: | , M., & , P. (2011). Resolución de Correferencia de Nombres de Persona para Extracción de Información Biográfica. Procesamiento Del Lenguaje Natural, 47, 47-55. Recuperado de http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/965 |
Abstract: | Los sistemas de extracción de información necesitan un procesamiento previo que reconozca, entre otras cosas, elementos correferenciales tales como las variantes de nombres propios. El presente artículo tiene dos objetivos: por un lado, describe los principales tipos de correferencia de nombres de persona encontrados en textos enciclopédicos y periodísticos en castellano. Por otro lado, presenta un algoritmo que resuelve satisfactoriamente la mayor parte de los casos descritos. El sistema, que no necesita corpus de entrenamiento, permite unificar las variantes de nombres de persona que aparecen en un texto, mejorando así tareas como la extracción de información biográfica Information extraction systems need a previous processing step in order to recognize coreferential elements, such as personal name variants. This paper has two aims: the first is to describe the main types of personal name coreference found in encyclopedic and journalistic texts in Spanish. Furthermore, we introduce an algorithm that solves most coreferential links between personal name variants succesfully. The system, which does not need a training corpus, unifies the coreferential elements found in a text, thereby improving tasks like biographical information extraction |
Publisher version: | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/965 |
URI: | http://hdl.handle.net/10347/17694 |
ISSN: | 1135-5948 |
E-ISSN: | 1989-7553 |
Rights: | © 2011 Sociedad Española para el Procesamiento del Lenguaje Natural |
Collections
-
- CiTIUS-Artigos [177]
- LETLLX-Artigos [309]