Mark-up and Annotation in the Corpus of Historical English Law Reports (CHELAR): Potential for Historical Genre Analysis
Por favor, use este identificador para citas ou ligazóns a este ítem:
http://hdl.handle.net/10347/21009
Ficheiros no ítem
Metadatos do ítem
Título: | Mark-up and Annotation in the Corpus of Historical English Law Reports (CHELAR): Potential for Historical Genre Analysis |
Outro/s título/s: | Marcado y anotación en el Corpus de Informes Históricos de Derecho Inglés (CHELAR): potencial para el análisis de género histórico |
Autor/a: | Rodríguez Puente, Paula Blanco García, Cristina Tamaredo Meira, Iván |
Centro/Departamento: | Universidade de Santiago de Compostela. Departamento de Filoloxía Inglesa e Alemá |
Palabras chave: | Corpus annotation | Corpus mark-up | Law reports | TEI-XML | Legal english | Anotación de corpus | Etiquetado de corpus | Decisiones judiciales | Inglés legal | |
Data: | 2019 |
Editor: | Asociación Española de Estudios de Inglés, AEDEAN (Asociación Española de Estudios Anglo-Norteamericanos) |
Cita bibliográfica: | Rodríguez-Puente, P., Blanco-García, C. and Tamaredo, I., 2019. Mark-up and Annotation in the Corpus of Historical English Law Reports (CHELAR): Potential for Historical Genre Analysis. Atlantis. Journal of the Spanish Association for Anglo-American Studies, 41(2), pp.63-84. |
Resumo: | Adding annotation and mark-up to linguistic corpora has become a standard practice in corpus
building over the past few decades as a way to facilitate data extraction and at the same time
guarantee that new corpora are compatible with existing and future tools. The purpose of this
article is twofold. First, we provide an overview of the main forms of annotation and mark-up
available to the research community and how they have been applied to the Corpus of Historical
English Law Reports 1535-1999 (CHELAR), a specialized corpus consisting of law reports or
records of judicial decisions. Second, we give an account of preliminary research based on the
annotated versions of CHELAR, which so far has been primarily aimed at identifying the
distinctive linguistic characteristics of law reports, as well as at investigating how the language
of law reports has evolved over a time span of almost five centuries. Our article illustrates the
multiple advantages of applying a simple annotation schema to a corpus and how this can
enhance the potential of a corpus for historical genre analysis. El etiquetado y anotación lingüística de un corpus se ha convertido en una práctica generalizada en las últimas décadas, con el objetivo de facilitar la extracción de datos del propio corpus, así como garantizar que los corpus nuevos son compatibles con otros ya existentes o creados con posterioridad. El presente artículo tiene una doble finalidad. Por una parte, proporcionamos un análisis de las principales formas de etiquetado y anotación que están a nuestra disposición. Tomando como ejemplo el Corpus of Historical English Law Reports 1535-1999 (CHELAR), un corpus especializado de decisiones judiciales, ilustraremos el modo en que estos etiquetados pueden implementarse de forma sencilla para su posterior aprovechamiento. En segunda instancia, presentamos un resumen de los trabajos de investigación que se han llevado a cabo hasta la fecha con CHELAR, y que se han centrado principalmente en identificar las características lingüísticas significativas de las decisiones judiciales, así como en investigar la evolución del lenguaje de estos documentos durante casi cinco siglos. Nuestro trabajo ilustra las múltiples ventajas de la implementación de un sistema de anotación simplificado y las mejoras que este supone para el análisis textual desde la perspectiva histórica |
Versión do editor: | https://doi.org/10.28914/Atlantis-2019-41.2.03 |
URI: | http://hdl.handle.net/10347/21009 |
DOI: | 10.28914/Atlantis-2019-41.2.03 |
ISSN: | 0210-6124 |
E-ISSN: | 1989-6840 |
Dereitos: | © The Author(s) Content is licensed under a Creative Commons Attribution NonCommercial ShareAlike 4.0 International Licence |
Coleccións
-
- FIA-Artigos [150]
O ítem ten asociados os seguintes ficheiros de licenza:
A licenza do ítem descríbese como
© The Author(s) Content is licensed under a Creative Commons Attribution NonCommercial ShareAlike 4.0 International Licence
© The Author(s) Content is licensed under a Creative Commons Attribution NonCommercial ShareAlike 4.0 International Licence
Items relacionados
Mostrando items relacionados por título, autor e materia.
-
Approaching discourse markers in present-day english. A corpus-based study
Varela Villaverde, David (2018)The main aim of this work is the study of discourse or pragmatic markers in present-day written and spoken English by means of a corpus-based methodology which will allow me to analyse data extracted from two main ... -
El fraseologismo "por momentos": principales valores semánticos y algunos apuntes diatópicos
Mellado Blanco, Carmen; López Meirama, María Belén (Universidad de Navarra, 2017)En este trabajo se lleva a cabo un análisis inductivo del fraseologismo (FR) por momentos basado en corpus que tiene por objeto (1) estudiar los signifi cados más frecuentes de por momentos en España en relación ... -
Literatura y parto en la Iberia de la temprana Modernidad: apuntes para una propuesta de corpus y análisis de fuentes literarias
Casariego Castiñeira, Paula (Instituto de Estudios Auriseculares (IDEA), 2018)Para una investigación interdisciplinar de la historia cultural del parto en la Iberia de la temprana Modernidad, la Historia de la Literatura ofrece las herramientas necesarias para abordar el estudio y la clasificación ...