¿Qué es el Corpus Azcárate de terminología artística (CARTE)?

Preliminares

El Corpus Azcárate de terminología artística (CARTE) se ha creado para el análisis de la terminología artística del español. Los textos de que consta han sido seleccionados de las fuentes usadas para crear el Archivo Azcárate de terminología artística (AZCARTE). Se han escogido los textos más significativos y citados, se han digitalizado en su integridad y se han revisado meticulosamente.

En su versión actual el corpus consta de 37 documentos que incluyen 1.698.628 palabras ortográficas, accesibles todas ellas para su búsqueda. El análisis morfosintáctico automático de las transcripciones ha identificado 2.002.709 elementos gramaticales. En las siguientes tablas se muestra la distribución de palabras ortográficas y elementos gramaticales por materia, ficha bibliográfica, tipo de texto y fecha de publicación.

Palabras ortográficas

Materia
Palabras ortográficas Documentos
Arquitectura 921 463 10
Carpintería 48 137 1
Ebanistería 48 137 1
Composición 126 359 1
Geometría 214 909 1
Arquitectura barroca 164 630 3
Urbanismo barroco 66 006 1
Arquitectura romana 21 114 1
Arte 345 953 17
Arqueología 137 325 8
Fuentes 147 085 1
Historia 149 986 2
Civilización islámica 7403 2
Escultura 66 237 1
Heráldica 25 622 1
Blasón 25 622 1
Pintura 146 206 2
Técnico 85 478 1
Tipo de texto
Palabras ortográficas Documentos
Boletín 156 057 10
Divulgativo-Revista 151 070 10
Documentos de archivos 85 478 1
Tratados y ensayos 995 403 12
Técnico-Arquitectura 244 383 3
Técnico-Escultura 66 237 1
Años
Palabras ortográficas Documentos
1501-1600 271 963 4
1601-1700 93 263 1
1701-1800 477 341 5
1801-1900 200 118 3
1901-2000 655 943 24

Elementos gramaticales

Materia
Elementos gramaticales Documentos
Arquitectura 1 086 972 10
Carpintería 56 453 1
Ebanistería 56 453 1
Composición 144 473 1
Geometría 249 690 1
Arquitectura barroca 205 570 3
Urbanismo barroco 80 851 1
Arquitectura romana 24 510 1
Arte 397 157 17
Arqueología 155 180 8
Fuentes 171 559 1
Historia 174 848 2
Civilización islámica 8614 2
Escultura 76 665 1
Heráldica 29 721 1
Blasón 29 721 1
Pintura 173 500 2
Técnico 103 932 1
Tipo de texto
Elementos gramaticales Documentos
Boletín 176 628 10
Divulgativo-Revista 180 623 10
Documentos de archivos 103 932 1
Tratados y ensayos 1 183 629 12
Técnico-Arquitectura 281 232 3
Técnico-Escultura 76 665 1
Años
Elementos gramaticales Documentos
1501-1600 315 226 4
1601-1700 112 318 1
1701-1800 559 630 5
1801-1900 230 647 3
1901-2000 784 888 24

Digitalización

El trabajo de digitalización y conversión en texto de las fuentes se ha dividido en tres fases: (1) conversión de la obra en PDF a Word mediante los programas ABBY FineReader, Google Docs y Adobe Acrobat; (2) revisión en la edición de Word; (3) unificación de los criterios compartidos por el equipo de trabajo: eliminación de pies de página, encabezamientos y numeración; eliminación de imágenes y tablas; posicionamiento de las notas al final del texto; corrección ortotipográfica.

Creación de metadatos

Se ha creado un archivo Excel con la información completa de cada fuente, así como con los metadatos del corpus, denominado Datos-Fuentes-AA-Filtros, gracias a los cuales se puede generar un nombre icónico para denominar el archivo de cada texto que contiene los apellidos del autor sin espacios, barra baja, título abreviado como está en el archivo, barra baja, y fecha de publicación.

El archivo está estructurado con información útil para crear una bibliografía del corpus o para poder saber más sobre el proceso del trabajo. Estos son la denominación y el contenido de cada una de las columnas de la hoja de Excel: Autor; Título libro/Título revista o miscelánea; Autor artículo; Artículo en revista o miscelánea; Vol./Tom. Núm. Libro/Revista; De pág.; A pág.; Fecha publicación; Siglo edición; Editorial; Lugar de publicación; Tipo de texto asignado; Materia de la ficha bibliográfica; Materia.

Los datos incluidos en Tipo de texto asignado han sido atribuidos por el equipo de trabajo (biografías, boletines, textos divulgativos, revistas, documentos de archivos, manuales, misceláneas, textos técnicos de arquitectura y escultura, tratados y ensayos). Para ofrecer una referencia objetiva respecto a la materia abordada en cada una de las obras, se ha incluido una columna Materia de la ficha bibliográfica, con la asignación que se encuentra en la ficha bibliográfica de cada obra.