El Corpus Azcárate de terminología artística (CARTE) se ha creado para el análisis de la terminología artística del español. Los textos de que consta han sido seleccionados de las fuentes usadas para crear el Archivo Azcárate de terminología artística (AZCARTE). Se han escogido los textos más significativos y citados, se han digitalizado en su integridad y se han revisado meticulosamente.
En su versión actual el corpus consta de 37 documentos que incluyen 1.698.628 palabras ortográficas, accesibles todas ellas para su búsqueda. El análisis morfosintáctico automático de las transcripciones ha identificado 2.002.709 elementos gramaticales. En las siguientes tablas se muestra la distribución de palabras ortográficas y elementos gramaticales por materia, ficha bibliográfica, tipo de texto y fecha de publicación.
Materia | ||
---|---|---|
Palabras ortográficas | Documentos | |
Arquitectura | 921 463 | 10 |
Carpintería | 48 137 | 1 |
Ebanistería | 48 137 | 1 |
Composición | 126 359 | 1 |
Geometría | 214 909 | 1 |
Arquitectura barroca | 164 630 | 3 |
Urbanismo barroco | 66 006 | 1 |
Arquitectura romana | 21 114 | 1 |
Arte | 345 953 | 17 |
Arqueología | 137 325 | 8 |
Fuentes | 147 085 | 1 |
Historia | 149 986 | 2 |
Civilización islámica | 7403 | 2 |
Escultura | 66 237 | 1 |
Heráldica | 25 622 | 1 |
Blasón | 25 622 | 1 |
Pintura | 146 206 | 2 |
Técnico | 85 478 | 1 |
Tipo de texto | ||
---|---|---|
Palabras ortográficas | Documentos | |
Boletín | 156 057 | 10 |
Divulgativo-Revista | 151 070 | 10 |
Documentos de archivos | 85 478 | 1 |
Tratados y ensayos | 995 403 | 12 |
Técnico-Arquitectura | 244 383 | 3 |
Técnico-Escultura | 66 237 | 1 |
Años | ||
---|---|---|
Palabras ortográficas | Documentos | |
1501-1600 | 271 963 | 4 |
1601-1700 | 93 263 | 1 |
1701-1800 | 477 341 | 5 |
1801-1900 | 200 118 | 3 |
1901-2000 | 655 943 | 24 |
Materia | ||
---|---|---|
Elementos gramaticales | Documentos | |
Arquitectura | 1 086 972 | 10 |
Carpintería | 56 453 | 1 |
Ebanistería | 56 453 | 1 |
Composición | 144 473 | 1 |
Geometría | 249 690 | 1 |
Arquitectura barroca | 205 570 | 3 |
Urbanismo barroco | 80 851 | 1 |
Arquitectura romana | 24 510 | 1 |
Arte | 397 157 | 17 |
Arqueología | 155 180 | 8 |
Fuentes | 171 559 | 1 |
Historia | 174 848 | 2 |
Civilización islámica | 8614 | 2 |
Escultura | 76 665 | 1 |
Heráldica | 29 721 | 1 |
Blasón | 29 721 | 1 |
Pintura | 173 500 | 2 |
Técnico | 103 932 | 1 |
Tipo de texto | ||
---|---|---|
Elementos gramaticales | Documentos | |
Boletín | 176 628 | 10 |
Divulgativo-Revista | 180 623 | 10 |
Documentos de archivos | 103 932 | 1 |
Tratados y ensayos | 1 183 629 | 12 |
Técnico-Arquitectura | 281 232 | 3 |
Técnico-Escultura | 76 665 | 1 |
Años | ||
---|---|---|
Elementos gramaticales | Documentos | |
1501-1600 | 315 226 | 4 |
1601-1700 | 112 318 | 1 |
1701-1800 | 559 630 | 5 |
1801-1900 | 230 647 | 3 |
1901-2000 | 784 888 | 24 |
El trabajo de digitalización y conversión en texto de las fuentes se ha dividido en tres fases: (1) conversión de la obra en PDF a Word mediante los programas ABBY FineReader, Google Docs y Adobe Acrobat; (2) revisión en la edición de Word; (3) unificación de los criterios compartidos por el equipo de trabajo: eliminación de pies de página, encabezamientos y numeración; eliminación de imágenes y tablas; posicionamiento de las notas al final del texto; corrección ortotipográfica.
Se ha creado un archivo Excel con la información completa de cada fuente, así como con los metadatos del corpus, denominado Datos-Fuentes-AA-Filtros, gracias a los cuales se puede generar un nombre icónico para denominar el archivo de cada texto que contiene los apellidos del autor sin espacios, barra baja, título abreviado como está en el archivo, barra baja, y fecha de publicación.
El archivo está estructurado con información útil para crear una bibliografía del corpus o para poder saber más sobre el proceso del trabajo. Estos son la denominación y el contenido de cada una de las columnas de la hoja de Excel: Autor; Título libro/Título revista o miscelánea; Autor artículo; Artículo en revista o miscelánea; Vol./Tom. Núm. Libro/Revista; De pág.; A pág.; Fecha publicación; Siglo edición; Editorial; Lugar de publicación; Tipo de texto asignado; Materia de la ficha bibliográfica; Materia.
Los datos incluidos en Tipo de texto asignado han sido atribuidos por el equipo de trabajo (biografías, boletines, textos divulgativos, revistas, documentos de archivos, manuales, misceláneas, textos técnicos de arquitectura y escultura, tratados y ensayos). Para ofrecer una referencia objetiva respecto a la materia abordada en cada una de las obras, se ha incluido una columna Materia de la ficha bibliográfica, con la asignación que se encuentra en la ficha bibliográfica de cada obra.