-
Avances (2023) proyecto «Fastos, simulacros y saberes en la América Virreinal...
Los Dataset que se presentan son resultado de las sesiones que conformaron la reunión plenaria de mitad del proyecto «Fastos, simulacros y saberes en la América Virreinal» (PID2020-113841GB-I00) celebrada en 2023...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
Medical Lexicon for Spanish (MedLexSp)
MedLexSp es un léxico médico unificado para el procesamiento del lenguaje natural médico en español. Incluye 100.887 lemas, 302.543 formas flexivas (verbos conjugados y variantes de número/género) y 42.958 Unified Medical Language System (UMLS) Concept...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
CLARA-MeD simplified sentences
This dataset contains 1200 manually simplified sentences (144 019 tokens) from clinical trials in Spanish. A total of 1040 announcements from the European Clinical Trials Register (EudraCT) were analyzed to select sentences with ambiguities or...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
CLARA-MeD corpus
A collection of 24.298 pairs of professional and simplified texts (>96 million tokens): 1) Drug leaflets and summaries of product characteristics (10 211 pairs of texts, >82M words); 2) Cancer-related information summaries (201 pairs of texts,...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
CT-EBM-SP - Corpus of Clinical Trials for Evidence-Based-Medicine in Spanish
Colección de 1200 textos (292 173 tokens) sobre estudios de ensayos clínicos y anuncios de ensayos clínicos en español: - 500 resúmenes de revistas publicadas bajo licencia Creative Commons disponibles, por ejemplo, en PubMed o Scientific Electronic...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
SimpMedLexSp (Simple Medical Lexicon for Spanish)
A medical lexicon of 14013 pairs of technical word forms and the corresponding simplified synonym or definition. It is aimed at automatic text simplification in Spanish. A subset of the lexicon (4642 term entries) was also normalized to Unified Medical...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
Datos para la investigación de la iconografía del arco para la entrada del vi...
Data for the investigation (images and transcription of the epigrams of the arch for the entrance of the viceroy of Las Amarillas in Puebla (1755), from the canvas attributed to José Joaquín Magón.
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
Base de datos Nebrija-Valdés. DBME (Diccionario bibliográfico de la Lexicogra...
La obra Diccionario bibliográfico de la metalexicografía del español (dbme) reúne en sus páginas la mayor parte de la producción bibliográfica escrita sobre los diccionarios y enciclopedias del español. La cronología de sus referencias bibliográficas...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
Antropología regional reflejada en las joyas de la Sierra de Francia y Candel...
Conjunto de 2039 imágenes reunidas a lo largo de quince años y realizadas por el autor, Antonio Cea Gutiérrez, como apoyo a sus estudios etnográficos y antropológicos en la Sierra de Francia y Candelario. En sus viajes y estancias en los pueblos de...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC