-
Botánica y Literatura en la antigua Mesopotamia-Fuentes Primarias
Los datos utilizados y generados durante la ejecución del proyecto PID2021125678NB-I00 son de doble naturaleza, ambos relacionados con la disciplina del estudio de las lenguas y culturas del Próximo Oriente antiguo. Se trata por un lado de tablillas...
Instituto: Instituto de Lenguas y Culturas del Mediterráneo y Oriente Próximo (ILC), CSIC
-
Corpus para la identificación de palabras complejas en textos médicos en espa...
[Descripción de los métodos utilizados para la recopilación/generación de datos] Las estadísticas y los métodos del corpus se explican en el siguiente artículo: Federico Ortega-Riba, Leonardo Campillos-Llanos, Doaa Samy (2025) «Lexical Simplification...
Instituto: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
CLARA-MeD corpus
A collection of 24.298 pairs of professional and simplified texts (>96 million tokens): 1) Drug leaflets and summaries of product characteristics (10 211 pairs of texts, >82M words); 2) Cancer-related information summaries (201 pairs of texts,...
Instituto: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
