-
Medical Lexicon for Spanish (MedLexSp)
MedLexSp es un léxico médico unificado para el procesamiento del lenguaje natural médico en español. Incluye 100.887 lemas, 302.543 formas flexivas (verbos conjugados y variantes de número/género) y 42.958 Unified Medical Language System (UMLS) Concept...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
CLARA-MeD simplified sentences
This dataset contains 1200 manually simplified sentences (144 019 tokens) from clinical trials in Spanish. A total of 1040 announcements from the European Clinical Trials Register (EudraCT) were analyzed to select sentences with ambiguities or...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
CLARA-MeD corpus
A collection of 24.298 pairs of professional and simplified texts (>96 million tokens): 1) Drug leaflets and summaries of product characteristics (10 211 pairs of texts, >82M words); 2) Cancer-related information summaries (201 pairs of texts,...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
CT-EBM-SP - Corpus of Clinical Trials for Evidence-Based-Medicine in Spanish
Colección de 1200 textos (292 173 tokens) sobre estudios de ensayos clínicos y anuncios de ensayos clínicos en español: - 500 resúmenes de revistas publicadas bajo licencia Creative Commons disponibles, por ejemplo, en PubMed o Scientific Electronic...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
SimpMedLexSp (Simple Medical Lexicon for Spanish)
A medical lexicon of 14013 pairs of technical word forms and the corresponding simplified synonym or definition. It is aimed at automatic text simplification in Spanish. A subset of the lexicon (4642 term entries) was also normalized to Unified Medical...
Organización: Instituto de Lengua, Literatura y Antropología (ILLA), CSIC
-
Qualitative and quantitative data from contexts of use for the analysis of si...
En este registro se incluyen dos documentos, un Excel (menciones_contextos_UT_THC_covid-19.xlsx) con el número de menciones y porcentajes de aparición de los términos objeto de estudio en el corpus y subcorpus de Ciencias Sociales, Ciencias y...
Organización: Centro de Ciencias Humanas y Sociales (CCHS), CSIC