Datos sintéticos: un apoyo para innovar sin comprometer la privacidad
16 de noviembre de 2025En un contexto donde la Inteligencia Artificial (IA) avanza a pasos agigantados, la necesidad de grandes volúmenes de datos para entrenar modelos se enfrenta a crecientes restricciones legales y éticas. Ante este dilema, los datos sintéticos emergen como una solución innovadora que permite desarrollar tecnología sin poner en riesgo la privacidad.
Los datos sintéticos son conjuntos de información generados artificialmente que imitan las características estadísticas de los datos reales. Su uso está ganando terreno en sectores como la salud, la movilidad o la formulación de políticas públicas, donde el acceso a datos sensibles está fuertemente regulado.
La generación de estos datos se apoya en técnicas avanzadas como las Redes Generativas Adversarias (GAN) o los Autoencoders Variacionales (VAE), capaces de crear registros artificiales que conservan la utilidad de los datos reales sin revelar información personal. Sin embargo, los expertos advierten que “sintético” no siempre significa “anónimo”, por lo que es clave aplicar tecnologías como la privacidad diferencial y realizar evaluaciones de riesgo.
Los datos abiertos juegan un papel crucial en este ecosistema. No solo sirven como base para entrenar modelos sintéticos, sino también como referencia para validar su calidad. Iniciativas como Synthea, que genera historias clínicas ficticias, o proyectos del Gobierno de Gales y el Departamento de Salud de Australia Occidental, demuestran cómo esta combinación puede acelerar la innovación de forma segura.
La evaluación de los datos sintéticos se basa en tres pilares: fidelidad (similitud con los datos reales), utilidad (rendimiento en tareas de IA) y privacidad (protección frente a reidentificación). El equilibrio entre estos factores es clave para su adopción responsable.

Fuente: datos.gob.es
Los datos sintéticos no sustituyen a los datos abiertos, sino que los complementan. Representan una oportunidad estratégica para que administraciones públicas y empresas impulsen la innovación tecnológica sin comprometer la confianza ciudadana.
Más información: https://administracionelectronica.gob.es/pae_Home/pae_Actualidad/pae_Noticias/2025/Octubre/noticia-2025-10-30-Datos-abiertos-sinteticos-.html
