ANONIMIZACIÓN DE DATOS

La ley define «dato personal» como aquella información, en formato texto, de imagen o de audio, que permita la identificación de un individuo. Y según la propia normativa europea, no se consideran como datos personales aquellos que no permiten la identificación de una persona.

Cuando los datos son anónimos, -no guardan relación con una persona física identificada o identificable- (Considerando 26 del RGPD) y se preserva su identidad minimizando la capacidad de rastreo que puede conducir a su uso indebido.

navigate-data-privacy-regulation

Es decir, los datos anónimos no son afectados por el RGPD, inclusive con fines estadísticos y de investigación. Los datos que han pasado por procesos de “anonimización”, por lo tanto, no están sujetos a las mismas obligaciones legales que el resto, sino que se rigen por el Reglamento de libre circulación de datos no personales.

 

Ejemplo de fragmento de expediente donde aparecen identificadores directos e indirectos.

Los datos anónimos son de vital importancia en contextos muy diversos como en investigación médica, estadística, legal, propiedad intelectual, ensayos clínicos, recursos humanos, tarjetas de pago, comunicaciones electrónicas, entre otros.

 

La “anonimización” de datos se refiere al proceso de proteger los datos identificables para preservar la privacidad del individuo mientras los datos siguen siendo útiles para el análisis. Es decir, altera los datos de modo que la persona no sea identificable ni directa ni indirectamente y de forma irreversible.

La “anonimización” de datos es un proceso que trata de encontrar el equilibrio adecuado entre la reducción del riesgo de reidentificación y el mantenimiento de la utilidad de un conjunto de datos para los fines previstos.

La clave está en saber que la “anonimización” es un proceso que imposibilita la reidentificación del individuo titular, por lo que no se consideran datos personales y no estarán sujetos a los requerimientos del RGPD.

Con la creciente preocupación por la privacidad y el mal uso de los datos, las prácticas adecuadas de “anonimización” de datos fomentan la confianza, la transparencia y la credibilidad ante los ojos de los clientes y puede brindar a las empresas una ventaja competitiva, especialmente a medida que los consumidores y las empresas se vuelven más exigentes sobre cómo se utilizan sus datos.

Dependiendo de la configuración elegida para la “anonimización”, pueden alterarse diferentes tipos de datos (desde nombres, a localizaciones, profesiones, fechas…). En este sentido, se conjuga la necesidad de “anonimización” con la capacidad de las organizaciones de retener los atributos valiosos de los datos que almacenan.

Existen diferentes técnicas en general de “anonimización” de datos:

  1. La ofuscación: reemplazan los datos originales con una línea negra continua.
  2. Las etiquetas de identificación: reemplazan los datos originales con una etiqueta de datos genérica (NAME1, ORG1, NAME2, ADDRESS1).
  3. La sustitución: consiste en reemplazar los datos originales con un identificador temporal. (p. ej. STEVEN, 123 ST. PAUL ST.)
  4. Los espacios: reemplazan los datos originales con espacios en blanco o asteriscos.

 

Estos procesos de “anonimización” de datos están diseñados para minimizar la capacidad de rastreo de datos o rastros electrónicos que puede conducir al uso indebido de datos o revelar detalles personales.

Ejemplo práctico y habitual de enmascaramiento con ofuscamiento (1):

  • Texto original 1: El Doctor Stephen Macwire atendió al paciente John Langkpof en el Hospital.
  • Texto anonimizado 1: El Doctor Stephen Macwir atendió al paciente John Langkpof en el Hospital.

Ejemplo práctico y habitual de enmascaramiento con etiquetas (2):

  • Texto original 2: La sentencia del TS de 6 de Julio de 2023 condenó a Patty Tremain a una multa de 3.000 €uros.
  • Texto anonimizado 2: La sentencia del TS de DATE2 condenó a NAME2 a una multa de QUANTITY1 €uros.

El hecho de que hay multitud de áreas y sectores que dependen de almacenar y transferir datos implica que deben contar con medidas de seguridad de forma proactiva, incluyendo la capacidad de aplicar la “anonimización” a la información de que disponen. Solo de este modo garantizan el cumplimiento de la ley a la par que pueden hacer uso de la inteligencia proporcionada por el análisis de datos.

Algunos de los principales sectores que aplican ya la “anonimización” incluyen:

  • Sector bancario: con información especialmente sensible de datos personales de sus clientes.
  • Sector sanitario: Clínicas y hospitales, instituciones de investigación cuentan con datos muy sensibles en sus expedientes y ensayos clínicos, que a su vez son transferidos a terceras partes.
  • Documentos legales: abogados, sentencias, juicios, jueces, trabajan con documentos y expedientes confidenciales con datos personales.
  • La administración pública: sector especialmente obligado a transparencia de datos de los ciudadanos.

La “anonimización” da respuesta a la seguridad en las transacciones de datos dentro o fuera de sus redes.


Solución de enmascaramiento

STD utiliza la herramienta Masker como servicio de “anonimización” accionada a través de inteligencia artificial que permite la transferencia y almacenamiento de datos deidentificados de forma segura. (Deidentificación es un tipo de “anonimización” para ocultar datos sensibles o personales). Masker incluye técnicas de supervisión humana del resultado de los modelos para mejorar la “anonimización”.

Con este sistema, las empresas disponen de un servicio que les asegura de cumplir con las regulaciones de privacidad, además de almacenar datos que no pueden ser identificados y compartir información que no puede ser rastreada, todo ello con los más altos estándares de seguridad.

A través de la inteligencia artificial, Masker es capaz de identificar datos personales (personally identifiable information o PII) y reemplazar la información más sensible utilizando diferentes técnicas de “anonimización”. A su vez, se puede ajustar a sus necesidades. Esto incluye el nivel de sensibilidad respecto a los datos personales o las técnicas específicas que se llevarán a cabo para anonimizarlos.

A la hora de evaluar un modelo de “anonimización” se suele utilizar la puntuación F1 como métrica, que es una medida de la precisión y la recuperación del sistema. En general, una puntuación F1 de 0,8 o superior indica que el sistema identifica y anonimiza con precisión la información sensible al tiempo que minimiza los falsos positivos. La siguiente tabla muestra las puntuaciones F1 para algunos de los idiomas compatibles.

ModeloF1
Inglés0,9
Francés0,83
Alemán0,84
Italiano0,87
Japonés0,84
Portugues0,9
Portuguese (Brasil)0.94
Español0,91
Multilingüe0,83

Entre los beneficios de Masker destacan:

  1. La posibilidad de elegir entre “anonimización” permanente o reversible. Las empresas pueden eliminar los datos personales de forma irreversible o decidir volver a personalizarlos. Si bien a menudo el contenido anonimizado no permite su recuperación, Masker puede ser configurado para generar un documento índice que contenga la información necesaria para que el software reconstruya el texto.
  1. Elegir el grado de “anonimización”, de modo que el usuario puede elegir la agresividad del proceso. Esto incluye un espectro de posibilidades que va desde eliminar identificadores directos (por ejemplo, nombres) a toda información secundaria (por ejemplo, relaciones familiares o la descripción del puesto de trabajo).
  1. Disponible para la mayoría de formatos de datos, incluyendo los estructurados y los no estructurados. Esto va desde documentos de texto, a emails, redes sociales o aplicaciones de negocios, como los documentos MS Office…).
  1. Es una plataforma multilingüe que usa modelos de “anonimización” específicos para cada idioma o multilingües y está integrada con una herramienta de traducción automática o machine translation.
  1. Capacidad de entrenar, configurar y clonar el motor de inteligencia artificial en torno a idiomas, vocabulario o términos específicos.
  1. Despliegue flexible, utilizando un servicio seguro basado en la nube, una API de servicios agnósticos y pudiendo realizarlo en las propias instalaciones (on-premises).

En definitiva, permite mejorar la eficiencia en los procesos de comunicación entre organizaciones, proteger los datos de los clientes, automatizar procesos y gestionar los riesgos derivados de las bases de datos.

Este software Masker ha complementado en el ámbito de la seguridad de datos nuestra experiencia de más de 30 años en procesos documentales que forma parte del proyecto MAPA de la Comisión Europea, que busca crear una plataforma multilingüe de “anonimización” para beneficio de organizaciones financieras, sanitarias e instituciones públicas en general.

Más información sobre “anonimización”

  • 10 malentendidos sobre anonimización de datos. AEPD

https://www.aepd.es/sites/default/files/2021-04/10-malentendidos-anonimizacion.pdf

  • Guía básica de anonimización. AEPD

https://www.aepd.es/documento/guia-basica-anonimizacion.pdf

  • Ley Orgánica 3/2018 de Protección de Datos y garantía de los derechos digitales.

https://www.boe.es/buscar/doc.php?id=BOE-A-2018-16673

Presupuesto gratuito

Madrid

Valencia

    He leído y acepto la política de privacidad