Anonimización y Big Data: principales desafíos

https://stdd.es/Los avances tecnológicos y el aumento de la conectividad han propiciado que exista una gran cantidad de información que debe ser procesada de manera rápida y eficaz para que sea útil. Esto es lo que se conoce como Big Data. Grandes compañías como Amazon o Facebook manejan un número ingente de datos como recurso para obtener beneficios.

La tecnología se ha volcado en encontrar soluciones para poder aprovechar al máximo las ventajas del Big Data. Además, ha jugado un papel clave en avances como el aprendizaje automático de las máquinas y la ciencia de datos. Como contrapartida también ha generado preocupación en torno a la protección de datos privados.

Es aquí donde entra en juego la anonimización de datos que resulta útil para preservar la privacidad, pero permitiendo el manejo de la información de manera segura. Cuando un dato es anonimizado ya no se considera privado ya que no es posible la identificación del individuo.

¿Por qué es necesario anonimizar datos personales? Uno de los usos principales de los datos anonimizados se encuentra en el desarrollo de estudios e investigaciones científicas. En ese ámbito la información resulta relevante para obtener avances en la ciencia y la medicina.

Retos de la anonimización frente al Big Data

El Big Data es un recurso realmente importante pero que planeta bastantes retos para la protección de datos personales. La privacidad necesita una especial protección frente a los avances tecnológicos basados en la información. Aunque la anonimización es uno de los métodos más útiles para proteger los datos privados, se debe enfrentar a los siguientes retos en los próximos años.

Gran volumen de datos

La anonimización requiere de un análisis de los datos para identificar cuáles tienen información personal y tratarlos. Este análisis se vuelve más complejo y costoso cuando exista un mayor volumen de información. El tamaño del Big Data cada vez es más grande y diverso lo que dificulta el trabajo de las herramientas anonimizadoras.

Además del tamaño también es importante señalar la velocidad en la que se gestionan los datos. Las aplicaciones de Big Data obtienen resultados en muy poco tiempo y la anonimización no puede ser un lastre a la hora de gestionar la información. Por eso será necesario desarrollar de un software cada vez más potente que puedan hacer frente a este tipo de cuestiones.

Problemas de reidentificación

Existe una gran cantidad de fuentes de las que proceden los datos. Esto puede provocar que la información se cruce y se pueda producir lo que se conoce como reidentificación. Ya no es suficiente con eliminar los considerados como datos directos. Con un código postal es posible reidentificar en la actualidad al 80 % de los habitantes de Estados Unidos, por ejemplo.

Por este motivo se requiere de un arduo trabajo para señalar los datos que potencialmente pueden distinguir a los individuos. Es una tarea bastante difícil debido a la gran diversidad de bases de datos que existen en la actualidad. Por ejemplo, Arvind Narayanan y Vitaly Shmatikov de la Universidad de Texas demostraron que se podía identificar personas según el historial de películas que tenían en Netflix.

La mayoría de los sistemas de anonimización están diseñados para tratar datos homogéneos. Cuando se cruzan datos de diversas procedencias es mucho más difícil proteger la información personal. Se deben conseguir herramientas que identifique qué datos son los que tienen más riesgo de ser usados para la reidentifación.

El Big Data seguirá teniendo un gran impacto en el tratamiento de datos y se ha convertido en uno de los campos de investigación más importante en los últimos años. Sin embargo, el desarrollo de esta tecnología también requiere que se desarrollen algoritmos que permitan la protección de los datos personales.

A pesar de todos estos retos, la anonimización es uno de los métodos más eficientes para proteger la privacidad.

En STD Gestión Documental contamos con un equipo de expertos en la aplicación de estas técnicas.

Contacta con nosotros para recibir más información sobre todo lo relacionado con la digitalización de la información.

¡Te esperamos!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y los términos de servicio de Google.