El hash como técnica de seudonimización de datos

En plena era de la digitalización, la privacidad y la protección de los datos sensibles de empresas y usuarios se han convertido en una prioridad. En este sentido, el hash se presenta como una pieza clave dentro de la tecnología blockchain y de la seguridad digital para las empresas, integrando funcionalidades en herramientas como la firma electrónica.

Hay que tener en cuenta que el hash o función criptográfica hash es un algoritmo matemático capaz de transformar cualquier bloque arbitrario de datos en una nueva serie de caracteres que guardan una longitud fija, siendo siempre el valor hash de salida de idéntica longitud, independientemente de los datos de entrada.

A diferencia de la anonimización, la seudonimización de datos se mantiene dentro del ámbito de aplicación del RGPD. Alude a la técnica de enmascaramiento en la que se emplea un pseudónimo o alias, en lugar del nombre de la persona, pudiéndose incluso revertir el proceso.

Garantía contra las brechas de seguridad

La seudonimización de datos es más vulnerable frente a los ciberataques, aunque se vuelve necesaria en el caso de disciplinas como la medicina, ya que a través de un código o número asociado sería posible acceder a la ficha correspondiente de cada paciente.

Las funciones hash como técnica de seudonimización de datos permiten verificar la integridad de los mensajes y autenticar la información. De este modo, dificulta la detección del contenido de un mensaje o la información sobre destinatarios y remitentes.

Se caracterizan por estar libres de colisiones, por lo que no se deben asignar dos hashes de entrada al mismo hash de salida. Se pueden ocultar y deben ser amigables con los rompecabezas que puedan llegar a surgir. Sin ir más lejos, las funciones hash criptográficas se suelen emplear en las criptomonedas para transferir información de transacciones de manera anónima (por ejemplo, la criptomoneda Bitcoin utiliza la función SHA-256 en su algoritmo).

Verificación de contraseñas

Una de las aplicaciones de los hash como técnica de seudonimización de datos más comunes. Al guardar los datos de un usuario, se aplica un hash y el resultado se compara con la lista de valores guardados en los servidores de la empresa.

Si se trata de un buen hash, debería dificultarse la reconstrucción de la clave original y no ser reversible. De igual modo, se produce el efecto de difusión o avalancha, de tal modo que un cambio en un solo bit tendría que suponer la modificación a la mitad de los bits del hash, es decir, la salida del texto cifrado deberá cambiar.

También es importante el determinismo para generar el mismo valor hash o texto cifrado, así como la resistencia a colisiones, ya que es difícil encontrar dos claves distintas que tengan el mismo texto cifrado como hash. A esto se le suma ser impredecible, es decir, que el valor no sea predecible a partir de la contraseña.

Comprobar la integridad de los archivos

El hash como técnica de seudonimización de datos permite asegurarse de que los mensajes y archivos transmitidos del remitente al receptor no se manipulen, generándose una cadena de confianza.

Hashing y ciberseguridad

Si los hackers han adquirido los hash de las contraseñas, éstos los ejecutarán en palabras y números comunes para descifrar claves que los usuarios han guardado previamente. Gracias al ‘salting’ es posible agregar datos aleatorios a contraseñas antes de aplicar el hash. De este modo, se logra dificultar que los hackers empleen técnicas de cálculo previo y descifrado de contraseñas.

Verificación de firmas electrónicas

El hash como técnica de seudonimización de datos se puede aplicar como un proceso matemático que vela por la autenticidad de un documento o mensaje digital. En ese momento, el documento se crea empleando una clave privada que actúa como cifrado, creando datos que coinciden con el hash y encriptando plenamente la información.

El hash como sistema de seudonimización de la información personal

En el cálculo del hash hay que tener en cuenta la selección de un algoritmo concreto y su aplicación en un código o circuito específico. El tipo de sistema sobre el que se implementa el tratamiento (local, en remoto, transaccional, en la nube, etc.), el espacio de mensajes del tratamiento y el proceso del mensaje antes de ejecutar el hash también serán aspectos importantes.

También hay que tener en cuenta la vinculación de hash con otra información del entorno del tratamiento. Aquí se alude a informaciones directamente vinculadas a los registros en los que se incluye el hash (tanto identificadores como seudoidentificadores), así como informaciones indirectamente vinculadas (como la correlación que se establece entre registros anteriores y posteriores).

Con respecto a las contraseñas y elementos aleatorios introducidos, habrá que tener en cuenta los mecanismos de generación, almacenamiento, distribución y eliminación, así como el tamaño y entropía de éstos, a la par que su intervención en el preproceso del mensaje.

Si la función hash ha sido implementada teniendo en cuenta diferentes factores listados y el responsable del tratamiento borra los dato aleatorios introducidos, entonces se anonimizarán y se perderá la capacidad de validar el hash.