El enmascaramiento de datos es una estrategia utilizada para proteger los datos sensibles de un conjunto de datos mediante la transformación de éstos en otros que mantengan la coherencia y la consistencia del conjunto original. Un buen data masking, no solo tiene que mantener una coherencia de datos y las relaciones entre tablas sino que además tiene que tener la misma distribución estadística que la fuente original.
También conocido como “anonimización”, “ofuscación” o “tokenización” de datos busca generar conjuntos de datos realistas y anónimos basados en datos reales de producción, que puedan ser utilizados para fines alternativos como análisis, generación de pruebas, capacitación o formación, sin comprometer la seguridad de los datos reales. Por ello, para mantener los datos reales seguros, el proceso de enmascaramiento de datos es irreversible, el usuario no podrá, desde los datos enmascarados, obtener los datos reales.
A lo largo del tiempo y gracias a la tecnología, se han creado dos estrategias para realizar este proceso, el data masking estático (SDM) y el data masking dinámico (DDM).
Data masking estático (SDM)
Es utilizado para la transformación permanente del dato. Desde un almacén de datos, se selecciona todos los datos sensibles que queremos transformar y realizamos el proceso.
La fuente de datos resultante es la misma, reemplazando el dato original por el dato transformado. Al provocar la pérdida del dato anterior, es un sistema no aplicable a bases de datos de producción ya que altera permanentemente los datos.
Por otro lado, se trata de un sistema seguro ya que al no albergar datos sensibles, si un atacante obtiene la base de datos, no tendrán acceso a los datos confidenciales.
A nivel de ejecución, en este tipo de enmascaramiento, las transformaciones se realizan por adelantado para evitar que afecte al rendimiento de las transacciones.
Por último, este tipo de estrategia simplifica enormemente las tareas de seguridad, ya que gracias a la sustitución permanente de los datos, no se requiere de crear un plan de seguridad muy detallado a nivel de objeto, ya que los datos más sensibles han quedado reemplazados.
Data masking dinámico (DDM)
El data masking dinámico es utilizado para la transformación de datos sensibles sin alterar la fuente de datos original. Esto permite una trazabilidad del dato y sobre todo, que puedan utilizarse distintas reglas de transformación utilizando una misma fuente de dato original.
Esta estrategia puede funcionar en tiempo real pero no resulta muy adecuada en entornos muy dinámicos con un alto uso de lectura o escritura dado que los nuevos datos enmascarados pueden reescribirse y corromper la base de datos. Para ello es necesario implementar nuevas estrategias de enmascaramiento que eviten la corrupción de los nuevos datos.
Comparación entre ambas estrategias: