sábado, 9 de octubre de 2010

Datos anónimos o útiles, pero no las dos cosas

El título de este post está tomado de un trabajo publicado por el Prof. Paul Ohm, de la Universidad de Colorado, y titulado Broken promises of privacy: responding to the surprising failure of anonymization y que podría ser uno de los primeros de una nueva rama de las ciencias de la computación: la re-identificación a través de las TIC. En él se plantea que, mediante la utilización de datos disponibles públicamente, bases de datos que se han tratado de manera concienzuda y de acuerdo con los métodos comúnmente aceptados de anonimización, pueden transformarse, en algunos casos sin mucho esfuerzo, en datos personales y, por tanto, atribuibles a la persona real cuya identidad se había supuestamente protegido.


En el mismo se describe la experiencia de Latanya Sweeney, una estudiante de ciencias de la computación que utilizando una base de datos anonimizada  -publicada por un organismo oficial del Estado de Massachusetts- y utilizando información públicamente disponible en Estados Unidos, consiguió sin demasiado esfuerzo re-identificar los datos de la historia clínica del gobernador del Estado y se los remitió a su oficina. Posteriormente, demostró que el 87% de los americanos podría ser identificado conociendo únicamente tres datos: código postal, fecha de nacimiento y sexo.


Aunque quizás en España la información públicamente disponible no es tan abundante como en Estados Unidos, en la actual Sociedad de la Información cada vez hay más datos en Internet que pueden contribuir a una re-identificación de datos supuestamente anónimos sin demasiado esfuerzo y, sobre todo, si existen los alicientes necesarios.


Este es un tema realmente importante pues desde el momento en que alguien asegura que ha convertido los datos personales en anónimos -o disociados en la terminología de la LOPD- parece que todos nos quedamos tranquilos y contentos y, sobre todo, dejan de aplicarse las garantías que establece la legislación de protección de datos. Pero estudios como el que menciono aquí pueden hacer que nos tengamos que replantear esta situación. 


Lo difícil será explicárselo a los juristas...

2 comentarios:

  1. Muy interesante su articulo. Tienen datos sobre el manejo y la privacidad de biobancos que contienen muestras de ADN y datos clínicos? www.persogen.net

    ResponderEliminar
  2. Los datos de los biobancos o cualquier base de datos conteniendo datos clínicos gozan de una protección especial en la legislación europea y española y su tratamiento está limitado y restringido.
    Además, en España, por aplicación del Reglamento de Desarrollo de la Ley de Protección de Datos, se encuadran en el nivel de máxima protección (Nivel Alto) para la aplicación de las medidas de seguridad establecidas por el mismo.
    Puede consultar estas normas en la web de la Agencia Española de Protección de Datos (www.agpd.es) o de la Agencia de Protección de Datos de Madrid (www.apdcm.es)
    Además, también puede interesarle este artículo
    http://www.sciencemag.org/content/331/6018/728.abstract

    ResponderEliminar