El MIT rastrea e identifica usuarios de la Dark Web gracias a algoritmos de machine learning
Debajo de la WWW que visitamos diariamente (de Twitter, de GMail, de Xataka, etc) permanece oculta una ‘red oscura’ o Dark Web, compuesta de sitios anónimos, protegidos por contraseña, y donde los criminales hacen negocios online (drogas, armas, trata de personas, etc) lejos de ojos indiscretos.
Las fuerzas del orden conocen la existencia de este submundo, pero para investigarlo (y, sobre todo, para tirar del hilo hasta el mundo real) han de hacer frente a varios retos.
«La naturaleza inconstante de los mercados de la Dark Web hace que resulte extremadamente difícil seguir a sus participantes y sus actividades», explica Charlie Dagli, un investigador en del Grupo de Tecnología y Sistemas de Inteligencia Artificial del Lincoln Laboratory del MIT.
Dagli hace referencia a la corta vida de dichos mercados por haber sido atacados, intervenidos por la policía, abandonados o cerrados intencionadamente como parte de una estafa para no cumplir con los pedidos realizados por sus usuarios. El ritmo de aparición de nuevos mercado es, claro, igual de alto.
Todo esto obstaculiza seguir la pista de los usuarios, pese a que muchas veces suelen ser los mismos, migrando de un mercado a otro. Lo normal es que cambien de nombre, pero a veces mantienen algún tipo de señalpara dejar claro a las personas adecuadas quiénes son y poder mantener su ‘red social’ intacta.
Algoritmos para seguir las miguitas de pan
Esas señales podrían ayudar a seguir a usuarios de un mercado de la Dark Web a otro, e incluso fuera de la misma. Y a eso se dedica el Lincoln Laboratory: a desarrollar nuevas herramientas, capaces de analizar información procedente tanto de la red abierta (redes sociales, sobre todo) como de la oscura y de analizar los patrones que revelan, con el objetivo a que les conduzcan hasta la verdadera identidad de los usuarios.
Claro está que la búsqueda de vínculos en la Dark Web no es algo que haya inventado el MIT, ni que haya tenido que esperar a la existencia de una IA desarrollada con ese fin: la policía hace tiempo que viene trabajando en ello, y logrando algunos éxitos sonados.
Pero el problema es que la cantidad de datos (no estructurados, además) a analizar para llevar a cabo esta labor de forma generalizada es demasiado grande como para detectar con rapidez dichas conexiones.
El Lincoln Laboratory ha tenido que recurrir a algoritmos de machine learning para calcular la similitud entre usuarios de los distintos foros en base a aspectos como su nombre (es posible que el usuario «sergeygork» del Mercado 1 tenga algo que ver con el «Gorkin Sergey» del Mercado 2), el modo en que escriben y con quién interactúan.
Así, el algoritmo analiza datos de cada mercado por separado, creando «perfiles de autor» para cada usuario. A continuación, contrapone perfiles de usuarios de distintos foros para detectar paralelismos, y asigna porcentajes calculando la probabilidad de que sean la misma persona. Según Dagli,
«Cada vez que se presenta una coincidencia, estamos en lo correcto en el 95% de los casos. Nuestro sistema es uno de los mejores sistemas de vinculación que se pueden encontrar».
Poner cara a estos usuarios de la Dark Web y hacernos una idea de las relaciones que se establecen entre ellos es todo lo que las autoridades necesitan para comprender mejor el funcionamiento de las cadenas de suministro de la ‘red oscura’, y la inteligencia artificial parece tener un papel fundamental en lograr eso.
FUENTE