La Marina de Estados Unidos está buscando crear un archivo que almacene no menos de 350 mil millones de publicaciones en redes sociales, como parte de los «esfuerzos de investigación» de la rama militar en «modos de expresión colectiva».
El Departamento de la Marina ha publicado una solicitud solicitando a los contratistas que presenten ofertas para un proyecto que amasará los 350 mil millones de publicaciones sociales que van desde 2014 hasta 2016. Los datos se tomarán de una única plataforma de redes sociales, pero la solicitud no especifica cúal.
«Buscamos adquirir un archivo histórico global a gran escala de datos de redes sociales, proporcionando el texto completo de todas las publicaciones públicas de redes sociales, en todos los países e idiomas cubiertos por la plataforma de redes sociales», se lee en la sinopsis del contrato. La Marina dijo que el archivo se usaría en los «esfuerzos de investigación en curso» en «la evolución de las comunidades lingüísticas» y en los «modos emergentes de expresión colectiva, a lo largo del tiempo y en todos los países».
El archivo se basará en publicaciones de medios sociales disponibles públicamente y se incluirá en la base de datos «no comunicaciones privadas ni datos privados del usuario». Sin embargo, todos los registros deben incluir la fecha y la hora a la que se envió cada mensaje y el usuario público se asoció con el mensaje. Además, cada registro en el archivo debe incluir todos los metadatos disponibles públicamente, incluidos el país, el idioma, los hashtags, la ubicación, el identificador, la marca de tiempo y las URL, que se asociaron con la publicación original.
Los datos deben recopilarse de al menos 200 millones de usuarios únicos en al menos 100 países, sin que un solo país represente más del 30 por ciento de los usuarios, dice el anuncio.
Si bien las intenciones declaradas del proyecto pueden sonar benignas, el gobierno de los EE. UU. Ha expresado previamente su interés en recopilar datos de las redes sociales con el fin de aumentar la atención. El año pasado, el Departamento de Seguridad Nacional de EE. UU. Emitió un aviso solicitando a los contratistas que ofertaran en una base de datos que rastreaba 290,000 fuentes de noticias mundiales en más de 100 idiomas. El contrato también mencionó la capacidad de mantenerse al tanto de los «influyentes», lo que llevó a algunos informes a especular que la base de datos propuesta podría usarse para monitorear a los periodistas.