La información de fuentes abiertas es toda aquella cuyo acceso es lícito y de dominio público, esto supone que se puede acceder fácilmente y a bajo coste a un gran volumen de información.
Sin embargo, las fuentes abiertas tienen un gran inconveniente, al incluir tanta información ésta es difícil de procesar por los medios tradicionales, siendo extremadamente fácil que un analista se vea sobrepasado por datos entre los que no se puede discriminar adecuadamente para realizar un análisis apropiado. Para lograr discriminar información de calidad, en el océano de las redes, se pueden implementar una serie de técnicas para optimizar la extracción de información.
Antes de empezar a buscar en Internet todo lo relacionado con el tema que nos interese es importante distinguir exactamente qué se quiere saber del ítem de la investigación. Para ello, es recomendable emplear la lista de preguntas de Alex Osborn, una técnica clásica de pensamiento creativo para limitar el enfoque de un problema. Una vez identificados los ítems que nos interesan, se desarrolla una estrategia de búsqueda capaz de responder a las cuestiones que nos hemos planteado. La estrategia debe seguir una ruta de información que coordine las características de la investigación, previendo el equipo que será necesario y el presupuesto del que se dispone, estableciendo un cronograma, dividiendo tareas y asignando un calendario de entregas y reuniones de monitorización del proceso que faciliten redirigir la búsqueda, en caso que sea necesario, y cumplir con los plazos acordados.
Aunque formaría parte de la creación de la estrategia de búsqueda, le dedico un apartado propio a la elección de herramientas debido a la crucial importancia que tiene en la obtención de información. Dependiendo del tipo de análisis y de la información que queremos obtener se escogerán unas herramientas u otras:
Para lograr que un análisis en OSINT sea operativo es vital que se realice una buena integración, para ello es importante realizar la categorización de la información a medida que esta se va recopilando.
Las categorías entre las que se dividiría lo que se obtenga dependerían del análisis que nos interese, a pesar de que algunas son siempre útiles como categorizar en función del formato (artículo, publicación científica, etc.) o en función del tipo de fuente (revista digital, autor, etc.). Para facilitar este manejo de la información existen herramientas como ZOTERO, indispensable si vamos a gestionar un gran volumen de inputs.
Una categorización efectiva logra que la información sea accesible y se integre de forma operativa más fácilmente, aunque como en fuentes abiertas la información suele ser muy amplia y variada es difícil analizarla, por muy bien integrada que esté, si no se cuenta con herramientas gráficas.
Algunas herramientas tienen representaciones gráficas automáticas pero la mayoría requerirán que se use una aplicación externa. De nuevo, la herramienta de representación gráfica dependerá del análisis que hagamos, si es de un texto podría usarse Tagcrowd, XMind para mapas conceptuales, cuando se trata de representaciones complejas es mejor usar SmartDraw o Anacapa AMIS y Mymapp si se necesita representar información de manera geográfica.
Existen muchas maneras de proteger nuestras búsquedas de las amenazas en un entorno ciber, lo más recomendable es el uso de un Proxy y una VPN. El proxy y la VPN mantendrán nuestra identidad en secreto mientras navegamos, haciendo de intermediario ante servidores y creando una extensión controlada, respectivamente.
También es importante usar un cifrador como GPG o PGP para mantener seguras las comunicaciones entre miembros del equipo de analistas. Si se quiere maximizar la seguridad se puede emplear el navegador TOR o el buscador Duck Duck Go. No obstante, estas herramientas son muy lentas, por lo que sólo serían recomendables cuando se busca en la Deep Web o si la seguridad es una prioridad principal.
Asimismo, es recomendable usar herramientas que reduzcan la posibilidad de infectarnos con un virus al descargar documentos o al navegar en una URL desconocida, VirusTotal sería una herramienta muy útil a la hora de cumplir esta función.
Por José Manuel Pérez-Íñigo, Departamento de Inteligencia en Winterman