Le renseignement anglais ouvre les sources de sa base de données orientée graphe

Et pourquoi pas ? 12
En bref
image dediée
Crédits : Alexei Tacu/iStock/ThinkStock
Sécurité
Vincent Hermann

Le GCHQ, la principale agence anglaise de renseignement, vient d’ouvrir le code de l’un de ses outils. Nommé Gaffer, il est disponible désormais sous licence Apache 2.0 dans un dépôt GitHub. Bien qu’il existe une évidente dimension de restauration d’une image largement écornée, ce choix pourrait témoigner d’une certaine volonté de transparence. Cependant, il faut distinguer l’outil lui-même des données qu’il peut contenir.

Le GCHQ (Government Communications Headquarters), est l’équivalent anglais de la NSA américaine. Les deux agences ont collaboré dans de très nombreuses opérations et représentent d’ailleurs les deux membres les plus éminents de l’alliance Five Eyes, réunissant également le Canada, l’Australie et la Nouvelle-Zélande. Tout comme la NSA, son nom est devenu synonyme d’espionnage et de toute-puissance des pouvoirs du renseignement dans le sillage des révélations d’Edward Snowden.

La mise en relations en grandes quantités

Il est donc probable que ce déficit flagrant d’image soit intervenu dans la décision de publier les sources de Gaffer, une base de données orientée graphe. L’outil, dont le nom argotique signifie « patron », est disponible depuis hier sous licence Apache 2.0 dans un dépôt GitHub, créé pour l’occasion par le renseignement anglais.

Écrit en Java, Gaffer est une infrastructure conçue pour stocker de grandes quantités de données afin de gérer de larges graphes. Les nœuds et arcs disposent de statistiques, comme les compteurs et les histogrammes, et l’ensemble est prévu pour puiser des informations dans les nœuds jugés d’intérêt. C’est en fait le cœur de Gaffer : rassembler des données et les comparer pour mettre en évidence des liens particuliers entre les éléments. Une activité centrale pour le monde du renseignement, comme les multiples analyses des structures de la NSA l’avaient montré.

Gaffer

Un outil du GCHQ basé sur un autre de la NSA

Les nœuds de la base de données peuvent bien sûr représenter n’importe quelle donnée qui intéresse le développeur. Dans le cadre du GCHQ, on peut imaginer qu’il s’agit d’une personne, l’outil présentant alors des relations entre eux, des lieux, etc. Il est également conçu pour faire apparaître des liens insoupçonnés ou pour suggérer l’existence d’autres nœuds qui n’auraient pas été référencés. Évidemment, ce principe global de fonctionnement peut être repris pour n’importe quel type d’information.

Il est intéressant de noter que Gaffer utilise le système de gestion de base de données NoSQL Accumulo, créé initialement par la NSA, mais dont les sources ont été ouvertes et confiées à la fondation Apache en 2011, d’où son nom complet Apache Accumulo. Il utilise le système de fichier Hadoop d’Apache et est lui-même basé sur la technologie BigTable de Google.

Faire d'une pierre deux coups

La question qui se pose est de savoir pourquoi le GCHQ a choisi de rendre accessible le code source de Gaffer. Le calendrier est intéressant puisque l’ouverture du dépôt GitHub survient à un moment où l’image de l’agence n’est clairement pas au beau fixe. On peut raisonnablement estimer que le renseignement anglais cherche à faire d’une pierre deux coups. D’une part, redorer son blason en dévoilant le fonctionnement interne de l’un de ses principaux outils. D’autre part, faire éventuellement participer la communauté dans l’enrichissement de ce dernier.

Le GCHQ indique en effet sur la page du dépôt qu’il travaille déjà sur une version 2 de Gaffer, avec pour objectif de « créer une infrastructure plus générale offrant le meilleur de Gaffer » mais s’améliorant dans plusieurs domaines. Par exemple, en rendant les nœuds et arcs beaucoup plus souples, actuellement définis de manière trop précise. Gaffer ne propose pas non plus de schéma, ce qui confère selon le GCHQ sa flexibilité à l’outil, mais créer des limitations, notamment sur l’efficacité de la sérialisation.

Quoi qu’il en soit, les développeurs intéressés par cet outil pourront le récupérer depuis son dépôt GitHub.


chargement
Chargement des commentaires...