Software Heritage nous détaille la convention entre Inria et l'UNESCO, une étape importante

Software Heritage nous détaille la convention entre Inria et l’UNESCO, une étape importante

Près de 60 000 projets disponibles

Avatar de l'auteur
Sébastien Gavois

Publié dans

Internet

07/04/2017 5 minutes
5

Software Heritage nous détaille la convention entre Inria et l'UNESCO, une étape importante

Software Heritage se définit comme une bibliothèque de code source. Elle propose aujourd'hui plus de trois milliards de fichiers, représentant près de 60 millions de projets. En recherche de reconnaissance, le projet a été distingué par l'UNESCO. Son directeur Roberto Di Cosmo revient avec nous sur ce partenariat.

L'été dernier, Inria présentait officiellement un vaste projet qui avait été lancé en 2015 par l'Institut national de recherche en informatique et en automatique (Inria) : Software Heritage. Son ambition est de « collecter, organiser, préserver, et rendre accessible à tous le code source de tous les logiciels disponibles ». Protéger notre patrimoine logiciel représente donc un travail titanesque.

Dès le lancement, plusieurs partenaires sont rapidement arrivés, Microsoft et le DANS de la Royal Academy des Pays-Bas. Aujourd'hui, ce projet passe un nouveau cap puisqu'Inria a signé une convention de partenariat avec l'UNESCO. Contacté par nos soins, Roberto Di Cosmo – directeur de ce projet – nous explique en quoi c'est une étape importante.

Sur trois piliers, il en manquait un 

Il nous explique que Software Heritage repose sur « trois piliers » fondamentaux : science et technologie qui est principalement fournie par Inria, des ressources (argents, temps ingénieur, stockage, etc.) amenées par des partenaires et enfin « la reconnaissance de l'importance de la mission ».

Si les deux premiers étaient déjà présents dès l'annonce officielle, le troisième manquait cruellement à l'appel. Après un « long long combat pour le faire reconnaitre », cette signature de partenariat avec l'UNESCO permet à Software Heritage de prendre de l'importance dans les « dimensions politiques et sociétales ». Roberto Di Cosmo ne cache d'ailleurs pas son enthousiasme et sa surprise : « on ne s'attendait pas à un truc pareil », lâche-t-il. 

Concrètement, ce partenariat avec l'UNESCO débouchera prochainement sur des interventions communes, une première de deux jours étant planifiée pour septembre. Le but sera d'expliquer pourquoi il est important de sauvegarder le code source des logiciels.

Software Heritage

De nouveaux partenaires, certains prestigieux

Dans tous les cas, Software Heritage n'a pas attendu que l'UNESCO se penche sur son cas pour avancer. Depuis l'annonce officielle du projet l'été dernier, il a été rejoint par Intel Corporation, qui a mis 100 000 euros sur la table, ainsi que par la Société Générale aussi avec 100 000 euros.

D'autres contributions plus modestes sont également de la partie avec le chinois Huawei (25 000 euros), l'Université de Bologne et Nokia Bell Labs. De deux, il est désormais question de sept partenaires. D'autres peuvent évidemment s'ajouter à la liste.

Si Inria et la Société Générale sont deux groupes français, ce n'est pas le cas des autres partenaires qui viennent du reste de l'Europe, d'Asie et des États-Unis. Cette ouverture est d'ailleurs une bonne chose pour Roberto Di Cosmo, qui nous explique qu'« il ne faut pas que ce soit perçu comme un projet franco-français », afin qu'il puisse se développer à l'international.

Au niveau du développement, Software Heritage a également des contributions extérieures. Certains viennent simplement donner un coup de main, d'autres s'investissent davantage. C'est notamment le cas de l'ADULLACT (Association des développeurs et utilisateurs de logiciels libres pour les administrations et les collectivités territoriales) qui a développé un plug-in complet pour ce projet.

Si l'aventure vous tente, vous trouverez tous les détails pour contacter l'équipe en charge du développement par ici. Bien évidemment, l'ensemble du code de Software Heritage est open source et disponible par là.

Plus de trois milliards de fichiers et près de 60 millions de projets

Aujourd'hui, Software Heritage revendique une base de données comprenant plus de 3,2 milliards de fichiers uniques représentants 58 254 852 projets. Concernant ce dernier chiffre, on peut remarquer qu'il a fait un bond de plus de 50 % entre 24 octobre et le 3 novembre 2016, alors que le nombre de commits et de codes sources n'a que peu changé.

Le directeur du projet nous explique que ce changement est intervenu lorsque « chaque fork était compté comme un projet de plus ». Le nombre de projets explose logiquement, mais comme chaque code source n'est sauvegardé qu'une seule fois – tout est dédupliqué –, le nombre de fichiers ne suit donc pas la même tendance. 

Software Heritage

Software Heritage « c'est aussi le futur »

Enfin, Roberto Di Cosmo nous indique que Software Heritage ne veut pas seulement être une sauvegarde du passé, mais aussi avoir les yeux tournés vers le futur. Pour lui, le but est de « savoir ce qui se passe dans le monde logiciel », d'où nous venons et où nous allons ; le tout dans un endroit unique.

Si Software Heritage propose notamment le code d'Apollo 11 (disponible sur GitHub depuis juillet 2016), tout le monde n'a pas une fusée Apollo sous la main pour le mettre en pratique lâche-t-il sur le ton de l'humour. Le directeur présente ce projet comme une grande bibliothèque : l'équipe ajoute des livres dans les rayons, au public maintenant de venir les lire.

Le partenariat avec l'UNESCO pourrait ainsi être perçu comme un premier signe d'ouverture vers le grand public. L'avenir nous le dira.

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Sur trois piliers, il en manquait un 

De nouveaux partenaires, certains prestigieux

Plus de trois milliards de fichiers et près de 60 millions de projets

Software Heritage « c'est aussi le futur »

Commentaires (5)


De toute façon dans pas mal de langage la majorité du code aujourd’hui sera inutilisable dans quelques années à cause de la compatibilité d’environnement, plusgins, ect… Et ce que je remarque aussi c’est que plus un projet est ouvert et plus c’est le boxon la dedans.


Le but principal n’est pas d’avoir du code utilisable, le but est d’avoir du code qui puisse être lu et exploré. Ensuite, si les moyens suivent, si, on pourra continuer à avoir du code qu’on peut exécuter, car justement l’idée est d’embarquer les dépendances, les versions d’environnement, etc …



 Quant au troll, il n’est pas très imaginatif.


Pour un projet franco-français, Roberto a un très joli accent italien ;) J’ai eu la chance de l’écouter à une conférence, il est très convaincant. Et il faut savoir que le “code” importe autant que les données : à quoi bon stocker des images jpeg si on n’a pas le code pour l’afficher ? Vous direz qu’il suffit d’avoir les spécifications de jpeg, ce qui est vrai ; mais dans ce cas les normes ou spécifications peuvent être compris comme du code de niveau supérieur, lequel intéresse aussi nos amis de Software Heritage…


Je voie pas trop en quoi c’est utile une bibliothèque de code non utilisable.



Par contre une bibliothèque de code ou ont pas chercher pas algo, la c’est top








DUNplus a écrit :



Je voie pas trop en quoi c’est utile une bibliothèque de code non utilisable.



Par contre une bibliothèque de code ou ont pas chercher pas algo, la c’est top





Elle est codé ta phrase <img data-src=" />&nbsp;



Après s’interroger sur l’intérêt de la chose c’est un peu comme s’interroger sur l’intérêt d’une bibliothèque publique.