Hive : analyse d’un « Drive » P2P chiffré de bout en bout, développé en partenariat avec Inria

Attention, arrêtes tranchantes
Internet 10 min
Hive : analyse d’un « Drive » P2P chiffré de bout en bout, développé en partenariat avec Inria
Crédits : D3Damon/iStock

La startup française Hive vient de s’associer avec Inria pour travailler plus intensément sur les technologies du P2P. L’occasion de plonger dans HiveDrive, son fonctionnement particulier et ses caractéristiques. David Gurlé, président et fondateur de l'entreprise, a également répondu à nos questions.

La société Hive a été fondée par David Gurlé, un nom que certaines personnes reconnaîtront. L’ingénieur français a notamment travaillé chez Microsoft, où il a dirigé les efforts de l’entreprise dans le domaine des communications en temps réel, sur des produits comme NetMeeting, Windows Messenger, Exchange IM, Exchange Conferencing Server, Live Communications Server, Office Communications Server et Skype. Il a également travaillé chez Reuters.

En 2012, il fonde sa propre entreprise, Perzo. Basée à Palo Alto (Californie), elle officie dans le domaine des messageries, mais avec une solution chiffrée de bout en bout, le client ayant ses propres clés. La société est rachetée par un consortium bancaire deux ans plus tard et renommée Symphony. David Gurlé en est alors le PDG. La valorisation de l’entreprise dépasse le milliard de dollars en 2020.

Hive est sa nouvelle création. La société, installée cette fois à Cannes, a levé 7 millions d’euros en mai dernier. En septembre, Hive lance la première version de son Drive, auquel manquent de nombreuses fonctions. Depuis, trois autres versions sont arrivées, à raison d’une par mois, avec à chaque fois des ajouts significatifs.

Penchons-nous de plus près sur ce service, premier représentant d’une entreprise qui envisage le cloud sous l’angle du pair-à-pair.

HiveDrive : d’abord la théorie

Le fonctionnement de ce Drive est particulier. Le service proposé est à la fois distribué et décentralisé. Pas de structure centrale de contrôle donc, les fichiers placés sur le Drive étant fractionnés et répartis chez les autres distributeurs.

Sur ce fonctionnement pair-à-pair vient se greffer un chiffrement de bout en bout, y compris pour les métadonnées. En plus du compte qu’il faut créer pour accéder au client, il faut choisir une clé de chiffrement que l’on sera seul à posséder et qu’il faut donc entreposer avec soin. HiveDrive prévient des avantage et inconvénient principaux de cette méthode : l’entreprise ne peut pas lire les données, mais ces dernières sont perdues si vous n’avez plus la clé.

Comme tout système P2P, l’efficacité générale dépend du nombre de personnes utilisant le service. Chaque fichier est fractionné en plusieurs dizaines de morceaux, qui voyagent vers les autres utilisateurs. À ces fichiers, Hive ajoute le même nombre, que l’on peut considérer de copies de sauvegardes, elles aussi envoyées aux autres utilisateurs. Si un fichier est ainsi divisé en 50 morceaux, 100 sont répartis chez les autres. Tant que Hive dispose de 50 fractions sur les 100, le fichier peut être reconstitué.

L’architecture se veut donc résiliente. Hive garantit également l’intégrité des données. Chaque fragment de fichier a sa propre signature, toute altération de cette dernière provoquant la suppression du fragment. Les nœuds eux-mêmes de l’infrastructure – les personnes ayant installé l’application – contrôlent ces fragments et les reconstituent s’ils détectent qu’il n’en reste pas assez pour une reconstitution.

Hive met également en avant la consommation moindre d’énergie qu’un tel système suppose. Contrairement aux infrastructures cloud classiques, les ordinateurs utilisés par ce Drive n’ont pas vocation à toujours rester allumés. Selon l’entreprise, le service doit se contenter des machines allumées et de l’espace mis à disposition par ses utilisateurs. Quand certaines sont éteintes, d’autres prennent le relai, grâce aux fragments supplémentaires de fichiers. HiveDrive est également capable de détecter les ordinateurs toujours allumés, qui deviennent alors déclarés comme tels et utilisés en priorité par le service pour « éviter des redondances inutiles »

Dans la pratique, des angles encore coupants

Les nouvelles moutures sortant en début du mois, la dernière date du 2 décembre et apporte des améliorations notables. Cependant, comme nous allons le voir, on est clairement sur un produit en cours d’élaboration. Impossible donc de le comparer à un produit fini ou de l’utiliser comme tel.

L’installation du client est simple. Il vous faudra les identifiants du compte ainsi que la chaine de caractères créée pour servir de clé. On choisit ensuite le nombre de Go que l’on souhaite consacrer au service. L’espace consacré est celui que vous pourrez utiliser pour stocker des données. Il s’agit en fait d’un espace mis à disposition des autres, le service vous octroyant le même espace pour vos propres fichiers. Cette taille peut être modifiée dans les paramètres.

HiveDriveHiveDrive

L’application – disponible uniquement en anglais – se présente comme une fenêtre affichant les dossiers et fichiers. Il n’y a pas d’intégration dans l’Explorateur de Windows ou le Finder de macOS, les deux plateformes sur lesquelles elle est disponible. Pour envoyer des données sur HiveDrive, on peut se servir du clic droit ou utiliser le glisser/déposer, mais pour un seul fichier à la fois.

C’est une limitation importante du client actuel. Si vous souhaitez avoir des dossiers, il va falloir en créer dans l’application (via le clic droit) puis sélectionner les fichiers à envoyer un par un. Selon les cas de figure, ce fonctionnement est très vite rébarbatif.

HiveDriveHiveDrive

On note également que les transferts sont lents, surtout en téléversement. Il nous faut ainsi en moyenne 20 à 25 secondes pour un fichier de 4 Mo. Pour les fichiers plus importants, c’est bien sûr plus long, mais le temps n’est pas multiplié. Par exemple, pour 97 Mo, l’envoi des données a pris 35 secondes. Ce même fichier, en téléchargement, n’a pris que quelques secondes, le tout sur une connexion fibrée 1 Gb/s chez Orange. Notez que le service étant en cours de construction, la taille maximale des fichiers est de 500 Mo.

En termes de fonctions, on fait très vite le tour, car HiveDrive ne fait pour l’instant que du stockage pur et dur. Autour, les carences sont légion. On ne peut pas obtenir d’informations sur les fichiers envoyés (par exemple pour vérifier la taille avant un téléchargement), utiliser directement les données depuis une autre application comme on le ferait avec un autre Drive, accéder aux paramètres depuis la fenêtre principale ou encore récupérer cette dernière depuis une icône dans la barre des tâches ou le Dock.

HiveDrive

HiveDrive dépose quand même une icône dans la zone de tray (en bas à droite sur Windows et à droite de la barre de menu sur macOS). C’est la seule manière d’ouvrir la fenêtre principale, puisque même l’icône ajoutée sur le bureau, dans le menu Démarrer ou dans le dossier Applications de macOS ne fait qu’ouvrir la petite fenêtre du tray. Cette dernière affiche un résumé de l’espace consommé et permet d’ouvrir les paramètres.

Ces derniers sont pour l’instant sommaires. En plus de quelques informations sur le stockage, on ne peut changer que le nombre de Go consacrés à HiveDrive. Dans l’onglet « Info » en haut, on trouve une liste des pairs, avec des informations dont la précision surprend : les adresses IP et la géolocalisation. HiveDrive indique la ville pour les personnes connectées en France, sinon le pays. 

Sur ce point, Hive nous a rapidement confirmé que ces informations allaient prochainement disparaître et n’étaient présentes que durant une partie de la phase de test.

Réseau distribué : le dada de David Gurlé

Nous nous sommes entretenus avec David Gurlé, fondateur et président de Hive. Nous avons voulu notamment savoir pourquoi il se lançait dans cette aventure : « On peut dire que je suis né avec l’informatique distribuée, car c’était à l’époque le sujet de ma thèse. C’est pour moi un domaine de prédilection ».

L’ingénieur nous explique avoir commencé à mettre en œuvre cette distribution chez Perzo, mais c’est surtout chez Skype qu’il a pu travailler sur le sujet. Avance rapide jusqu’en 2018 où, à la tête de Symphony, il se rend compte que la facture de l’hébergement chez Google grimpe en flèche. Il propose alors au conseil d’administration une idée proche de HiveDrive, mais qui ne passe pas.

« On peut dire que je suis en retraite semi-active. Je ne voulais plus faire d’opérationnel, mais je voulais infuser cette idée », ajoute David Gurlé, qui aimerait un cloud comme les « pères de l’Internet » imaginaient alors l’infrastructure. Un cloud qui serait également « plus responsable et économique ».

Mais pourquoi un partenariat avec Inria ? « Nous avons clairement des problèmes conséquents d’optimisation », nous répond le président. C’est notamment le cas sur la capacité de redondance, c’est-à-dire l’empreinte de stockage réelle d’un fichier avec tous les mécanismes de contrôle et d’intégrité.

Le partenariat se fera surtout sur l’intelligence artificielle, pour la partie modélisation et simulation. L’entreprise compte également sur l’expertise d’Inria pour lui signaler « les problèmes que nous ne connaissons pas encore ».

Interrogé sur le modèle commercial, l’ingénieur indique que le service va rester gratuit encore pendant un moment. À compter du deuxième trimestre 2023, il sera officiellement proposé au grand public, entrepreneurs et petites entreprises, sur la base d’un modèle fondé sur l’espace partagé.

Hive établira un cours basé sur l’offre et la demande en matière de stockage. Si une personne propose plus d’espace qu’elle n’en consomme, elle sera rémunérée. Dans le cas contraire, il faudra payer. Ce cours sera assorti d’un coefficient basé sur cinq facteurs :

  • Quantité (espace proposé)
  • Qualité (type de stockage)
  • Disponibilité (le temps que la machine reste allumée)
  • Empreinte énergétique (le type d’énergie consommée, quand l’information existe)
  • Valeur communautaire (l’engagement de l’utilisateur pour faire connaître Hive)

C’est ainsi que Hive « fera son beurre » : 5 % de frais sur l’ensemble des transactions.

« On est clairement dans une phase d’élaboration »

Nous avons ensuite abordé la longue liste des carences actuelles de HiveDrive. Sur ce point, David Gurlé a rapidement répondu : la version de janvier se débarrassera de la fenêtre servant actuellement à envoyer et récupérer des données. Elle n’existait que pour pouvoir tester le service. « On est clairement dans une phase d’élaboration », nous signale David Gurlé, qui a insisté plusieurs fois sur ce statut de test.

La prochaine mouture introduira l’intégration dans l’Explorateur de Windows, celle dans le Finder étant prévue le mois suivant. Une version pour Linux doit bien arriver, mais plus tard.

L’intégration dans le gestionnaire de fichiers gommera quelques-uns des plus gros défauts ergonomiques de l’application actuelle, notamment sur la gestion du glisser/déposer et l’accessibilité des données depuis d’autres applications. Le fonctionnement, pour l’instant synchrone, deviendra asynchrone et pourra ainsi gérer les envois et réceptions multiples.

Durant le premier trimestre 2023 arriveront également les applications mobiles. D’abord une version Android – « parce que nous avons d’abord recruté un ingénieur pour cette plateforme » – puis une application iOS le mois suivant.

L’actuel panneau « Info » dans paramètres sera complètement modifié le mois prochain lui aussi. Les adresses IP disparaîtront au profit d’informations plus riches sur ce qui se passe dans le réseau. Pour la version française par contre, il faudra attendre un peu plus car elle n’arrivera pas avant juin « au plus tard ».

HiveDrive, bien que nous ne puissions pas le recommander pour l’instant, est donc un projet intéressant que nous suivrons de près. L’arrivée d’un nouveau Drive ne serait pas si marquée s’il ne proposait pas une architecture distribuée et chiffrée de bout en bout. Au vu des moyens mis en œuvre et du partenariat avec Inria, le service pourrait bien apporter quelque chose de réellement frais dans ce paysage contrôlé par quelques gros acteurs américains.

Enfin, HiveDrive n'est que le premier d'une série de services. D'autres arriveront plus tard, notamment HiveCompute qui promet l'exécution d'applications sur HiveNet, un HiveVault pour les documents sensibles, ainsi que HiveShare, promettant des partages de fichiers sans limite de taille. Nous aurons bien sûr l'occasion de revenir sur ces produits quand ils seront disponibles.

Vous n'avez pas encore de notification

Page d'accueil
Options d'affichage
Abonné
Actualités
Abonné
Des thèmes sont disponibles :
Thème de baseThème de baseThème sombreThème sombreThème yinyang clairThème yinyang clairThème yinyang sombreThème yinyang sombreThème orange mécanique clairThème orange mécanique clairThème orange mécanique sombreThème orange mécanique sombreThème rose clairThème rose clairThème rose sombreThème rose sombre

Vous n'êtes pas encore INpactien ?

Inscrivez-vous !