Open data : Infoclimat, l'association qui lutte pour l'ouverture des données météorologiques

Open data : Infoclimat, l’association qui lutte pour l’ouverture des données météorologiques

La tête dans les nuages

Avatar de l'auteur
Vincent Hermann

Publié dans

Sciences et espace

27/01/2022 13 minutes
14

Open data : Infoclimat, l'association qui lutte pour l'ouverture des données météorologiques

Infoclimat est une association fondée par des passionnés de météorologie. En plus d’accumuler une montagne de données, elle a pour objectif la mise en commun des informations, l’installation de stations météo supplémentaires, la vulgarisation scientifique et les échanges entre les différents acteurs de la météo. Pour en savoir plus, nous nous sommes entretenus avec Frédéric Ameye, son vice-président.

L’association est loin d’être neuve. À la fin des années 90, des passionnés de météorologie se sont réunis pour fonder le site Oragenet. Observation de phénomènes, photos, mesures via des stations météo, compréhension des mécanismes : il s’agissait alors d’échanger, de comprendre, d’expliquer.

La communauté a vite grandi, si bien que la question d’une association de loi 1901 s’est rapidement posée. Elle a été créée en octobre 2003 avec le nom « Infoclimat ». Le site a alors été renommé pour suivre le mouvement.

Missions et actions de l’association

Infoclimat collecte avant tout des données issues d’environ 1 100 stations installées par des passionnés sur tout le territoire, regroupées dans le réseau StatIC (STATions InfoClimat). Températures, précipitations et vent sont mesurés. Les données sont ensuite envoyées sur les serveurs de l’association toutes les 10, 15 ou 30 minutes selon le matériel (nous y reviendrons).

Le site fournit de son côté des outils plus ou moins spécifiques. On y trouve des fonctions simples comme l’envoi d’observations et de photos, forums de discussions, analyses des conditions météo et autres. Mais il propose également des outils beaucoup plus techniques à l’attention des personnes en ayant besoin et sachant les exploiter. Le tout forme un parfait exemple, selon l’association, de science participative.

Infoclimat

Elle s’est donné deux autres missions. D’une part, pousser autant que possible à l’ouverture des données météorologiques. La question, comme nous le verrons, est loin d’être aisée. D’autre part, vulgariser ce domaine d’étude, notamment en participant à des évènements et en intervenant dans les écoles. À ces deux titres, Infoclimat est membre des commissions Observation et Éducation/Formation du Conseil Supérieur de la Météorologie (regroupant tous les acteurs du domaine).

À ce jour, Infoclimat compte 1 784 adhérents, une belle poussée face aux 1 315 en 2020. La gestion de l’association et du site est entièrement assurée par des bénévoles. 6 milliards de données sont actuellement stockées dans les serveurs, le site ayant compté 6 millions d’utilisateurs uniques en 2021, avec une fréquentation en hausse (100 millions de pages visitées sur l’année écoulée).

Infoclimat veut et doit changer de modèle

Si l’association communique intensément en ce moment, c’est qu’elle se trouve à un carrefour, comme nous l’explique Frédéric Ameye : « Nous sommes à la fois trop petits pour l’échelle que représente l’activité aujourd’hui, et trop gros pour dépenser tout le budget, car les actions sont menées par des bénévoles. Au point qu’il nous arrive de refuser certaines propositions de mécénats ». L’argent restant est alors investi dans de nouvelles stations, voire donné à d’autres associations régionales.

C’est en discutant notamment avec Framasoft et Gandi qu’Infoclimat s’est résolu à passer à l’étape supérieure : recruter. L’association compte donc embaucher au moins un développeur vers le milieu de l’année. Selon Frédéric Ameye, chargé de l’entretien du site (il est lui-même développeur), ce dernier est devenu trop vaste pour convenir à un bénévole.

« J’ai essayé pendant un temps de réduire mon travail à temps partiel pour pouvoir m’en occuper plus facilement, mais ce n’était pas assez. Il nous faut au moins une personne à temps plein », ajoute Ameye. « Nous ne serons pas en mesure d’offrir un gros salaire, du moins en comparaison de ce qu’un développeur peut être payé dans d'autres structures. Nous allons chercher la perle rare, quelqu’un que le projet motive ».

Cela signifie-t-il que le vice-président se détachera du site ? « Loin de là. En fait, le site Infoclimat.fr a deux facettes. Une partie grand public, et une autre beaucoup plus pro. Il faudra que j’accompagne le développeur car beaucoup d’outils sont très spécifiques. Nous voulons en tout cas moderniser le site, car nous avons encore de vieilles parties ». Le profil recherché sera celui d’un développeur (ou développeuse) full-stack web-UX.

Dans le cadre de son projet 2022-2025, Infoclimat a défini également trois axes de développement :

  • Mobiliser les passionnés et le grand public autour des sciences participatives
  • Produire, collecter, traiter, contrôler et diffuser des données ouvertes
  • Produire des contenus de vulgarisation scientifique, intervenir dans les écoles et auprès du grand public

Dans ce contexte, l’association va donc aussi chercher à recruter une personne chargée de l’animation associative. Là aussi, il s’agira de coordonner les efforts et soulager les bénévoles.

La question délicate du financement

La gestion totalement bénévole de l’association atteint en effet ses limites. C’est là que se situe le grand saut que l’association doit entreprendre, en se professionnalisant.

Infoclimat

Il suffit de jeter un œil à ces graphiques pour comprendre ce qui est envisagé dès 2023. Actuellement, l’immense majorité du budget provient des sommes versées par les adhérents (à partir de 20 euros par an). En 2020, cela représentait ainsi 30 000 euros sur le budget de 42 000 euros.

Mais en 2023, la part des cotisations représenterait 37 %. Ils resteraient une part importante (et essentielle), mais seraient accompagnées d'autres sources. Les dons passeraient alors de 5 à 16 %, la part du mécénat descendrait de 24 à 17 %. Quant au reste, il proviendrait des subventions, que l'association ne demandait jamais jusqu'à présent. L’évolution des dépenses suivrait la même trajectoire, avec 62 % du budget annuel dédiés au salariat.

Un changement de paradigme ? « C’est tout à fait ça », confirme Frédéric Ameye. Le problème va se situer surtout sur la partie subventions : « Il faut maintenant travailler aux niveau national et européen, et tout est plus compliqué. Mais nous avons plusieurs pistes. Par exemple, des subventions provenant des ministères de la Transition écologique et de l’Éducation, car nous sommes déjà en lien avec eux. Le gouvernement a également lancé un appel à projets Etalab utilisant des données publiques ».

Les subventions nationales représenteraient alors le gros de la somme espérée (32 000 euros). Mais Infoclimat va se lancer aussi sur la piste européenne. « Sur cette partie, tout sera beaucoup plus compliqué car les dossiers à fournir sont énormes ». En parallèle, l’association cherchera à obtenir des subventions plus locales, notamment quand il s’agira d’équiper des zones en stations météos, tout particulièrement dans la diagonale du vide, un axe sud-ouest nord-est dans lequel les données manquent, la densité des équipements étant plus faible.

La technique derrière l’association

L’association doit gérer une quantité importante de données, qui ne peut aller qu’en s’accroissant, d’autant que la fréquentation augmente, tout comme le nombre d’adhérents.

Interrogé sur l’infrastructure de l’association, Frédéric Ameye nous répond : « C’est une structure assez classique. Nous avons douze serveurs dédiés chez OVHcloud, qui hébergent des centaines de téraoctets. Nous avons également des équipements pour la redondance chez Gandi et utilisons du cloud de chez Scaleway ».

Et le site ? « Nous réalisons tout en PHP et JavaScript, et nous utilisons Python pour le traitement des données. Le site représente à peu près 400 000 lignes de code ». C’est d’ailleurs tout le danger : « Il faut faire attention au bus factor : si tout est remis en question parce qu’une seule personne – en l’occurrence moi – se fait écraser par un bus, c’est qu’il y a un problème ».

En tout cas pour la partie grand public, la partie « pro » réclamant des outils très spécifiques. « Mais nous n’avons jamais changé de cap dans nos développements. L’objectif, c’est toujours d’avoir un site et des données autohébergés, sans aucun tracker ». Une philosophie qui avait emmené d’ailleurs l’association vers Framasoft, qui partage des valeurs communes. Le budget doit d’ailleurs servir à soutenir le site pour qu’il continue à être rapide et sans publicité.

La relation complexe avec Météo-France

Difficile de parler de données météo et de modèles climatiques sans évoquer Météo-France. Quels liens entre l’établissement public et Infoclimat ? « Nous nous entendons bien le plus souvent. Plusieurs ingénieurs travaillant là-bas se sont formés chez nous. Leur passion les a conduits sur notre site, dans nos forums, puis ils ont eu envie de se professionnaliser et sont allés vers le master de l'École nationale de météorologie ».

Mais alors, où sont les données de Météo-France ? « C’est compliqué. Actuellement, seuls 5 % des données collectées chez eux sont en open data. Le reste nécessite une redevance annuelle aux alentours de 100 000 à 150 000 euros. Et encore, à ce prix on n’a que les données des stations. Il faudrait repayer la même chose pour les radars. C’est bien au-delà de ce que l’on peut se permettre, et nous militons de toute façon pour des données publiques et ouvertes ».

Une situation complexe, qui tient au découpage particulière de la structure. Elle est en effet divisée en deux entités, l’une publique collectant les informations et travaillant sur les modèles, l’autre cherchant à en tirer le meilleur profit. Cette branche commerciale est chargée de trouver de nouvelles sources de financement, alors même que ses effectifs sont réduits.

« Nous sommes en retard sur plusieurs de nos voisins européens, qui ont adopté une attitude beaucoup plus ouverte sur les données météorologiques ».

Infoclimat

Pour preuve, les deux cartes de France ci-dessus. À gauche, les relevés de températures sur la seule base des données publiques de Météo-France. À droite, la carte complétée avec les relevés provenant d’Infoclimat. On note tout de suite la densité plus importante. « Mais c’est encore loin de ce que l’on peut voir en Allemagne », ajoute le vice-président.

Il y a tout de même de l’espoir, car Météo-France annonce toujours une ouverture large de ses données publiques à l’horizon 2024 – horizon qui ne cesse cependant d’être repoussé.

En attendant, Infoclimat joue un rôle important dans la complémentarité des données, car il lui est arrivé d’installer des stations météo dans des zones abandonnées par Météo-France, notamment le sommet du Mont-Ventoux.

Infoclimat

Comme le précise Frédéric Ameye, Infoclimat et Météo-France travaillent régulièrement ensemble dans le cadre du Conseil Supérieur de la Météorologie. La densification du réseau de stations ne peut qu’apporter une meilleure précision dans les prévisions, avec un bénéfice dans les zones peu couvertes pour toutes les activités sensibles à la météo, agriculture en tête.

Le vice-président ajoute que cette densification est essentielle « pour mieux analyser le phénomène des îlots de chaleur urbains, une concentration supérieure de chaleur en raison des matériaux utilisés. Plus nous en saurons sur eux, mieux l’urbanisme pourra s’adapter, car le phénomène ne peut que s'aggraver avec le réchauffement climatique ».

Infoclimat travaille également avec Météo-France sur la prise en compte des données provenant de réseaux partenaires.

Cap sur la pédagogie

C’est l’autre grand objectif pour la période de trois ans qui s’ouvre. « Nous voulons sensibiliser autant que possible le grand public, notamment dans les écoles, collèges et lycées ».

Il y a plusieurs types d’interventions. Elles peuvent aller du simple échange avec des élèves à des évènements plus importants, en passant par l’installation d’une station météo dans l’établissement. Cette dernière est alors l’occasion d’aborder la météo sur un angle plus technique.

Infoclimat

Si Infoclimat peut intervenir dans le scolaire, c’est aussi parce que l’association a repris en 2018 l’initiative « Météo à l’école ». Elle avait été créée dix ans plus tôt par le ministère de l’Éducation nationale, en coopération avec Météo-France et l’Observatoire de Paris. « Elle a failli disparaître en 2018, faute du budget. Nous l’avons alors repris, avec l’accord du ministère, sur nos propres fonds et sans subventions ».

Participer à Infoclimat

Nous avons posé la question : quel budget faudrait-il envisager pour se lancer dans une station météo qui communiquerait ses données à Infoclimat ? « Un budget allant de 800 à 1 200 euros pour du matériel semi-professionnel, que vous pourriez installer dans un terrain dégagé. Tout le monde ne peut pas le faire ».

Et le matériel grand public ? C'est un domaine en cours d'exploration, nous confirme Ameye. « Nous sommes par exemple en train de qualifier le matériel Netatmo. Ce devrait être fait dans les mois qui viennent, le temps de vérifier que toute fonctionne bien et que les données s'interfacent correctement avec nous ».

Comme déjà mentionné, Infoclimat est particulièrement intéressée par la diagonale du vide, cette zone dans laquelle elle manque le plus de données. Les zones de montagnes sont également d’un grand intérêt, comme la photo ci-dessous, à Casterino, dans la vallée des Merveilles.

Infoclimat

« Ce n’est pas seulement une question de coût. Il faut démarcher les personnes quand nous repérons un endroit propice. Et toutes les zones ne sont pas simples d’accès ou à équiper. Il nous faut compter avec les réglementations Bâtiments de France ou Natura 2000, obtenir d’éventuelles autorisations, signer des conventions avec les collectivités locales, etc. Certains sites sont accidentés et prennent du temps à équiper, surtout quand on ne peut s’y rendre qu’à pieds ».

Mais si vous avez l’envie et le budget, rien ne vous empêche de vous rendre sur Infoclimat, dont la partie Communauté contient de nombreuses informations. Vous pourrez également demander des informations pour choisir un premier matériel dans les forums.

Écrit par Vincent Hermann

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Missions et actions de l’association

Infoclimat veut et doit changer de modèle

La question délicate du financement

La technique derrière l’association

La relation complexe avec Météo-France

Cap sur la pédagogie

Participer à Infoclimat

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Fermer

Commentaires (14)


Très intéressant, merci.


Un site que j’ai consulté il y a plus de 15 ans. Belle évolution. Merci NxI pour ce travaille et cette mise en lumière.


infoclimat ? Et ce n’est même pas un site complotiste qui nie le réchauffement climatique ? On ne peut plus se fier à rien :D .



Blague à part, merci pour l’article. Je ne connaissais pas, et ils méritent qu’on parle plus d’eux.


Super intéressant, merci NextINpact pour cet article, mi-technique, mi-politique et très humain.


Il y a un nom qui est étrangement absent de l’article, celui de la société SenCrop. C’est une solution de station météo, propriétaire. Le réseau de stations de SenCrop est tout à fait respectable.



Le zoom sur les questions techniques (serveurs, traitement des données etc.) est très … urbain ? On pourrait longuement parler des réseaux 0g qui couvrent les zones blanches (il y avait eu récemment un article sur SigFox ici, on pourrait parler de LoraWan), on pourrait parler de la difficulté à bien placer une station météo (pas à l’abri, pas à découvert non-plus) ou de la nécessaire fiabilité du matériel pour résister aux conditions météo et aux accidents de tracteur ou de chasse (c’est moins grave de dégommer une station météo qu’un cycliste mais bon …)



Voilà, une série de pistes que je lance comme ça :)


Nous connaissons bien Sencrop puisque nous sommes déjà en contact avec eux. À noter que leurs stations ne sont que des Davis Vantage Pro2 “re-brandées”, c’est-à-dire le même modèle que nous avons dans notre réseau. Leur modèle économique n’étant pas le même, et l’open-data pas forcément leur modèle non plus, nous ne parlons pas de leur activité ici, qui est très différente. Des sociétés commerciales qui installent du matos météo et en vendent le service aux agriculteurs, industriels, etc, il y en a beaucoup, beaucoup d’autres. Et nous les connaissons bien, puisque beaucoup d’entre eux ont commencé sur Infoclimat, viennent y chercher de l’info, ou même nous font des donations de matériel météo usagé.



Nous avons mis le focus sur les aspects techniques parce que c’est un peu l’esprit de Nextinpact. Certaines de nos stations émettent en LoRa, par exemple, mais nous ne voulions pas abreuver de détails. Plus d’informations sont disponibles en cliquant sur le lien qui présente notre réseau “StatIC”, où l’on explique une partie de ces problématiques (robustesse et fiabilité du matériel, etc). La partie “communication réseau” n’est qu’un détail d’implémentation.


Raph06

Nous connaissons bien Sencrop puisque nous sommes déjà en contact avec eux. À noter que leurs stations ne sont que des Davis Vantage Pro2 “re-brandées”, c’est-à-dire le même modèle que nous avons dans notre réseau. Leur modèle économique n’étant pas le même, et l’open-data pas forcément leur modèle non plus, nous ne parlons pas de leur activité ici, qui est très différente. Des sociétés commerciales qui installent du matos météo et en vendent le service aux agriculteurs, industriels, etc, il y en a beaucoup, beaucoup d’autres. Et nous les connaissons bien, puisque beaucoup d’entre eux ont commencé sur Infoclimat, viennent y chercher de l’info, ou même nous font des donations de matériel météo usagé.



Nous avons mis le focus sur les aspects techniques parce que c’est un peu l’esprit de Nextinpact. Certaines de nos stations émettent en LoRa, par exemple, mais nous ne voulions pas abreuver de détails. Plus d’informations sont disponibles en cliquant sur le lien qui présente notre réseau “StatIC”, où l’on explique une partie de ces problématiques (robustesse et fiabilité du matériel, etc). La partie “communication réseau” n’est qu’un détail d’implémentation.


Merci pour toutes ces précisions. Je me suis permis d’ouvrir un journal sur LinuxFR basé sur la publication de NextInpact où vous trouverez d’autres commentaires bien plus concentrés sur l’aspect « projet libre »


Mouais, ils sont un peu restrictifs sur les stations acceptées.
J’ai une station gérée par un raspi via weewx, et les sites justement décriés comme WeatherUnderground ou Awekas acceptent ces stations et comparent les valeurs des stations proches pour valider ou non les résultats.
Par exemple si un capteur se met à déconner (j’ai un capteur d’hygrométrie qui est mort récemment), automatiquement les résultats farfelus sont éjectés le temps de régler la problème, et le site nous prévient.
Je pense qu’un énorme maillage avec des stations pas forcément top est mieux que peu de stations plus pro.
Il serait très simple pour eux de récupérer les infos des milliers de stations gérées par weewx.


Les sites “décriés” ont juste des valeurs et un mode de fonctionnement différent, c’est tout. Si cela vous convient, pas de soucis ;-)



Quant à la balance entre qualité et quantité, ce n’est pas si simple. Quelques chercheurs en France et au Pays-Bas (dont certains passionnés d’Infoclimat !) travaillent par exemple sur l’intégration des données de Netatmo aux modèles de prévisions météorologiques, et il y a un énorme travail de filtrage et de contrôle qualité, et les résultats montrent que, malgré des méthodes de traitement de données poussées, la quantité ne remplace pas la qualité… Le même type de recherches sont faites sur les données des smartphones et des voitures, et aujourd’hui ce n’est pas encore au niveau.
Le réseau d’Infoclimat a aussi une vocation climatologique à plus long terme, et là aussi, les contraintes en terme de qualité, de dérive dans le temps et d’entretien sont importantes pour que les séries de données soient pertinentes.
Ce pourquoi nous avons fait le choix délibéré de restreindre le type de stations et l’environnement associé. Aujourd’hui, les stations sous WeeWX sont parfaitement acceptées sur le réseau, mais tout dépend de l’environnement associé. En termes de matériels, nous acceptons de nouveaux types de modèles au fil de l’évolution des connaissances sur leur fiabilité, comme indiqué dans la page linkée dans l’article : https://www.infoclimat.fr/stations/static.php



F.A.


J’imagine que MétéoFrance finira par ouvrir ses données tôt ou tard comme l’a fait l’IGN il y a déjà quelques temps (avant l’IGN tirait également une grande partie de son budget de la vente de ses cartes).


Mais c’est super ca! Moi qui fait de la météo dans mon coin tout seul et qui aimerait partager ses datas.
Merci l’équipe :yes:


De la bonne data météo à partager, on héberge avec plaisir sur infoclimat ;)


Sebaas

De la bonne data météo à partager, on héberge avec plaisir sur infoclimat ;)


Me suis inscris :jesquate: ca va me donner l’occasion de troquer ma VMR928N après 20 ans de loyaux services contre une Vantage Pro 2 plus (pour plus de “bonne” data comme tu dis)
J’ai par contre un doute sur le vent, mon terrain a pas mal de grands arbres autour et j’ai pas une position idéale toutes directions.


Bon courage à eux et bonne résussite. En espérant que les données des instituts publics se libèrent effectivement.
Y’a des élections bientôt à ce propos et des candidats qui savent parler de ce genre de choses.