dimanche 21 décembre 2014

Ouverture des données 'impots sur le revenu par département'

Plusieurs semaines sans nouvel article, ce n'est pas pour autant que le blog est déserté, au contraire.

Jusqu'à présent, les derniers articles étaient faits à la main :
- Téléchargement du fichier Excel
- Création des tableaux pour pouvoir générer les graphiques
- Capture d'écran des graphiques
- Rédaction de l'article.

Bref, tout ceci est long est fastidieux (environ 2h) par année pour un seul petit département...
Etant moi-même développeur, et donc, par nature, fainéant, j'ai entrepris d'automatiser tout ceci (avec le soutien moral d'un collègue du boulot, merci ;) ).

Première tâche donc : ouvrir véritablement les données disponibles sur la plateforme data.gouv.fr
Pourquoi véritablement ?
Loin de moi de cracher dans la soupe, le projet d'ouverture des données publiques est tout à fait louable et il faut l'encourager.
Toutefois, les données concernant l'impôt sur les collectivités territoriales - que je considère comme une mine d'or du point de vue de l'intérêt général - se trouvent entachées par un petit problème : les données sont disponibles dans des fichiers Excel. Excel, qui est un produit Microsoft, n'est pas gratuit et, encore moins, libre. Le format XLS est propriétaire et nécessite donc le produit de Microsoft pour être ouvert.

J'ai donc entrepris de rendre ces données réellement ouvertes, au format JSON, un format ouvert basé sur JavaScript.

Ces données sont maintenant disponibles sur le site data.gouv.fr (voir lien plus haut) mais également sur github, lié au projet qui a permis de générer ces données

Toutes les infos sont dans le fichier README du projet.

Ce projet a été réalisé avec VisualStudio 2013 Community Edition qui, c'est vrai, n'est pas tout à fait libre. Je me permets cet écart, l'objectif étant de libérer les données avant tout.

Prochaine étape, traiter ces données afin d'obtenir les éléments que je veux (sensiblement les mêmes que dans les articles sur les inégalités.
Puis, étape suivante, mettre en forme tout ceci sous la forme d'une application web (j'avoue appréhender un petit peu ce moment là). Si cela se goupille bien, cela sera peut être l'occasion de participer au hackathon DataConnexion organisé par Etalab. A voir...

Enfin, dernière étape, ouvrir ces données concernant les communes car pour le moment, je ne travaille qu'à l'échelle départementale. Mais ayant un ordinateur peu puissant, cela risque de prendre beaucoup plus de temps (je redoute plusieurs dizaines de minutes, voire plusieurs heures, pour traiter 100 fichiers Excel, soit, une année entière)...

Aucun commentaire:

Enregistrer un commentaire