Des données à l’image

quelques retours d’expériences de 10 années de datavisualiation

Etienne Côme, @comeetie.bsky.social,
GTSO Couperin

2024-12-17

@comeetie

Chercheur Université Gustave Eiffel COSYS/GRETTIA
Statistiques, Données, Visualisation, Cartographie, Transports,…
R,JS,Python,Cpp,…

Trajectoire

Toujours aimé les cartes !

Trajectoire

Toujours aimé les cartes !

en voyage

Trajectoire

Toujours aimé les cartes !

ou dans les livres

Trajectoire

Pas de formation en carto/visualisation

Plus à l’aise avec un

qu’avec un .

Trajectoire

mais découverte de Tufte

Trajectoire

et de Jacques Bertin

Trajectoire

rencontre avec la Grammaire Graphique

et avec ggplot

Trajectoire

découverte des possibilités offertes

par le js et d3

Trajectoire

découverte de la stack logicielle autour d’OSM

et des travaux de Stamen

Trajectoire

découverte de la stack logicielle autour d’OSM

donc de Mapbox

Trajectoire

découverte de la stack logicielle autour d’OSM

et de Leaflet

Trajectoire

découverte de la stack logicielle autour d’OSM

Il faut être 2

pour faire une carte/visualisation

Carte / Visualisation ?

Bruit divers ! Bruit sémantique Bruit technique Bruit sémantique
Source (Données) Emetteur (Encodage) Canal Récepteur (Décodage)

Toutes les cartes/visualisations sont

fausses

mais certaines sont

utiles

mais certaines sont

utiles

mais certaines sont

utiles

Zoom \(\Rightarrow\) Profondeur

Francepixels, contexte

Retour en 2014 !

Données carroyées massives

  • derivées des feuilles d’impositions
  • 200m x 200m pixels
  • limite du secret statistique (11 ménages)

Contexte

open data, mais :

  • fichier volumineux, format spécifique, problème de projection
  • utilisable dans la douleur
  • avec des logiciels spécialisés mapinfo / arcgis / qgis

Une opportunité

La stack technique développée autour d’OSM

\(\Rightarrow\) allait permetre de renouveller la diffusion et les outils de visualiation de ce type de données statistiques

Une opportunité

Pas le seul à noter cette opportunité

Oliver O’Brien a proposé une approche similaire en 2015 avec data-shine (Uk)

Details technique et choix

A cette époque les tuiles vectorielles arrivaient très doucement

\(\Rightarrow\) Avantage massif pour les données statistiques

Details technique et choix

A l’époque :

  • R pour traiter les données et produires des tuiles geojson
  • leaflet pour les tuiles raster
  • d3 pour le rendu des tuiles vectorielles artisanale sur un canvas
  • canvas invisible pour gérer l’interactivité
  • importance des détails (échelle de couleurs/fond de carte/labels/…)

essayez ! c’est toujours en ligne

MAUP et aggregation mutli-échelle

Le modifiable areal unit problem (MAUP) est un biais lié à l’agrégation de données spatiales à des échelles différentes.

MAUP and multiscale aggregation

Le modifiable areal unit problem (MAUP) est un biais lié à l’agrégation de données spatiales à des échelles différentes.

\(\rightarrow\) agréger a différentes échelles et lier niveau d’agrégation et niveau de zoom.

Résous deux problèmes :

  • Taille des tuilles !! elles doivent rester petites
  • MAUP !! possibilité d’explorer différents niveaux d’agrégations facilement

Feedbacks et utilisateurs

  • INSEE
  • Journalistes, sur des sujets spécifiques eg. ségregation / école / transports
  • Urbanistes pour des diagnostics territoriaux
  • Chercheur
  • Curieux …

Francepixels, evolutions

Les tuiles vectorielles sont devenues une technologie mature

accessible beaucoup plus facilement

Francepixels, évolutions

Beaucoup plus simple à réaliser maintenant :

Francepixels successeurs

Les détails ont leurs importances !

Les détails ont leurs importances !

Faciliter l’interaction n’est pas aisé

Médiation

Algorithmique

Médiation

Algorithmique

Matrices OD \(\Rightarrow\) Champs vectoriels

Médiation

Algorithmique

Parties de cartes compétitives\(\Rightarrow\)Espace abstrait organisé

Médiation

Algorithmique

Relations d’abonnements\(\Rightarrow\)Espace abstrait organisé

Merci !

Questions / Discussion