BSS usage mining

This presentation details two proposals based on latent variable models for BSS usage data-mining. Two month of velib usage data (more than 5 000 000 trips) are used to illustrate the two propositions. Details on the first model are available in a pre-print.


Community extraction

This presentation deals with a community extraction algorithm that start from seeds in the community and expand them. The criterion for seed expansion is derived using a constrained version of the stochastick block model classicaly used for graph clustering. Further details are available in the associated paper.


Soft labels

This presentation review some of my thesis work on latent variable model estimation with soft lables. Such a solution can be used to handdle a variety of estimation problems from supervised to unsupervised and semi-supervised. Details and experiments can be found in a pattern recognition paper.


Clustering de graphe

Cette présentation détaille deux travaux sur le clustering de graphe. Après avoir rapidement données des bases sur cette problématique et rappelé différentes solutions classiques. Un premier travail sur l'extraction de communauté ainsi qu'un second sur l'analayse de matrice de flux domicile travail sont développés.


Reconnaissance de structure urbaine

Cette présentation fournis des premiers résultats ainsi que la problématique de thèse de Johanna Baro sur l'extraction de forme urbaine a partir de données raster et de données transports.


Détection de courbes anormales dans un flux

Cette présentation détaille une approche développée pour détecter des courbes anormales dans une séquence de courbes; l'application visées concerne le diagnostic des aiguillages. La méthode se base sur un test de fisher approché.


Apprentissage "labels doux"

Cette présentation détaille quelque un des résultats obtenus durant ma thèse sur l'estimation des modèles génératifs en utilisant des labels imprécis. Plus de détails sont bien sur accessible dans mon manuscrit.