Thèse de doctorat
CAOR / Mines ParisTech
2011-2014
Le centre de Robotique (CAOR) de Mines ParisTech participe depuis 2 ans, avec l’équipe IMARA de l’INRIA (auquel le CAOR est très lié via la « Joint Research Unit » LaRA) et le projet TAO de l’INRIA, à un projet collaboratif financé par l’ANR et portant sur l’analyse et la prédiction de trafic routier. En travaillant d’abord sur des données simulées réalistes (produites avec le logiciel Metropolis développé par le Laboratoire d’Economie des Transports et l’ENS-Cachan), puis ultimement sur des données réelles, le but du projet est de mettre au point des techniques d’analyse, reconstruction et prédiction du trafic à partir des informations fournies par une flotte de « véhicules traceurs » (véhicules instrumentés) transmettant régulièrement position/vitesse/état du trafic. L’idée maîtresse du projet est d’associer des techniques de datamining avec l’algorithme de « Belief Propagation » (BP) développé par IMARA, et de tester la capacité de l’ensemble à faire une reconstruction+prédiction fiable sur un très grand réseau (centaines ou milliers d’arcs routiers). Pour plus de détails, voir le site web du projet : http://travesti.gforge.inria.fr. Par ailleurs, le CAOR est partie prenante d’un autre projet (« PUMA ») démarré récemment dans le cadre duquel doit être organisée une expérimentation en grandeur réelle de reconstruction de trafic à l’échelle d’une ville (Rouen) à partir de la collecte de données d’une flotte de centaines de véhicules traceurs. Enfin, le CAOR a démarré sur ce même sujet une collaboration avec le CCIT de l’Université de Berkeley, qui dispose de grandes quantités de données réelles sur la région de San Francisco, et développe pour la reconstruction de trafic des méthodes sophistiquées, et complémentaires de l’approche BP développée par LaRA.
L’objectif de la thèse est mettre au point et valider des méthodes d’analyse et prédiction du trafic routier, qui non seulement exploitent l’historique de trafic, comme font la plupart des systèmes existants, mais qui surtout utilisent une modélisation de la dynamique spatio-temporelle intrinsèque du réseau routier considéré. Le travaux menés dans le cadre du projet TRAVESTI montrent que l’on peut utiliser avec profit des techniques de data-mining à la fois pour mettre en évidence les « patterns » fréquents de l’état instantané du trafic, représenté comme un graphe dont chaque arête est un tronçon de route avec le niveau de trafic associé (sous forme de vitesse moyenne, ou de temps de parcours, ou encore d’état de congestion), et pour faire une typologie des évolutions temporelles de congestion typiques de congestion dynamiques, et caractériser ainsi le type de dynamique de chaque segment routier. Cependant, pour pouvoir traiter un réseau routier péri-urbain de taille réelle (quelques milliers de segments couvrant quelques dizaines de km2, il apparaît indispensable de définir une méthode multirésolution pour modéliser d’une part séparément la dynamique macroscopique à grande échelle (flux entre « quartiers »), et exploiter ce modèle pour faire une prédiction plus fine de l’évolution du trafic séparément dans chaque zone. Le modèle développé devra être implémenté puis testé tant sur des données simulées que sur des données réelles. La thèse pourra se faire en lien avec l’équipe du CCIT de Berkeley avec laquelle le CAOR a démarrée une collaboration, et inclure en conséquence des périodes de séjour à Berkeley pour renforcer les liens entre les 2 laboratoires.
Titulaire d'un Master2 dans le domaine de l’apprentissage statistique et/ou de la fouille de données, ou sinon d’un bon diplôme d’ingénieur, avec expérience stage dans ces mêmes domaines, et :
Centre de Robotique (CAOR), Mines ParisTech, 60 boulevard Saint Michel, 75006 Paris + possibles périodes de séjour à BERKELEY, Californie, USA
Fabien Moutarde, 01.40.51.92.92, Fabien.Moutarde@mines-paristech.fr