Fouille de données billettiques pour l'analyse de la mobilité dans les transports en commun

Résumé : Les données billettiques sont de plus en plus utilisées pour l'analyse de la mobilité dans les transports en commun. Leur richesse spatiale et temporelle ainsi que leur volume, en font un bon matériel pour une meilleure compréhension des habitudes des usagers, pour prédire les flux de passagers ou bien encore pour extraire des informations sur les événements atypiques (ou anomalies), correspondant par exemple à un accroissement ou à une baisse inhabituelle du nombre de validations enregistrées sur le réseau.Après une présentation des travaux ayant été menés sur les données billettiques, cette thèse s'est attachée à développer de nouveaux outils de traitement de ces données. Nous nous sommes particulièrement intéressés à deux challenges nous semblant non encore totalement résolus dans la littérature : l'aide à la mise en qualité des données et la modélisation et le suivi des habitudes temporelles des usagers.Un des principaux challenges de la mise en qualité des données consiste en la construction d'une méthodologie robuste qui soit capable de détecter des plages de données potentiellement problématique correspondant à des situations atypiques et ce quel que soit le contexte (jour de la semaine, vacances, jours fériés, ...). Pour cela une méthodologie en deux étapes a été déployée, à savoir le clustering pour la détermination du contexte et la détection d'anomalies. L'évaluation de la méthodologie proposée a été entreprise sur un jeu de données réelles collectées sur le réseau de transport en commun rennais. En croisant les résultats obtenus avec les événements sociaux et culturels de la ville, l'approche a permis d'évaluer l'impact de ces événements sur la demande en transport, en termes de sévérité et d'influence spatiale sur les stations voisines.Le deuxième volet de la thèse concerne la modélisation et le suivi de l'activité temporelle des usagers. Un modèle de mélange de gaussiennes a été développé pour partitionner les usagers dans les clusters en fonction des heures auxquelles ils utilisent les transports en commun. L'originalité de la méthodologie proposée réside dans l'obtention de profils temporels continus pour décrire finement les routines temporelles de chaque groupe d'usager. Les appartenance aux clusters ont également été croisées avec les données disponibles sur les usagers (type de carte) en vue d'obtenir une description plus précise de chaque cluster. L'évolution de l'appartenance aux clusters au cours des années a également été analysée afin d'évaluer la stabilité de l'utilisation des transports d'une année sur l'autre.
Type de document :
Thèse
Analyse classique [math.CA]. Université Paris-Est, 2017. Français. 〈NNT : 2017PESC1235〉
Liste complète des métadonnées

Littérature citée [43 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01757105
Contributeur : Abes Star <>
Soumis le : jeudi 12 juillet 2018 - 14:50:05
Dernière modification le : jeudi 12 juillet 2018 - 14:50:06

Fichier

TH2017PESC1235.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01757105, version 1

Collections

Citation

Anne-Sarah Briand. Fouille de données billettiques pour l'analyse de la mobilité dans les transports en commun. Analyse classique [math.CA]. Université Paris-Est, 2017. Français. 〈NNT : 2017PESC1235〉. 〈tel-01757105〉

Partager

Métriques

Consultations de la notice

225

Téléchargements de fichiers

87