Rechercher
Toggle location

Découvrez le 1er article de notre série autour du Big Data & de la sécurité des passagers.

L'accident de Millas, collision survenue sur un passage à niveau entre un autocar transportant des adolescents et un TER le 14 décembre dernier, suscite encore de nombreuses interrogations.
L'une de ces interrogations porte notamment sur la remontée des données du train en circulation vers le système d'activation des barrières du passage à niveau.

Plus généralement, les autres accidents ferroviaires - heureusement rares - tels que ceux de Bretigny et Eckwerschein montrent la complexité de l’analyse des causes d’accidents.

Si l’utilisation des données dans le ferroviaire peut améliorer le confort des passagers et notamment leur information, l’exploitation des gisements de données issues d’un large nombre de sources peut offrir bien plus aux passagers : une sécurité accrue !

Une utilisation plus poussée des technologies « Big Data » pourrait notamment contribuer à l’amélioration de la sécurité des circulations et des réseaux, en limitant directement le nombre d’incidents techniques voire d’accidents :

  • Les technologies « Big Data » peuvent améliorer l’analyse des données, en complétant / quantifiant par exemple les analyses de risques existantes (souvent qualitatives seulement) ainsi qu’améliorer la visualisation des modèles de risques
  • Ces technologies permettent également de passer d’une approche d’analyse (compréhension des causes et identification des précurseurs) à une approche prédictive voire prescriptive : la détection des « évènements » et des « signaux faibles » afin de mieux comprendre et donc prévenir les risques complexes… et dans certains cas limiter ainsi les comportements à risque

Cette exploitation des données au service de la sécurité ferroviaire nécessite la consolidation a minima de trois conditions :

1. De l’importance de bien identifier les sources de données exploitables

Il existe aujourd’hui des principes et des exigences de reporting propres au ferroviaire, notamment à destination de l’EPSF, l’Autorité Française en charge des aspects de Sécurité Ferroviaire (remontée des « événements de sécurité ») ou de l’Agence Ferroviaire Européenne (remontée des « Critical Safety Indicators »). Toutefois, pour aller plus loin dans l’analyse des causes d’incident, il faut disposer d’informations sur les circonstances des incidents et accidents : il apparaît pertinent d’identifier et de qualifier l’ensemble des sources de données potentiellement exploitables, notamment en analysant les bases opérationnelles existantes. A titre d’exemple :

  • Côté « Gestionnaire d’Infrastructure » : des bases relatives à la construction, à la maintenance, aux travaux en cours, aux circulations, … doivent être récupérées
  • Côté « Entreprise ferroviaire » : des bases relatives aux matériels roulants (entretien, conditions d’utilisation, …), aux conducteurs, … doivent également être intégrées dans l’analyse

L’intégration d’un nombre de sources de données plus large permettrait de compléter les jeux de données existants et ainsi approfondir les analyses des risques pour mieux les anticiper. Cette tâche n’est pourtant pas aisée :

  • Du fait de l’éclatement des acteurs (plusieurs opérateurs ferroviaires pouvant accéder à la même portion d’infrastructure, ou du fait du caractère éclaté des bases de données, qui ont été historiquement conçus isolément, plus pour des besoins d’exploitation que d’analyse de sécurité).
  • Du fait de barrières structurelles : par exemple, l’absence de référentiels communs qui permettraient de croiser des bases de données, ou encore le système de localisation traditionnel des réseaux ferroviaires reposant sur le principe des « points kilométriques », qui n’est pas assez « fin » ou « normé » pour localiser avec précision où se sont passés les incidents.

Toutefois, le croisement des sources de données peut aussi aboutir à la détection de causes prévisibles ou inattendues et à leur qualification (exemple : ensemble de causes ? effets de seuils ?)

L’utilisation de sources de données multiples pose également un certain nombre de questions comme par exemple :

  • Qui est le propriétaire des données ? Est-il disposé à les communiquer, notamment dans un contexte de concurrence entre entreprises ferroviaires ou de séparation entre entreprise ferroviaire et gestionnaire d’infrastructure ? Est-il en capacité de les analyser de manière objective ? Peut-il seul exploiter l’ensemble des données dont il dispose ?   
  • Quelle volumétrie ?  Représente-t-elle un échantillon significatif, notamment du fait de la rareté des accidents ?

Afin d’initier une démarche « Big Data », il apparaît donc indispensable d’élaborer, dans un premier temps, une cartographie des sources de données, des données types et de leurs caractéristiques à l’aide d’une cartographie fonctionnelle.  Cet outil offre une vision globale de tous les « objets » mis en œuvre pour assurer une circulation ferroviaire (voie, aiguillage, signal, matériel roulant, conducteur, ...) en mesure de fournir des données.

   Exemple illustré d'une cartographie fonctionnelle

Le modèle de BearingPoint, élaboré pour le ferroviaire, identifie à ce jour 20 objets et 70 types d’informations à rechercher dans un écosystème de sources de données.

Fort de cette analyse, il est ensuite nécessaire d’identifier les sources de données pertinentes au regard des cas d’usages sélectionnés, tout en veillant à limiter l'inflation du nombre de sources exploitées

2. De l’importance de cartographier les différents cas d’usages

L’exploitation des données à des fins d’amélioration de la sécurité ferroviaire peut conduire à un large nombre d’études ou encore d’approfondissements des modèles de risques. Elle peut offrir des résultats importants pour l’ensemble des acteurs concernés : des constructeurs, des transporteurs, des autorités en charge de la sécurité, …

Au-delà des seules analyses de sécurité, il est possible de cartographier les cas d’usages de technologies big data par type d’acteurs ; à titre d’exemples :

  • Pour les constructeurs de matériel roulant, ou de matériel d’infrastructure, l’enjeu principal de l’exploitation des données par les technologies « Big Data » consiste à mieux anticiper les problématiques d’usure, de maintenance ou encore de chaîne logistique

  • Pour les transporteurs et les gestionnaires d’infrastructure, l’enjeu sera d’identifier des cas d’usage permettant par exemple d’intensifier le trafic, d’améliorer la régularité ou d’augmenter la robustesse (résilience aux pannes et incidents) tout en gardant un même niveau de sécurité ; l’optimisation de la maintenance (maintenance prédictive) étant également un levier pour cela.

  • Pour les autorités de sécurité ferroviaire, l’exploitation des systèmes de reporting doit permettre de mieux définir les règles et conditions de fonctionnement pour l’ensemble des acteurs qu’elles encadrent

Toutefois, le choix des cas d’usages n’est pas simple :

  • Si l’on concentre l’analyse sur les accidents les plus graves, comme les déraillements ou les collisions, le volume des données est limité (ce nombre d’accidents étant - fort heureusement – rares). La faible volumétrie de données réduit les opportunités offertes par des technologies de type « machine learning » ; le grand nombre d’événements normaux par rapport aux accidents peut conduire dans l’analyse à surpondérer des signaux faibles constituer un « bruit » qui pollue les résultats et les rend moins concluants.
  • Il est plus efficace de concentrer l’analyse sur des évènements moins graves et plus nombreux, les cas d’usage sont alors liés à des incidents, qui ont un caractère anormal au regard des règles de sécurité, mais qui ne donnent pas forcément lieu à accident (vitesse excessive, dépassement d’un signal fermé). L’apport des technologies « Big Data » pour la sécurité est ici plus indirect (recherche de précurseurs, à défaut de causes) mais garde toute sa pertinence.
  • Pour choisir ces cas d’usages, BearingPoint propose notamment 5 critères de sélection :
  1. Pertinence pour les acteurs (la compréhension ou la prévention de ces incidents est suffisamment attractive pour justifier l’effort de collecte et de traitement des données)
  2. Compréhension préalable raisonnable de ces incidents (au moins d’un point de vue qualitatif, par exemple existence préalable d’une analyse « bow-tie » ou d’un arbre de causes), afin de faciliter la mise en œuvre opérationnelle des conclusions de la « data science »
  3. Nombre suffisant d’évènements (et donc du volume de données associé)
  4. Disponibilité des sources de données
  5. Définition claire de l’incident, de façon à distinguer de façon non ambiguë les événements (l’incident s’est réalisé) des non-événements

Chacune de ces analyses peut être réalisée de façon isolée par chacun des acteurs, en fonction de ses enjeux propres. Toutefois, une approche coordonnée entre les acteurs du ferroviaire sera plus fructueuse, en raison des interactions entre acteurs dans le système ferroviaire, et de la masse additionnelle de données potentiellement disponible.

3. De l’importance de coordonner les acteurs du ferroviaire dans leur démarche « Big Data »

La coordination entre les acteurs permet de :

  • Favoriser les synergies à la fois dans l’exploitation des données et le développement d’algorithmes pour des sujets de recherche pertinents pour différents acteurs
  • Définir l’échelon le plus pertinent pour mener à bien les analyses afin d’élargir les sources de données utiles & exploitables et limiter la multiplication des efforts de recherche

A ce titre, le secteur aérien apparaît aujourd’hui comme un secteur plus mature dans la collecte et le partage systématiques des événements de sécurité (solution ECCAIRS), et dans l’utilisation des « Big Data » & la coordination de ses acteurs, comme l’illustre le  programme D4S lancé par l’Agence Européenne de Sécurité Aérienne. De la même façon, l’Agence Ferroviaire Européenne engage une démarche équivalente :

  • Tout d’abord en enrichissant le reporting des accidents et incidents, dans le cadre d’une nouvelle réglementation « Common Occurrence Reporting » (dont la phase de consultation publique se termine prochainement)
  • Et en parallèle en examinant ce que pourrait être l’apport des technologies « Big data » et « Machine learning » (étude en cours)

Au-delà de l’exploitation des données existantes, certains imaginent déjà un train du futur[1] doté d’encore plus de capteurs, donc plus intelligent et meilleur communiquant, afin de toujours mieux collecter et analyser l’information… et ce toujours, pour une sécurité toujours plus forte des voyageurs !

Auteurs : François Lanquetot, Caroline Perrin, Laetitia Chatain, Eléonore Miédan-Gros

Vous pourriez aussi être intéressé par