Capteurs passifs (caméras et microphones)

Depuis plusieurs années, de nombreuses équipes de recherche tentent d'apporter un certain niveau d'automatisation des systèmes de vidéo surveillance installés dans les stations et gares de grands réseaux et un peu plus récemment dans les matériels roulants (train, autobus, tramway). Pour les exploitants et les autorités organisatrices, cette automatisation a deux objectifs :

  • développer des connaissances précises relatives à la manière dont les usagers empruntent leur réseau ;
  • améliorer la sécurité et la sûreté des usagers en détectant certaines situations critiques, allégeant ainsi la tâche de surveillance des agents et réduisant dans le même temps le risque qu'une intervention ne leur échappe et la gravité de l'événement.


Du point de vue fonctionnel, automatiser de tels systèmes nécessite de définir le comportement et le déplacement des usagers ou des groupes d'usagers à partir du traitement et de l'analyse des images fournies par les caméras du système. Ce travail est réalisé en gardant à l'esprit qu'à moyen terme, les caméras sont ou seront connectées en réseau qu'il sera indispensable de munir d'une capacité de traitement.

Trois étapes sont nécessaires pour développer de telles fonctions : la segmentation précise des régions d'intérêt, leur caractérisation et  leur suivi au cours du temps lorsque les objets se déplacent devant une caméra ou d'une caméra à une autre. De nombreux verrous scientifiques rendent ces différentes étapes difficiles à réaliser. Ces verrous sont dûs aux contraintes liées aux environnements de transport considérés et tout particulièrement aux environnements embarqués. Parmi elles, nous pouvons citer :

  • la mobilité qui génère des variations rapides de la luminosité et une instabilité des scènes observées dûe aux vibrations du véhicule ;
  • le confinement à bord de véhicules qui provoque l'occultation partielle ou complète des caméras et rend les objets non complètement observables ;
  • la complexité algorithmique et le temps de traitement des solutions proposées qui sont le plus souvent élevés et requièrent des capacités de traitement incompatibles avec le "temps-réel" ;
  • l'analyse des images dans le respect de la vie privée et conformément aux lois en vigueur.


Nous avons proposé d'analyser ces scènes en utilisant conjointement les modes de perception audio et vidéo, afin que, dans certaines situations, l'une des deux modalités compense les faiblesses de l'autre et pour bénéficier d'informations redondantes.

Le problème de l'analyse et l'interprétation de l'ambiance sonore a été énoncé dans le contexte embarqué (autobus et train). Il a été étudié  sous l'angle de l'analyse de données (contexte non supervisé) et de la modélisation/classification supervisée des données. Placé dans un contexte bruité et réverberrant, il s'agit d'un problème complexe et non encore résolu à ce jour. La solution proposée est d'exploiter un réseau de microphones qui permet non seulement de mieux couvrir l'enceinte du véhicule mais également d'étudier la manière de localiser, de réhausser puis d'identifier les mélanges de sources sonores.

Récemment, l'équipe s'est intéressée à la manière dont la surveillance vidéo et son automatisation pouvaient mener à une amélioration du niveau de sécurité des passages à niveau, environnement très accidentogène. Le système proposé exploite une perception stéréoscopique qui permet de reconstruire en trois dimensions la trajectoire des différents mobiles en intéraction avec cette zone ferroviaire. Dans cette étude, il s'agit d'adapter des travaux similaires menés au LEOST dans le contexte routier tout particulièrement pour des applications d'aide à la conduite.

 

 

Personnels impliqués

CR : Sébastien Ambellouis, Cyril Meurie, David Sodoyer
IE : Amaury Flancquart