Groupe de Travail
« Image et IA Multimodale
pour le Diagnostic de pathologies Pulmonaires»

GT-I2MDP du GDR-IASIS

Karim Hammoudi, Université de Haute-Alsace, IRIMAS

Halim Benhabiles, IMT Nord Europe, CERI SN

Adnane Cabani, Université Rouen Normandie, ESIGELEC, IRSEEM

Motivation

En santé de précision, de nouvelles architectures émergent régulièrement en apprentissage automatique basé image en vue de résoudre des tâches de classification de pathologies, de localisation d’infections, de quantification de la gravité de maladies. En particulier, ces architectures produisent de façon automatique des primitives, des indicateurs, voire des diagnostics en vue de permettre aux radiologues et cliniciens la contre-vérification de leur analyse. Depuis l’apparition de la COVID-19, les recherches en santé intelligente se sont intensifiées et ont conduit à la production de diverses architectures d’analyse pathologique de type ensembliste, translationnelle et multitâche visant notamment à faciliter les diagnostics et à diminuer les délais jusqu'à l'initiation d’un traitement. Toutefois, la nouveauté des problématiques d’analyse pathologique abordées et les capacités limitées d’annotation et d’étiquetage des données rendent souvent compliquée la constitution de jeux d’apprentissage statistiquement représentatifs des types d’instances visés. Pour ces raisons, nous explorons de nouvelles pistes de recherche pour diversifier les données à travers des approches d’augmentation, notamment superpixeliques. De plus, de nouvelles approches exploitant dans les phases d’apprentissage des images et données de natures variées ont vu le jour comme celles basées sur l’apprentissage multimodal ou l’apprentissage auto-supervisé (e.g. foundation model). Ces architectures à investiguer se veulent plus génériques quant à leur capacité à traiter des données variées et peuvent même produire en sortie, non pas un élément servant au diagnostic, mais un rapport détaillé et précis du cas pathologique analysé.

Objectifs

L’objectif de ce GT est de fédérer une animation scientifique initiée en 2019 de façon tripartite (IRIMAS Mulhouse, CNRS IEMN Lille, IRSEEM Rouen) pour le diagnostic automatisé de pathologies en imagerie médicale notamment radiologique et microscopique. Le GT abordera ce thème en prenant appui sur des travaux matures issus de nos projets accessibles en ligne SuperpixelGridMasks sur l’axe augmentation d’images e.g. [1, 2] ainsi que ViTReg-IP et MViTReg-IP sur l’axe approfondissement de méthodes de régression pour l’estimation de la sévérité de pathologies e.g. [3,4,5], et DLBCL-Subtype, DLBCL-treatment-response sur l’axe apprentissage multimodal et transfert de connaissances de modèles de fondation pour le sous-typage de maladies et la prédiction de la réponse aux traitements e.g. [6,7]. Ce GT insufflera une dynamique autour de ces axes permettant de remonter à la communauté du GdR des débats et exposés en proposant des séminaires, d’une part par association aux journées que nous organisons avec nos laboratoires respectifs et d’autre part par l’organisation de journées au sein du GdR IASIS. Le GT produira une librairie python diffusée en libre accès pour l’augmentation superpixelique d’images ainsi qu’un article collectif en lien exposant nos avancées en image et IA multimodale pour le diagnostic automatisé de données radiographiques, voire d’une autre nature.

Challenge : Défi de notation automatique de la gravité des infections pulmonaires

L’évaluation de la gravité des infections pulmonaires chez les patients est d’une grande importance pour le personnel médical afin de mettre en place un traitement efficace et adapté. Une méthode d’évaluation émergente repose sur l’analyse d’images biomédicales à l’aide de modèles d’intelligence artificielle. Ces modèles prennent des images en entrée et tentent de prédire un score pour chaque patient. Les scores prédits peuvent inclure : l’évaluation radiographique de l’opacité pulmonaire, l’évaluation radiographique de l’œdème pulmonaire, ou encore le score Brixia pour la gravité de la COVID-19.

Toute personne intéressée par des problématiques liées aux solutions d’IA émergentes est la bienvenue pour participer.

L’objectif de ce défi est de construire un modèle prenant en entrée une radiographie thoracique afin de prédire un score de gravité pour un patient donné, selon le score RALO (Radiographic Assessment of Lung Opacity). Chaque image disposera d’un score d’opacité pulmonaire et d’un score d’étendue géographique, chacun variant de 0 à 8, que l’algorithme devra prédire.

Les données utilisées proviendront des jeux de données RALO et BrixIA. Un jeu de test à l’aveugle devra être créé. Les licences des données devront être vérifiées.

Les modèles seront évalués à l’aide de la perte L1 (ou erreur absolue moyenne). En cas d’égalité, le coefficient de corrélation de Pearson sera utilisé. En cas de nouvelle égalité, l’erreur quadratique moyenne (MSE) sera prise en compte.

Le modèle fourni atteint une performance moyenne de 0,889 MAE avec un coefficient de corrélation de 0,824 pour le score GE (étendue géographique) sur le jeu de test RALO, et une MAE de 0,826 avec un coefficient de corrélation de 0,715 pour le score LO (opacité pulmonaire) du même jeu de test. Le test utilisé durant la phase de classement public est défini ici.

Les résultats doivent être reproductibles.

Plan de travail prévisionnel

Références

[1] K. Hammoudi, A. Cabani, B. Slika et al., SuperpixelGridMasks Data Augmentation: Application to Precision Health and Other Real-world Data, J Healthc Inform Res 6, pp 442–460, 2022. doi: 10.1007/s41666-022-00122-1

[2] F. Dornaika, D. Sun, K. Hammoudi, J. Charafeddine, A. Cabani, C. Zhang, Object-centric Contour-aware Data Augmentation Using Superpixels of Varying Granularity, Pattern Recognition, Volume 139, 2023. doi: 10.1016/j.patcog.2023.109481

[3] K. Hammoudi, H. Benhabiles, M. Melkemi et al., Deep Learning on Chest X-ray Images to Detect and Evaluate Pneumonia Cases at the Era of COVID-19, J Med Syst 45, 75, 2021. doi: 10.1007/s10916-021-01745-4

[4] B. Slika, F. Dornaika and K. Hammoudi, Multi-Score Prediction for Lung Infection Severity in Chest X-Ray Images, IEEE Transactions on Emerging Topics in Computational Intelligence, vol. 9, no. 2, pp. 2052-2058, 2025. doi: 10.1109/TETCI.2024.3359082

[5] B. Slika, F. Dornaika, F. Bougourzi, K. Hammoudi, Transformer-Based Lung Infection Severity Prediction with Cross Attention and Conditional TransMix Augmentation, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops, Nashville, Tennessee, USA, June 2025. (to appear)

[6] B. Guetarni, F. Windal, H. Benhabiles et al., A Vision Transformer-Based Framework for Knowledge Transfer From Multi-Modal to Mono-Modal Lymphoma Subtyping Models, IEEE Journal of Biomedical and Health Informatics, vol. 28, no. 9, pp. 5562-5572, 2024. doi: 10.1109/JBHI.2024.3407878

[7] B. Guetarni, F. Windal, H. Benhabiles et al., Histopathology Image Embedding Based on Foundation Models Features Aggregation for DLBCL Patient Treatment Response Prediction, International Workshop on Medical Optical Imaging and Virtual Microscopy Image Analysis (MICCAI workshop), LNCS Springer, pp. 150-159, 2024. doi: 10.1007/978-3-031-77786-8_15.