En santé de précision, de nouvelles architectures émergent régulièrement en apprentissage automatique basé image en vue de résoudre des tâches de classification de pathologies, de localisation d’infections, de quantification de la gravité de maladies. En particulier, ces architectures produisent de façon automatique des primitives, des indicateurs, voire des diagnostics en vue de permettre aux radiologues et cliniciens la contre-vérification de leur analyse. Depuis l’apparition de la COVID-19, les recherches en santé intelligente se sont intensifiées et ont conduit à la production de diverses architectures d’analyse pathologique de type ensembliste, translationnelle et multitâche visant notamment à faciliter les diagnostics et à diminuer les délais jusqu'à l'initiation d’un traitement. Toutefois, la nouveauté des problématiques d’analyse pathologique abordées et les capacités limitées d’annotation et d’étiquetage des données rendent souvent compliquée la constitution de jeux d’apprentissage statistiquement représentatifs des types d’instances visés. Pour ces raisons, nous explorons de nouvelles pistes de recherche pour diversifier les données à travers des approches d’augmentation, notamment superpixeliques. De plus, de nouvelles approches exploitant dans les phases d’apprentissage des images et données de natures variées ont vu le jour comme celles basées sur l’apprentissage multimodal ou l’apprentissage auto-supervisé (e.g. foundation model). Ces architectures à investiguer se veulent plus génériques quant à leur capacité à traiter des données variées et peuvent même produire en sortie, non pas un élément servant au diagnostic, mais un rapport détaillé et précis du cas pathologique analysé.
L’objectif de ce GT est de fédérer une animation scientifique initiée en 2019 de façon tripartite (IRIMAS Mulhouse, CNRS IEMN Lille, IRSEEM Rouen) pour le diagnostic automatisé de pathologies en imagerie médicale notamment radiologique et microscopique. Le GT abordera ce thème en prenant appui sur des travaux matures issus de nos projets accessibles en ligne SuperpixelGridMasks sur l’axe augmentation d’images e.g. [1, 2] ainsi que ViTReg-IP et MViTReg-IP sur l’axe approfondissement de méthodes de régression pour l’estimation de la sévérité de pathologies e.g. [3,4,5], et DLBCL-Subtype, DLBCL-treatment-response sur l’axe apprentissage multimodal et transfert de connaissances de modèles de fondation pour le sous-typage de maladies et la prédiction de la réponse aux traitements e.g. [6,7]. Ce GT insufflera une dynamique autour de ces axes permettant de remonter à la communauté du GdR des débats et exposés en proposant des séminaires, d’une part par association aux journées que nous organisons avec nos laboratoires respectifs et d’autre part par l’organisation de journées au sein du GdR IASIS. Le GT produira une librairie python diffusée en libre accès pour l’augmentation superpixelique d’images ainsi qu’un article collectif en lien exposant nos avancées en image et IA multimodale pour le diagnostic automatisé de données radiographiques, voire d’une autre nature.
L’évaluation de la gravité des infections pulmonaires chez les patients est d’une grande importance pour le personnel médical afin de mettre en place un traitement efficace et adapté. Une méthode d’évaluation émergente repose sur l’analyse d’images biomédicales à l’aide de modèles d’intelligence artificielle. Ces modèles prennent des images en entrée et tentent de prédire un score pour chaque patient. Les scores prédits peuvent inclure : l’évaluation radiographique de l’opacité pulmonaire, l’évaluation radiographique de l’œdème pulmonaire, ou encore le score Brixia pour la gravité de la COVID-19.
Toute personne intéressée par des problématiques liées aux solutions d’IA émergentes est la bienvenue pour participer.
L’objectif de ce défi est de construire un modèle prenant en entrée une radiographie thoracique afin de prédire un score de gravité pour un patient donné, selon le score RALO (Radiographic Assessment of Lung Opacity). Chaque image disposera d’un score d’opacité pulmonaire et d’un score d’étendue géographique, chacun variant de 0 à 8, que l’algorithme devra prédire.
Les données utilisées proviendront des jeux de données RALO et BrixIA. Un jeu de test à l’aveugle devra être créé. Les licences des données devront être vérifiées.
Les modèles seront évalués à l’aide de la perte L1 (ou erreur absolue moyenne). En cas d’égalité, le coefficient de corrélation de Pearson sera utilisé. En cas de nouvelle égalité, l’erreur quadratique moyenne (MSE) sera prise en compte.
Le modèle fourni atteint une performance moyenne de 0,889 MAE avec un coefficient de corrélation de 0,824 pour le score GE (étendue géographique) sur le jeu de test RALO, et une MAE de 0,826 avec un coefficient de corrélation de 0,715 pour le score LO (opacité pulmonaire) du même jeu de test. Le test utilisé durant la phase de classement public est défini ici.
Les résultats doivent être reproductibles.