Détection multimodale du TSA par triage guidé par CVAE et classificateurs modulairesCVAE-guided triage and modular classifiers for multimodal ASD detection.
- Un module CVAE estime le risque de TSA à partir de réponses Q-CHAT incomplètes et identifie les cas à haut risque.
- Cinq classificateurs modaux sont développés pour l'IRM (structurelle et fonctionnelle), les expressions faciales, l'endoscopie gastro-intestinale, l'oculométrie/fNIRS, et les signaux de mouvements quotidiens.
- Les branches IRM utilisent un CNN 3D, un GCN pour la connectivité fonctionnelle, et un CNN temporel pour la dynamique rs-fMRI.
L'article propose un cadre modulaire innovant pour le dépistage multimodal du TSA avec des performances élevées sur des jeux de données séparés, mais la validation multimodale intégrée reste conceptuelle, ce qui limite son applicabilité clinique immédiate.
Les jeux de données publics ne fournissent pas toutes les modalités pour les mêmes sujets, donc l'étape de fusion finale n'est pas validée au niveau sujet. Les évaluations indépendantes sur des cohortes différentes limitent la généralisabilité. La stratégie de fusion tardive reste conceptuelle et non testée cliniquement. Possibles biais de sélection des données et absence de validation externe.
Nous proposons un cadre modulaire pour l'évaluation du trouble du spectre autistique (TSA) utilisant un module de triage par autoencodeur variationnel conditionnel (CVAE) basé sur le questionnaire Q-CHAT, suivi de cinq classificateurs spécialisés (IRM, expressions faciales, endoscopie gastro-intestinale, oculométrie/fNIRS, activités quotidiennes). Chaque module est entraîné indépendamment sur des cohortes spécifiques, avec des performances comprises entre 93% et 99%, mais la fusion finale reste conceptuelle en raison de l'absence de données multimodales chez les mêmes sujets.
Un module CVAE estime le risque de TSA à partir de réponses Q-CHAT incomplètes et identifie les cas à haut risque. Cinq classificateurs modaux sont développés pour l'IRM (structurelle et fonctionnelle), les expressions faciales, l'endoscopie gastro-intestinale, l'oculométrie/fNIRS, et les signaux de mouvements quotidiens. Les branches IRM utilisent un CNN 3D, un GCN pour la connectivité fonctionnelle, et un CNN temporel pour la dynamique rs-fMRI. La branche faciale utilise MediaPipe et un CNN avec attention. La branche ADL utilise un BiLSTM avec attention sur des caractéristiques temporelles. Les performances des classificateurs individuels vont de 93% à 99%. La fusion tardive finale n'est qu'une stratégie conceptuelle faute de données multimodales appariées.
Ce cadre modulaire pourrait permettre un dépistage plus rapide et plus précis du TSA en combinant différentes modalités. L'utilisation d'un module de triage réduit le nombre de cas nécessitant une évaluation complète. Les performances élevées suggèrent une applicabilité clinique future, mais une validation multimodale intégrée est nécessaire. L'approche pourrait être adaptée à d'autres troubles neurodéveloppementaux.
Modéré