Thyro-LMD: A Benchmark Dataset and Sample-Driven Data Loading, Attention, and Regularization for Long-Tailed Multi-Label Thyroid Ultrasound Diagnosis.
Contexte : Les méthodes actuelles d'aide au diagnostic (CAD) en imagerie ultrasonore de la thyroïde (TUS) se concentrent principalement sur la classification binaire ou multi-classe, alors que le diagnostic clinique réel repose sur des combinaisons de descripteurs standardisés, entraînant des distributions longues en queue. Ces distributions limitent la robustesse et la généralisation des modèles existants. Objectif : Créer un ensemble de données (Thyro-LMD) et proposer une architecture (SynTUS-Net) pour gérer les défis des distributions longues en queue dans le diagnostic multi-étiquette de la TUS. Méthode : Thyro-LMD, aligné sur les lexiques ACR TI-RADS, intègre des annotations fines basées sur l'histopathologie. SynTUS-Net combine des modules collaboratifs pour l'encodage des caractéristiques, la régularisation des prédictions et le chargement des données, visant à améliorer les performances sur les classes rares. Résultats : SynTUS-Net dépasse les modèles existants (5,3 points de Micro-F1 et 11,83 de Macro-F1) et GPT-4o (42,76 points de Tail-F1), démontrant une amélioration significative pour les classes de queue. Intérêt clinique : Thyro-LMD et SynTUS-Net offrent un benchmark cliniquement pertinent pour l'IA interprétable en ultrason, facilitant des diagnostics plus précis et généralisables selon les guidelines standardisés. Limites : L'analyse repose uniquement sur l'abstract, limitant les détails sur la méthodologie et les applications spécifiques. La généralisation à d'autres populations ou pathologies reste à valider.
Benchmark Thyro-LMD pour les diagnostics multi-étiquettes en TUS SynTUS-Net : architecture innovante pour les distributions longues en queue Amélioration de 42,76 points de Tail-F1 par rapport à GPT-4o Alignement avec les lexiques ACR TI-RADS pour une standardisation clinique
Meilleure détection des pathologies rares en TUS grâce à une gestion optimisée des distributions longues en queue Outils pour des diagnostics plus alignés avec les guidelines standardisés en imagerie médicale Potentiel d'amélioration de la généralisation des modèles d'IA en contexte clinique
Absence de données détaillées sur la validation clinique externe Focalisation sur la thyroïde, limitant la portée à d'autres organes Dépendance aux annotations histopathologiques, potentiellement biaisées
Preprint