Analyse computationnelle et classification automatisée du discours sur les troubles alimentaires dans la communauté EDTWT de TwitterComputational analysis and automated classification of eating disorder discourse on Twitter's EDTWT community.
- L'engagement des utilisateurs est très inégal : 62,1% des utilisateurs ne postent qu'une seule fois, tandis que les 10% les plus actifs produisent 48,9% du contenu.
- Les variations temporelles montrent un pic d'activité le vendredi soir (7,5 fois plus que le mardi matin) et des pics nocturnes entre 21h et 23h.
- Les mots-clés cliniques (image corporelle, restriction alimentaire, rétablissement) apparaissent dans 26,6% des tweets.
L'article traite d'un sujet clinique pertinent (troubles alimentaires) mais se concentre sur l'analyse de discours sur Twitter plutôt que sur des aspects neuropsychologiques ou développementaux au cœur de NeuroWatch. L'intérêt est modéré car il propose des méthodes utiles pour la surveillance numérique en santé mentale, mais n'apporte pas de données directement exploitables en pratique clinique neuropsychologique.
L'étude ne porte que sur les tweets publics, excluant les interactions privées et les utilisateurs non actifs. Les données sont limitées à la plateforme Twitter et peuvent ne pas être représentatives d'autres réseaux sociaux ou de la population générale. La performance du classificateur est modérée pour les catégories rares (macro F1 global de 0,753), ce qui peut limiter la fiabilité pour certaines sous-catégories. La classification du sentiment et des thèmes repose sur des méthodes automatisées pouvant introduire des biais. L'étude n'évalue pas l'impact clinique réel des interventions suggérées.
Cette étude analyse 48 341 tweets de la communauté EDTWT (Eating Disorder Twitter) sur trois ans (2022-2025). L'engagement est très inégal : 10% des utilisateurs produisent 48,9% du contenu. Les pics de publication surviennent le vendredi soir et entre 21h et 23h. Les mots-clés cliniques (image corporelle, restriction alimentaire, rétablissement) apparaissent dans 26,6% des tweets. Le sentiment général est légèrement positif. Un modèle de classification automatique par ensemble atteint un macro F1 de 0,753, surpassant un modèle biomédical de 21,4% pour les catégories rares. L'étude identifie une hétérogénéité du discours, mêlant contenus pro-TCA, rétablissement et sous-communautés linguistiques. La concentration de l'activité chez quelques utilisateurs permet un ciblage clinique et une modération scalable.
L'engagement des utilisateurs est très inégal : 62,1% des utilisateurs ne postent qu'une seule fois, tandis que les 10% les plus actifs produisent 48,9% du contenu. Les variations temporelles montrent un pic d'activité le vendredi soir (7,5 fois plus que le mardi matin) et des pics nocturnes entre 21h et 23h. Les mots-clés cliniques (image corporelle, restriction alimentaire, rétablissement) apparaissent dans 26,6% des tweets. Le sentiment moyen est légèrement positif (0,060 sur une échelle de -1 à 1) avec une subjectivité modérée (0,298). Dix thèmes ont été identifiés, dont le comptage calorique (13,2%), des sous-communautés espagnole (9,7%) et polonaise (8,2%), et le discours de rétablissement (9,4%). Un classificateur automatique par ensemble atteint une performance robuste (macro F1=0,753, κ=0,703), surpassant un modèle biomédical de 21,4% pour les catégories les plus rares.
L'identification des utilisateurs très actifs (top 10%) permet un ciblage préventif et un soutien personnalisé pour les personnes à risque élevé. La classification automatique du contenu (pro-TCA, rétablissement, etc.) facilite une modération des plateformes fondée sur des preuves. Les pics d'activité nocturnes et en fin de semaine peuvent indiquer des moments opportuns pour des interventions numériques. La sous-représentation des communautés non anglophones souligne le besoin de modèles multilingues en santé mentale numérique.
Modéré