Comparaison des algorithmes K-Means, HDBSCAN et de clustering hiérarchique (Gower) pour le regroupement des profils de troubles du spectre autistique (TSA)Comparison of K-Means, HDBSCAN, and Hierarchical Clustering (Gower) Algorithms for Clustering Autism Spectrum Disorder (ASD) Profile Data
- K-means donne la meilleure structure de partition pour les données numériques structurées.
- HDBSCAN identifie efficacement les cas atypiques ou rares (19,8% de bruit).
- Le clustering hiérarchique avec distance de Gower intègre des variables catégorielles cliniques.
L'article est pertinent pour NeuroWatch car il aborde la classification de sous-groupes de TSA à l'aide de méthodes de clustering, ce qui peut aider à la caractérisation clinique. Cependant, il s'agit d'une étude méthodologique sans validation clinique directe, ce qui réduit son applicabilité immédiate. Note modérée (65).
La taille de l'échantillon (500) est relativement modeste. Les métriques de validation (silhouette, CH) sont faibles, indiquant une séparation modérée des clusters. L'étude ne valide pas cliniquement les clusters obtenus (ex., pronostic ou réponse au traitement). Les résultats dépendent des caractéristiques spécifiques du jeu de données ; généralisation limitée.
Cette étude compare trois algorithmes de clustering (K-means, HDBSCAN, et clustering hiérarchique avec distance de Gower) pour identifier des sous-groupes dans des données de TSA. L'analyse a porté sur 500 enregistrements comprenant des variables démographiques, symptomatiques et développementales. Les résultats montrent que K-means offre la meilleure partition globale (silhouette = 0,1775), HDBSCAN détecte 19,8% de bruit (utile pour les cas atypiques), et le clustering hiérarchique-Gower intègre des variables catégorielles pour une segmentation plus interprétable cliniquement. Aucun algorithme n'est universellement optimal ; le choix doit dépendre des objectifs.
K-means donne la meilleure structure de partition pour les données numériques structurées. HDBSCAN identifie efficacement les cas atypiques ou rares (19,8% de bruit). Le clustering hiérarchique avec distance de Gower intègre des variables catégorielles cliniques. Aucun algorithme n'est universellement optimal ; le choix dépend des objectifs analytiques. L'étude utilise un jeu de données validé de 500 enregistrements avec 24 caractéristiques.
Les cliniciens peuvent utiliser ces méthodes pour identifier des sous-groupes homogènes de patients TSA. HDBSCAN peut aider à repérer les patients présentant des profils atypiques nécessitant une attention particulière. L'intégration de variables catégorielles (par ex., diagnostics, comorbidités) améliore l'interprétation clinique des clusters. Aucune méthode unique n'est suffisante ; une approche combinée peut être bénéfique.
Élevé