Retour aux articles
TDAHAnglaismixteSource tier 1Semantic Scholar — neurodeveloppement transverse

Précision et reproductibilité des réponses de ChatGPT aux questions des parents et des patients sur le trouble du déficit de l'attention avec hyperactivitéAccuracy and reproducibility of ChatGPT responses to parent and patient inquiries on attention-deficit/hyperactivity disorder

ModéréNiveau de preuveSource tier 1Fiabilité sourceDOIRéférence disponible
À retenir
  • 59,1% des réponses de ChatGPT sur le TDAH sont complètes/correctes, 27,3% incomplètes et 13,6% mixtes/potentiellement trompeuses.
  • La précision est la plus élevée pour les questions de connaissances de base (66,7%) et la plus faible pour le traitement/médicaments (47,6%).
  • La reproductibilité des réponses est de 87,5%, sans différence significative entre les domaines.
Lecture clinique

Article directement pertinent pour le TDAH et l'utilisation de l'IA en clinique, avec une méthodologie claire mais des limites modérées. Note de 80/100 car il apporte des données empiriques utiles pour la pratique.

Étude transversale avec un seul modèle de langage (GPT-4o) et un nombre limité de questions (88). Évaluation qualitative par deux psychiatres avec un accord inter-juges modéré (κ=0,52). Les questions proviennent de sources en ligne et peuvent ne pas représenter toutes les préoccupations des patients. Aucune analyse comparative avec d'autres modèles d'IA ou avec des réponses de professionnels de santé.

TDAHNeurodéveloppementtdahchatgptintelligence artificiellepsychiatrie de l'enfantinformation aux patients
Résumé IA

Cette étude transversale évalue la précision et la reproductibilité des réponses de ChatGPT (GPT-4o) à 88 questions fréquemment posées par des parents et patients sur le TDAH. Les questions couvraient les connaissances de base, le diagnostic, le traitement et les résultats à long terme. Deux psychiatres pour enfants et adolescents ont évalué indépendamment les réponses. Résultats : 59,1 % des réponses étaient complètes/correctes, 27,3 % incomplètes, et 13,6 % mixtes ou potentiellement trompeuses. La précision était la plus élevée pour les connaissances de base (66,7 %) et la plus faible pour le traitement (47,6 %). La reproductibilité globale était de 87,5 %. Les résultats suggèrent une utilité potentielle mais soulignent des limitations importantes, notamment dans les domaines cliniquement sensibles.

Points clés

59,1% des réponses de ChatGPT sur le TDAH sont complètes/correctes, 27,3% incomplètes et 13,6% mixtes/potentiellement trompeuses. La précision est la plus élevée pour les questions de connaissances de base (66,7%) et la plus faible pour le traitement/médicaments (47,6%). La reproductibilité des réponses est de 87,5%, sans différence significative entre les domaines. Aucune réponse inexacte ou non pertinente n'a été identifiée dans l'échantillon de 88 questions. ChatGPT montre une utilité potentielle pour des informations générales mais nécessite une interprétation prudente dans les domaines cliniques sensibles.

Implications cliniques

Les cliniciens peuvent utiliser ChatGPT comme un outil complémentaire pour fournir des informations de base sur le TDAH, mais ne doivent pas s'y fier pour des conseils thérapeutiques spécifiques. Dans les domaines du traitement et des médicaments, les réponses de ChatGPT peuvent être incomplètes ou ambiguës, nécessitant une supervision clinique professionnelle. Les parents et patients doivent être informés des limites des chatbots IA et encouragés à consulter un professionnel de santé pour des décisions cliniques.

Niveau de preuve

Modéré

Partager