Les chercheurs ont posé 200 questions médicales à des vrais médecins humains puis à ChatGPT, le robot conversationnel d’OpenAI, (mais oui vous savez, cette IA qui a réponse à tout). Mais en plus de juger de la pertinence des réponses et de la justesse, c’est l’empathie envers les patients qui a été prise en compte.
La question était : est-ce que les robots sont plus à l’écoute et capables de gérer les émotions des patients que les praticiens humains ?
Donc 200 questions ont été soumises, puis les réponses ont ensuite été analysées à l’aveugle par des équipes cliniques (un psychiatre, un pédiatre, un oncologue, un infectiologue, une médecin généraliste et un expert en médecine préventive) en tenant compte de deux critères, notés chacun de 1 à 5 : la qualité de l’information fournie et l’empathie démontrée.
Les résultats de l’étude ont été publiés dans le JAMA Network et repris par le média américain Axios, et ils sont implacables : l’intelligence artificielle a été plébiscitée lors des évaluations, ses réponses ont été choisies dans 80% des cas. Oui, oui, dans près de quatre cas sur cinq, les réponses de ChatGPT ont été préférées à celle d’un médecin humain.
« L’IA de ChatGPT est meilleure que les médecins, car elle n’est pas limitée par le temps »
Dans le détail, en termes de qualité, les réponses de ChatGPT ont obtenu un score de 78% de réponses « bonnes » ou « très bonnes », quand les médecins plafonnent à 22% pour ces mêmes appréciations.
Et encore plus rageant, pour l’empathie, ChatGPT a obtenu dans 45% des questions la meilleur note, quand pour les médecins c’est seulement pour 4,6% des réponses. Donc oui le robot s’est montré 10 fois plus empathique que l’humain.
Le directeur de la recherche John Ayers, a avancé une explication : « La raison pour laquelle l’IA était meilleure est assez évidente. Elle n’est pas limitée par le temps ». Et les médecins ne sont peut-être pas les meilleurs pour taper leurs réponses derrière leur clavier, d’où un côté un peu plus expéditif. Par exemple, dès qu’un patient mentionne une céphalée, ChatGPT, avant toute chose, répond automatiquement : « Désolé pour votre mal de tête ». Alors que le doc humain, ne perd pas son temps et enchaine tout de suite sur le questionnaire médical.
Rappelons-nous déjà qu’en février dernier, ChatGPT avait échoué de très peu à un examen de médecine aux Etats-Unis.
En tous les cas, cette étude montre qu’on n’a pas fini de parler de l’IA en Santé…