ChatGPT a (quasi) réussi son examen de médecine aux Etats-unis ! Bientôt l’IA médecin ?

Article

Le logiciel à succès ChatGPT, qui génère des textes grâce à l'intelligence artificielle, a obtenu un score s'approchant de celui requis pour réussir un difficile examen de médecine aux Etats-Unis, selon une étude publiée hier.

La start-up californienne OpenAI a lancé en novembre dernier un robot conversationnel, qui fait sensation depuis. Facile à utiliser, il produit des textes -- rédactions, articles ou même poèmes -- sur simple requête.

Pour l'étude, publiée dans la revue PLOS Digital health, des chercheurs de l'entreprise AnsibleHealth ont testé les performances du logiciel sur un examen que doivent passer les étudiants en médecine aux Etats-Unis, et qui les interrogent sur divers domaines (connaissances scientifiques, raisonnement clinique, bioéthique...).

Dénommé USMLE (United States Medical Licensing Examination), cet examen est divisé en trois parties : la première passée après environ deux ans d'études, la deuxième au bout de quatre ans, et la troisième étant requise pour devenir médecin.

ChatGPT a été testé sur 350 des 376 questions publiées sur le site de l'USMLE et qui faisaient partie de l'examen de juin 2022. Les questions s'appuyant sur des images ont dû être retirées.

Elles étaient présentées sous trois formats : des questions ouvertes ("que serait le diagnostic pour ce patient compte tenu des informations présentées ?"), des questions à choix multiples sans justification ("Quelle est la prochaine étape de suivi la plus appropriée parmi les suivantes ?"), et des choix multiples avec justification (« Quelle est la raison la plus probable pour les symptômes nocturnes du patient ? Expliquez votre raisonnement").

Deux examinateurs ont noté le travail, et un troisième a tranché les écarts entre eux.

Le logiciel a obtenu un score situé entre 52,4% et 75% de bonnes réponses. Généralement, le score nécessaire pour réussir l'examen est de 60%.

"ChatGPT s'approche de la marge de réussite", conclut l'étude.

Elle "peut se révéler d'une grande aide pour les médecins lorsqu'ils formulent des diagnostiques et prescrivent des traitements"

Certains experts extérieurs ont critiqué la méthode utilisée. Les chercheurs auraient pu introduire un certain degré d'anonymisation en mélangeant des réponses d'humains à celles du robot, a estimé Nello Cristianini, professeur en intelligence artificielle à l'université de Bath au Royaume-Uni.

Il a malgré tout qualifié ces travaux comme faisant "partie d'une série de nouveaux développements enthousiasmants dans le domaine de l'intelligence artificielle" (IA).

https://www.whatsupdoc-lemag.fr/article/entend-souvent-que-les-passerelliens-finissent-derniers-aux-ecni-je-suis-fiere-de-mon

Selon Lucia Ortiz de Zarate, chercheuse à l'université autonome de Madrid, cette étude démontre "le potentiel de l'IA dans le domaine médical". Elle "peut se révéler d'une grande aide pour les médecins lorsqu'ils formulent des diagnostiques et prescrivent des traitements", a-t-elle jugé.

Fin janvier, une autre étude avait montré que ChatGPT pouvait réussir les examens d'une université de droit américaine -- quoiqu'en finissant dernier de la classe.

Avec AFP

ChatGPT a (quasi) réussi son examen de médecine aux Etats-unis ! Bientôt l’IA médecin ?

Elle "peut se révéler d'une grande aide pour les médecins lorsqu'ils formulent des diagnostiques et prescrivent des traitements"

A voir aussi

La sonobiopsie ou comment les ultrasons font parler les tissus sans les opérer

Covid long : et si ce n'était pas une seule maladie, mais plusieurs ?

Médecine science et recherche clinique - Paroles de patients

Médecine science et recherche clinique - Histoire de la recherche...

Médecine, Science et Recherche Clinique - L'innovation au service de la recherche

Démence : jusqu’à 45 % des risques pourraient être évités ou retardés, selon l’OMS

La Consult’ d’Antoine Tesnière : « L'objectif, c'est que la technologie redonne du temps de qualité aux soignants »

Psychiatrie : 20 % des effets indésirables graves surviennent dans les 48 premières heures d’hospitalisation

L'immersion sensorielle au service des patients et des soignants en réanimation

Laminopathie : à l’Institut de Myologie, la recherche veut percer les mystères du muscle

1 Légion d’honneur : une trentaine de médecins distingués dans la promotion 2026

2 Dr William Berrebi : « Le microbiote va révolutionner la médecine, les médecins doivent comprendre l’enjeu pour leurs patients »

3 L’épouse du Dr Jimmy Mohamed annonce une procédure de divorce et évoque des violences

4 Urgences saturées : pourquoi Poitiers tient quand les autres craquent

5 Toujours en exercice à 90 ans après 60 ans de carrière, le Dr Jean-Pierre Lyon juge la nouvelle génération

6 « Les gens veulent tout, tout de suite » : pourquoi ce généraliste breton a quitté son cabinet du jour au lendemain

Les gros dossiers

Médecins de VIP : quand la notoriété met les soins sous pression

Médecins de VIP : quand la notoriété met les soins sous pression

Le classement des CHU et des spécialités 2025-2026

Le classement des CHU et des spécialités 2025-2026

Le Conseil de l'Ordre et les médecins : la fissure ?

Le Conseil de l'Ordre et les médecins : la fissure ?

Soigner sous tension, violence ordinaire contre les médecins

Soigner sous tension, violence ordinaire contre les médecins

Médecins influenceurs : prescrire ou séduire ?

Médecins influenceurs : prescrire ou séduire ?

Classements des spés, des CHU et des groupes 2024-2025

Classements des spés, des CHU et des groupes 2024-2025

Fake News en médecine, anatomie du danger

Fake News en médecine, anatomie du danger

« Docteur je veux mourir ! »

« Docteur je veux mourir ! »