Le chatbot d'IA de Google a réussi de justesse l’examen de médecine américain

Article

Le chatbot médical d'intelligence artificielle de Google a réussi l'examen de médecine aux États-Unis, mais ses résultats restent en deçà de ceux des humains, indique une étude publiée hier dans Nature.

L'année dernière, la sortie de ChatGPT --dont le développeur OpenAI est soutenu par le rival de Google, Microsoft-- a lancé une course entre les géants de la technologie dans le domaine en plein essor de l'IA.

La santé est un domaine où la technologie a déjà montré des progrès tangibles, certains algorithmes se révélant capables de lire des scanners médicaux mieux que les humains.

Google avait dévoilé son outil d'IA dédié aux questions médicales, appelé Med-PaLM, dans un article en pré-publication, en décembre.

Contrairement à ChatGPT, il n'a pas été ouvert au grand public.

Google affirme que Med-PaLM a été le premier grand modèle de langage, une technique d'IA entraînée sur de grandes quantités de texte produit par l'homme, à réussir l'USMLE (US Medical Licensing Examination).

La réussite de cet examen permet d’exercer la médecine aux États-Unis. Pour y parvenir, il faut obtenir un score de 60% environ. En février, une étude avait révélé que ChatGPT avait obtenu des résultats plutôt satisfaisants à l'examen.

Dans une nouvelle étude, évaluée par les pairs et publiée hier dans la revue Nature, les chercheurs de Google ont déclaré que Med-PaLM avait atteint 67,6% en répondant aux questions à choix multiples de style USMLE.

Selon le Wall Street Journal, Med-PaLM 2 serait en test dans le prestigieux hôpital de recherche américain Mayo Clinic depuis avril

Ces résultats sont "encourageants, mais restent inférieurs à ceux des humains", indique l'étude.

Pour identifier et réduire ce que l'on appelle les "hallucinations" --le mot qui désigne une réponse manifestement fausse proposée par un modèle d'IA--, Google a indiqué avoir développé une nouvelle référence d'évaluation.

Karan Singhal, chercheur chez Google et auteur principal de la nouvelle étude, a expliqué à l'AFP que son équipe avait testé une version plus récente du modèle.

https://www.whatsupdoc-lemag.fr/article/chatgpt-est-plus-empathique-et-plus-pertinent-dans-ses-reponses-que-les-medecins

Med-Palm 2 aurait atteint le score de 86,5% à l'examen USMLE, dépassant la version précédente de près de 20%, selon une étude publiée en mai qui n'a pas été évaluée par des pairs.

Selon le Wall Street Journal, Med-PaLM 2 serait en test dans le prestigieux hôpital de recherche américain Mayo Clinic depuis avril.

Tout test effectué avec Med-PaLM 2 ne sera pas "clinique, ni face au patient, ni susceptible de nuire aux patients", a assuré Karan Singhal. Le modèle sera plutôt testé pour des "tâches administratives qui peuvent être automatisées relativement facilement, avec de faibles enjeux", a-t-il ajouté.

Avec AFP

Le chatbot d'IA de Google a réussi de justesse l’examen de médecine américain

Selon le Wall Street Journal, Med-PaLM 2 serait en test dans le prestigieux hôpital de recherche américain Mayo Clinic depuis avril

A voir aussi

Ne dites plus SOPK mais SMOP : un changement de nom qui réoriente toute la prise en charge

Diagnostiquer Alzheimer par le sang : un nouveau test de Roche obtient la certification européenne

Hantavirus : où en est la recherche de traitements ?

Les humains sont inégaux face aux piqûres de moustiques, et on commence vraiment à comprendre pourquoi

Autisme : la stimulation magnétique cérébrale pourrait aider les enfants à mieux communiquer

Diagnostic préimplantatoire et anomalies chromosomiques : les enjeux scientifiques et éthiques du DPI‑A

Cancer : pourquoi les thérapies ciblées ne tiennent pas toujours leurs promesses

Pourquoi est‑il déconseillé de boire de l’alcool quand on prend des médicaments ?

Contre le glioblastome, la tumeur cérébrale la plus fréquente, la piste du cytomégalovirus

Après un long point mort, de nouvelles pistes pour améliorer la survie dans le cancer du pancréas

1 A 30 ans, il décède après une dissection aortique non diagnostiquée : deux médecins jugés pour homicide involontaire au Puy-en-Velay

2 Une patiente de 21 ans décédée d’une péritonite dans une clinique du Havre : deux médecins jugés pour homicide involontaire

3 Un interne en psychiatrie exclu 70 jours après s’être endormi pendant ses gardes

4 Dépassements d'honoraires : quelles spécialités font vraiment monter la note ?

5 Ne dites plus SOPK mais SMOP : un changement de nom qui réoriente toute la prise en charge

6 À l’hôpital, le salaire moyen des médecins recule à 6 926€ nets en moyenne

Les gros dossiers

Le classement des CHU et des spécialités 2025-2026

Le classement des CHU et des spécialités 2025-2026

Le Conseil de l'Ordre et les médecins : la fissure ?

Le Conseil de l'Ordre et les médecins : la fissure ?

Soigner sous tension, violence ordinaire contre les médecins

Soigner sous tension, violence ordinaire contre les médecins

Médecins influenceurs : prescrire ou séduire ?

Médecins influenceurs : prescrire ou séduire ?

Classements des spés, des CHU et des groupes 2024-2025

Classements des spés, des CHU et des groupes 2024-2025

Fake News en médecine, anatomie du danger

Fake News en médecine, anatomie du danger

« Docteur je veux mourir ! »

« Docteur je veux mourir ! »

Veni vidi verdi

Veni vidi verdi