Google réussi l'examen de médecine avec son nouveau robot conversationnel Med-PaLM

Les avancées dans le domaine de l'intelligence artificielle (IA) sont impressionnantes, et Google est en première ligne avec Med-PaLM son nouveau chatbot médical, ou robot conversationnell. Ce logiciel d'IA a récemment réussi l'examen de médecine aux États-Unis. Mais ses résultats restent en deçà de ceux des humains, indique une étude publiée mercredi dans Nature.

PaLM 2 (Pathways Language Model 2) est un modèle de langage d’IA signé Google, doté de capacités étendues en matière de raisonnement, de langage et de codage. Il peut être affiné pour créer des modèles plus spécialisés comme Med-PaLM 2 pour le diagnostic médical. Il est également le moteur derrière le chatbot Google Bard

Les résultats obtenus par Med-PaLM à l'examen de médecine américain sont encourageants. Pour exercer la médecine aux États-Unis, un score d'environ 60 % est requis. En février, ChatGPT avait obtenu des résultats satisfaisants à cet examen. Dans une nouvelle étude évaluée par les pairs et publiée mercredi dans la revue Nature, les chercheurs de Google ont annoncé que Med-PaLM avait atteint un score de 67,6 % en répondant aux questions à choix multiples de style USMLE.

Pour améliorer le modèle et éviter les réponses erronées, Google a développé une nouvelle référence d'évaluation. Une version plus récente du modèle, Med-PaLM 2, aurait atteint un score impressionnant de 86,5 % à l'examen USMLE, dépassant ainsi la version précédente de près de 20 %, selon une étude publiée en mai mais non encore évaluée par des pairs.

Actuellement en test à la Mayo Clinic, Med-PaLM 2 sera utilisé principalement pour des tâches administratives automatisées à faible enjeu, sans implication directe avec les patients et sans risque de nuire à ces derniers.

La santé est un secteur où l'IA a déjà démontré des progrès tangibles. Des algorithmes sont capables de lire des scanners médicaux avec une précision supérieure à celle des médecins. Google avait dévoilé son outil d'IA dédié aux questions médicales déjà en décembre. Contrairement à ChatGPT, un concurrent soutenu par Microsoft, Med-PaLM n'a pas été ouvert au grand public.

  • Singhal, K., Azizi, S., Tu, T. et al. Large language models encode clinical knowledge. Nature (2023). https://doi.org/10.1038/s41586-023-06291-2

Vous souhaitez commenter cet article ?

L'accès à la totalité des fonctionnalités est réservé aux professionnels de la santé.

Si vous êtes un professionnel de la santé vous devez vous connecter ou vous inscrire gratuitement sur notre site pour accéder à la totalité de notre contenu.
Si vous êtes journaliste ou si vous souhaitez nous informer écrivez-nous à redaction@rmnet.be.