Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé

26 mars 2026 - 19:08,
Actualité - Rédaction, DSIH
Illustration Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé
Dans un contexte réglementaire européen exigeant, qui garantit un accès et un partage sécurisés des données de santé, le projet PARTAGES apporte une réponse opérationnelle aux défis posés à l’IA en santé. Coordonné par la Plateforme des données de santé (Health Data Hub) et réunissant 32 partenaires français, PARTAGES publie en open data un corpus inédit de plus de 6 000 comptes rendus médicaux de patients fictifs, rédigés et validés par des médecins. Ces documents constituent une ressource stratégique pour entraîner et évaluer des outils d’intelligence artificielle au service des professionnels de santé.

Le développement d’outils d’IA appliqués aux comptes rendus médicaux s’inscrit dans un cadre fortement structurant et protecteur. La réglementation encadre strictement l’accès aux données cliniques, afin d’en garantir l’usage sécurisé, tout en limitant la disponibilité de corpus ouverts et de jeux d’évaluation pour les modèles. Par ailleurs, les systèmes entraînés sur des données cliniques réelles peuvent mémoriser des informations issues de leurs jeux d’entraînement, ce qui rend les modèles eux‑mêmes sensibles et complique leur partage, contribuant à un écosystème fragmenté.

Pour dépasser ces contraintes, un appel a été lancé auprès des associations d’internes et des centres hospitalo‑universitaires partenaires dans le cadre de PARTAGES, démarré en avril 2025. Il a permis de constituer un panel de 120 médecins représentatif de la diversité des spécialités médicales et des territoires, chargé de rédiger un corpus de comptes rendus de patients fictifs. Ce travail collectif aboutit aujourd’hui à un corpus de plus de 6 000 comptes rendus médicaux fictifs, rédigés par ces praticiens à partir de situations cliniques entièrement imaginées. Aucune donnée issue de patients réels n’y figure, ce qui permet un usage libre, sans contrainte réglementaire, tout en conservant un haut niveau de réalisme et de pertinence clinique.

Par son ampleur et la rigueur de sa méthodologie, ce corpus constitue une ressource inédite en France pour l’entraînement, l’évaluation et la comparaison de modèles d’IA au service de l’innovation et des professionnels de santé. Sa publication a été officiellement annoncée le 25 mars lors du comité stratégique de mi‑parcours du projet PARTAGES. Ce livrable résulte d’un travail conjoint de la Plateforme des données de santé et de plusieurs partenaires du projet, dont l’AP‑HP, le LISN et le LIMICS, et fait l’objet d’une publication scientifique : « PARHAF, a human-authored corpus of clinical reports for fictitious patients in French ».

PARTAGES : un projet national au service des communs numériques

Lauréat de l’appel à projets « Communs numériques pour l’intelligence artificielle générative », PARTAGES bénéficie d’un soutien de l’État dans le cadre du plan France 2030 opéré par Bpifrance. Doté d’un budget total de 9,4 millions d’euros sur deux ans (2025‑2027), le projet rassemble un consortium inédit de 32 partenaires : équipes de recherche, groupements d’établissements de santé publics et privés, acteurs deeptech spécialisés en IA. Son ambition est de structurer des ressources ouvertes pour favoriser l’émergence de solutions d’IA générative en santé, au bénéfice des écosystèmes académique, hospitalier et industriel.

Au‑delà du corpus de comptes rendus médicaux fictifs, PARTAGES met à disposition plusieurs autres livrables :

  • un guide méthodologique encadrant la production et la relecture des comptes rendus ;

  • des sous‑ensembles annotés du corpus ;

  • quatre guides d’annotation dédiés aux cas d’usage du projet ;

  • un corpus de données médicales ouvertes (articles scientifiques, notices de médicaments, cas cliniques) utilisé pour l’entraînement de modèles de fondation.

Cap sur 2027 : modèles spécialisés et évaluation en conditions réelles

D’ici 2027, le consortium PARTAGES développera sept modèles d’IA spécialisés pour des cas d’usage à fort impact : codage des informations médicales, résumé automatique de comptes rendus, détection automatique en infectiologie, analyse de la réponse aux traitements en oncologie, entre autres. Les premiers modèles entraînés, ainsi que leurs protocoles d’évaluation, seront prochainement publiés sur le site de la Plateforme des données de santé. En parallèle, une plateforme nationale d’évaluation fédérée est en cours de développement. Déployée dans 20 hôpitaux et entrepôts de données de santé hospitaliers, elle permettra d’évaluer des algorithmes sur des données réelles dans un cadre réglementaire sécurisé.


Source : communiqué de presse « Publication d’un corpus inédit de comptes-rendus médicaux de patients fictifs en open data pour accélérer l’IA en santé », Plateforme des données de santé (Health Data Hub), 25 mars 2026.

Avez-vous apprécié ce contenu ?

A lire également.

Illustration ZenIA, l’IA utile qui transforme les processus hospitaliers

ZenIA, l’IA utile qui transforme les processus hospitaliers

05 mai 2026 - 07:53,

Tribune

- Zenidoc

Dans la santé, l’enjeu n’est plus seulement d’accéder à des modèles performants, mais de les intégrer aux usages réels. Avec ZenIA, Zenidoc défend une IA concrète, souveraine et opérationnelle, capable d’agir sur les processus hospitaliers, de la préparation de l’information à sa diffusion dans le d...

Illustration Soigner mieux, cliquer moins : l’utilité clinique comme boussole du numérique en santé

Soigner mieux, cliquer moins : l’utilité clinique comme boussole du numérique en santé

04 mai 2026 - 15:15,

Tribune

- Par Amel Mokrani Bois, Directrice générale de Dedalus France

Le système de santé français change de rythme. L’accélération des usages, l’explosion des volumes de données, les tensions démographiques et budgétaires imposent de transformer en profondeur nos organisations. Dans ce contexte, prendre la direction de Dedalus France aujourd’hui, c’est assumer pleine...

Illustration Speech Processing Solutions dévoile Philips SpeechLive Health, un nouvel assistant IA conçu pour la documentation clinique moderne

Speech Processing Solutions dévoile Philips SpeechLive Health, un nouvel assistant IA conçu pour la documentation clinique moderne

25 mars 2026 - 14:46,

Communiqué

- Speech Processing Solutions

Speech Processing Solutions, leader mondial des solutions professionnelles de dictée et de traitement de la parole commercialisées sous la marque Philips, annonce le lancement de Philips SpeechLive Health, un assistant de documentation clinique basé sur l’IA conçu pour les professionnels de santé. C...

Illustration Dernières actualités juridiques en matière d’IA

Dernières actualités juridiques en matière d’IA

31 mars 2026 - 08:26,

Tribune

-
Marguerite Brac de La Perrière

Adopté le 13 juin 2024, le Règlement européen sur l'intelligence artificielle (RIA) vise à garantir que les systèmes d'intelligence artificielle commercialisés ou utilisés dans l'Union européenne respectent les droits fondamentaux des citoyens, tout en favorisant l'innovation.

Lettre d'information.

Ne manquez rien de la e-santé et des systèmes d’informations hospitaliers !

Inscrivez-vous à notre lettre d’information hebdomadaire.