Publicité en cours de chargement...
Publication d’un corpus inédit de comptes rendus médicaux fictifs en open data pour accélérer l’IA en santé

Le développement d’outils d’IA appliqués aux comptes rendus médicaux s’inscrit dans un cadre fortement structurant et protecteur. La réglementation encadre strictement l’accès aux données cliniques, afin d’en garantir l’usage sécurisé, tout en limitant la disponibilité de corpus ouverts et de jeux d’évaluation pour les modèles. Par ailleurs, les systèmes entraînés sur des données cliniques réelles peuvent mémoriser des informations issues de leurs jeux d’entraînement, ce qui rend les modèles eux‑mêmes sensibles et complique leur partage, contribuant à un écosystème fragmenté.
Pour dépasser ces contraintes, un appel a été lancé auprès des associations d’internes et des centres hospitalo‑universitaires partenaires dans le cadre de PARTAGES, démarré en avril 2025. Il a permis de constituer un panel de 120 médecins représentatif de la diversité des spécialités médicales et des territoires, chargé de rédiger un corpus de comptes rendus de patients fictifs. Ce travail collectif aboutit aujourd’hui à un corpus de plus de 6 000 comptes rendus médicaux fictifs, rédigés par ces praticiens à partir de situations cliniques entièrement imaginées. Aucune donnée issue de patients réels n’y figure, ce qui permet un usage libre, sans contrainte réglementaire, tout en conservant un haut niveau de réalisme et de pertinence clinique.
Par son ampleur et la rigueur de sa méthodologie, ce corpus constitue une ressource inédite en France pour l’entraînement, l’évaluation et la comparaison de modèles d’IA au service de l’innovation et des professionnels de santé. Sa publication a été officiellement annoncée le 25 mars lors du comité stratégique de mi‑parcours du projet PARTAGES. Ce livrable résulte d’un travail conjoint de la Plateforme des données de santé et de plusieurs partenaires du projet, dont l’AP‑HP, le LISN et le LIMICS, et fait l’objet d’une publication scientifique : « PARHAF, a human-authored corpus of clinical reports for fictitious patients in French ».
PARTAGES : un projet national au service des communs numériques
Lauréat de l’appel à projets « Communs numériques pour l’intelligence artificielle générative », PARTAGES bénéficie d’un soutien de l’État dans le cadre du plan France 2030 opéré par Bpifrance. Doté d’un budget total de 9,4 millions d’euros sur deux ans (2025‑2027), le projet rassemble un consortium inédit de 32 partenaires : équipes de recherche, groupements d’établissements de santé publics et privés, acteurs deeptech spécialisés en IA. Son ambition est de structurer des ressources ouvertes pour favoriser l’émergence de solutions d’IA générative en santé, au bénéfice des écosystèmes académique, hospitalier et industriel.
Au‑delà du corpus de comptes rendus médicaux fictifs, PARTAGES met à disposition plusieurs autres livrables :
-
un guide méthodologique encadrant la production et la relecture des comptes rendus ;
-
des sous‑ensembles annotés du corpus ;
-
quatre guides d’annotation dédiés aux cas d’usage du projet ;
-
un corpus de données médicales ouvertes (articles scientifiques, notices de médicaments, cas cliniques) utilisé pour l’entraînement de modèles de fondation.
Cap sur 2027 : modèles spécialisés et évaluation en conditions réelles
D’ici 2027, le consortium PARTAGES développera sept modèles d’IA spécialisés pour des cas d’usage à fort impact : codage des informations médicales, résumé automatique de comptes rendus, détection automatique en infectiologie, analyse de la réponse aux traitements en oncologie, entre autres. Les premiers modèles entraînés, ainsi que leurs protocoles d’évaluation, seront prochainement publiés sur le site de la Plateforme des données de santé. En parallèle, une plateforme nationale d’évaluation fédérée est en cours de développement. Déployée dans 20 hôpitaux et entrepôts de données de santé hospitaliers, elle permettra d’évaluer des algorithmes sur des données réelles dans un cadre réglementaire sécurisé.
Source : communiqué de presse « Publication d’un corpus inédit de comptes-rendus médicaux de patients fictifs en open data pour accélérer l’IA en santé », Plateforme des données de santé (Health Data Hub), 25 mars 2026.
Avez-vous apprécié ce contenu ?
A lire également.

Fuite de données chez CEGEDIM – la question des zones à commentaire
02 mars 2026 - 20:10,
Tribune
-Les données de 15 millions[1] de Français auraient été piratées lors d’une attaque survenue il y a plus de deux mois au sein de la société CEGEDIM et de logiciels utilisés par des médecins libéraux. Les grands médias (Le Monde, France Info) en ont fait état, et fait rarissime, même la ministre de la...

IA en régulation d'urgence : 7 questions à poser avant tout déploiement
15 déc. 2025 - 11:32,
Tribune
-Entre promesses d'innovation et exigences opérationnelles, comment les établissements peuvent sécuriser leurs investissements IA en environnement critique.

Adopt AI 2025 : la santé passe à l’échelle, sous le regard du terrain hospitalier
01 déc. 2025 - 11:56,
Actualité
- Morgan Bourven, DSIHL’Adopt AI International Summit 2025 s’est tenu les 25 et 26 novembre dans le cadre prestigieux du Grand Palais. Artefact y a accueilli près de 20 000 participants, 600 intervenants et 250 exposants, avec un moment fort : la venue du président Emmanuel Macron. Pensé comme un lieu où les idées se tra...
Le moment Spoutnik de la cyber
24 nov. 2025 - 22:22,
Tribune
-En matière d’armement, on dit que ce qui compte vraiment, c’est le nombre et la force. Mais surtout la force.
